El aprendizaje automático es un subconjunto de la inteligencia artificial centrado en la creación de sistemas que puedan aprender de datos históricos, identificar patrones y tomar decisiones lógicas con poca o ninguna intervención humana. Es un método de análisis de datos que automatiza la construcción de modelos analíticos mediante el uso de datos que abarcan diversas formas de información digital, incluidos números, palabras, clics e imágenes.
Las aplicaciones de aprendizaje automático aprenden de los datos de entrada y mejoran continuamente la precisión de los resultados mediante métodos de optimización automatizados. La calidad de un modelo de aprendizaje automático depende de dos aspectos principales:
Cuanto mejor sea el modelo de aprendizaje automático, con mayor precisión podrá encontrar características y patrones en los datos. Eso, a su vez, implica que sus decisiones y predicciones serán más precisas.
Protección sin precedentes que combina el aprendizaje automático y la seguridad de los puntos finales junto con la caza de amenazas de categoría mundial como servicio.
Más información¿Por qué utilizar el aprendizaje automático? El aprendizaje automático está cobrando cada vez más importancia debido a los volúmenes y la variedad de datos cada vez más enormes, el acceso y la asequibilidad de la potencia de cálculo y la disponibilidad de Internet de alta velocidad. Estos factores de transformación digital permiten desarrollar de forma rápida y automática modelos capaces de analizar con rapidez y precisión conjuntos de datos extraordinariamente grandes y complejos.
Hay multitud de casos de uso a los que puede aplicarse el aprendizaje automático para reducir costes, mitigar riesgos y mejorar la calidad de vida en general, como la recomendación de productos y servicios, la detección de fallos de ciberseguridad y la conducción autónoma de automóviles. Con un mayor acceso a los datos y a la potencia de cálculo, el aprendizaje automático se está haciendo cada día más omnipresente y pronto se integrará en muchas facetas de la vida humana.
Para crear un modelo de aprendizaje automático hay que seguir cuatro pasos fundamentales.
Los datos de entrenamiento son información representativa de los datos que la aplicación de aprendizaje automático ingiere para ajustar los parámetros del modelo. A veces, los datos de entrenamiento están etiquetados, lo que significa que han sido etiquetados para indicar clasificaciones o valores esperados que el modo de aprendizaje automático debe predecir. Otros datos de entrenamiento pueden no estar etiquetados, por lo que el modelo tendrá que extraer características y asignar clusters de forma autónoma.
Para etiquetarlos, los datos deben dividirse en un subconjunto de entrenamiento y otro de prueba. El primero se utiliza para entrenar el modelo y el segundo para evaluar la eficacia del modelo y encontrar formas de mejorarlo.
El tipo de algoritmo de aprendizaje automático que elija dependerá principalmente de algunos aspectos:
Para casos de predicción o clasificación, se suelen utilizar algoritmos de regresión como la regresión por mínimos cuadrados ordinarios o la regresión logística. Con datos no etiquetados, es probable que utilice algoritmos de agrupación como k-means o el vecino más cercano. Algunos algoritmos, como las redes neuronales, pueden configurarse para trabajar tanto con casos de uso de agrupación como de predicción.
El entrenamiento del algoritmo es el proceso de ajuste de las variables y parámetros del modelo para predecir con mayor precisión los resultados adecuados. El entrenamiento del algoritmo de aprendizaje automático suele ser iterativo y utiliza diversos métodos de optimización en función del modelo elegido. Estos métodos de optimización no requieren intervención humana, lo que forma parte de la potencia del aprendizaje automático. La máquina aprende a partir de los datos que se le facilitan sin apenas instrucciones específicas por parte del usuario.
El último paso consiste en introducir nuevos datos en el modelo para mejorar su eficacia y precisión con el paso del tiempo. La procedencia de la nueva información depende de la naturaleza del problema a resolver. Por ejemplo, un modelo de aprendizaje automático para coches autoconducidos ingiere información del mundo real sobre las condiciones de la carretera, los objetos y las leyes de tráfico.
Qué es el aprendizaje automático supervisado
Los algoritmos de aprendizaje automático supervisado utilizan datos etiquetados como datos de entrenamiento en los que se conocen las salidas adecuadas para los datos de entrada. El algoritmo de aprendizaje automático recibe un conjunto de entradas y sus correspondientes salidas correctas. El algoritmo compara sus propias salidas previstas con las salidas correctas para calcular la precisión del modelo y, a continuación, optimiza los parámetros del modelo para mejorar la precisión.
El aprendizaje automático supervisado se basa en patrones para predecir valores en datos no etiquetados. Se utiliza sobre todo en automatización, en grandes cantidades de registros de datos o en casos en los que hay demasiados datos para que los humanos los procesen con eficacia. Por ejemplo, el algoritmo puede detectar transacciones con tarjeta de crédito que probablemente sean fraudulentas o identificar al cliente de seguros que con mayor probabilidad presentará una reclamación.
Qué es el aprendizaje automático no supervisado
El aprendizaje automático no supervisado se aplica mejor a datos que no tienen una respuesta estructurada u objetiva. No existe una predeterminación de la salida correcta para una entrada dada. En su lugar, el algoritmo debe comprender la entrada y tomar la decisión adecuada. El objetivo es examinar la información e identificar estructuras en ella.
El aprendizaje automático no supervisado funciona bien con información transaccional. Por ejemplo, el algoritmo puede identificar segmentos de clientes que poseen atributos similares. Los clientes de estos segmentos pueden ser objeto de campañas de marketing similares. Entre las técnicas más utilizadas en el aprendizaje no supervisado se encuentran el mapeo del vecino más cercano, los mapas autoorganizados, la descomposición del valor singular y la agrupación de k-means. Los algoritmos se utilizan posteriormente para segmentar temas, identificar valores atípicos y recomendar artículos.
Aspecto |
Aprendizaje supervisado |
Aprendizaje no supervisado |
Proceso |
Se proporcionan variables de entrada y salida para entrenar el modelo. |
Sólo se proporcionan datos de entrada para entrenar el modelo. No se utilizan datos de salida. |
Datos de entrada |
Utiliza datos etiquetados. |
Utiliza datos no etiquetados. |
Algoritmos admitidos |
Admite algoritmos de regresión, algoritmos basados en instancias, algoritmos de clasificación, redes neuronales y árboles de decisión. |
Admite algoritmos de agrupación, algoritmos de asociación y redes neuronales. |
Complejidad |
Más sencillo. |
Más complejo. |
Subjetividad |
Objetivo. |
Subjetivo. |
Número de clases |
Se conoce el número de clases. |
Se desconoce el número de clases. |
Principal inconveniente |
Clasificar datos masivos con aprendizaje supervisado es difícil. |
La elección del número de grupos puede ser subjetiva. |
Objetivo principal |
Entrenar el modelo para predecir el resultado cuando se le presentan nuevas entradas. |
Encuentre ideas útiles y patrones ocultos. |
Aunque la funcionalidad del aprendizaje automático existe desde hace décadas, es la capacidad más reciente de aplicar y calcular automáticamente cálculos matemáticos complejos con grandes volúmenes de datos lo que le ha dado una sofisticación sin precedentes. En la actualidad, el ámbito de aplicación del aprendizaje automático es muy amplio y abarca desde las operaciones de información empresarial hasta el comercio minorista en línea. Algunos ejemplos reales de las capacidades actuales del aprendizaje automático son los siguientes:
A medida que crecen los volúmenes de datos, aumenta la potencia de cálculo, se amplía el ancho de banda de Internet y los científicos de datos mejoran sus conocimientos, el aprendizaje automático seguirá impulsando una eficiencia mayor y más profunda en el trabajo y en casa.
Con las crecientes amenazas cibernéticas a las que se enfrentan las empresas hoy en día, el aprendizaje automático es necesario para proteger los datos valiosos y mantener a los hackers fuera de las redes internas. Nuestro principal software UEBA SecOps, ArcSight Intelligence , utiliza el aprendizaje automático para detectar anomalías que puedan indicar acciones maliciosas. Tiene un historial probado de detección de amenazas internas, ataques de día cero e incluso ataques agresivos de equipos rojos.
Detección proactiva de riesgos internos, nuevos ataques y amenazas persistentes avanzadas.
Acelere la detección y respuesta a las amenazas con detección en tiempo real y SOAR nativo.
Automatización de pruebas basada en IA
Interset aumenta la inteligencia humana con inteligencia artificial para reforzar su ciberresiliencia
Simplifique la gestión de registros y el cumplimiento de la normativa, al tiempo que acelera la investigación forense