Qué es el aprendizaje automático (ML)?

El aprendizaje automático (ML) es un tipo de inteligencia artificial (IA) que permite que las aplicaciones de software sean más precisas a la hora de predecir resultados sin estar explícitamente programadas para ello. Los algoritmos de aprendizaje automático utilizan datos históricos como entrada para predecir nuevos valores de salida.

Los motores de recomendación son un caso de uso común para el aprendizaje automático. Otros usos populares son la detección de fraudes, el filtrado de spam, la detección de amenazas de malware, la automatización de procesos de negocio (BPA) y el mantenimiento predictivo.

Tipos de aprendizaje automático
Cómo funciona el aprendizaje automático supervisado
Cómo funciona el aprendizaje automático no supervisado
Cómo funciona el aprendizaje semisupervisado
Cómo funciona el aprendizaje por refuerzo
Usos del aprendizaje automático
Ventajas y desventajas
Elegir el modelo de aprendizaje automático adecuado
Importancia del aprendizaje automático interpretable por humanos
El futuro del aprendizaje automático
Historia del aprendizaje automático

Tipos de aprendizaje automático

El aprendizaje automático clásico se suele clasificar según la forma en que un algoritmo aprende a ser más preciso en sus predicciones. Hay cuatro enfoques básicos: el aprendizaje supervisado, el aprendizaje no supervisado, el aprendizaje semisupervisado y el aprendizaje por refuerzo. El tipo de algoritmo que un científico de datos elige utilizar depende del tipo de datos que quiere predecir.

Aprendizaje supervisado. En este tipo de aprendizaje automático, los científicos de datos suministran a los algoritmos datos de entrenamiento etiquetados y definen las variables que quieren que el algoritmo evalúe en busca de correlaciones. Se especifica tanto la entrada como la salida del algoritmo.
Aprendizaje no supervisado. Este tipo de aprendizaje automático implica algoritmos que se entrenan con datos no etiquetados. El algoritmo explora los conjuntos de datos en busca de cualquier conexión significativa. Tanto los datos en los que se entrenan los algoritmos como las predicciones o recomendaciones que emiten están predeterminados.
Aprendizaje semi-supervisado. Este enfoque del aprendizaje automático implica una mezcla de los dos tipos anteriores. Los científicos de datos pueden alimentar un algoritmo con datos de entrenamiento mayormente etiquetados, pero el modelo es libre de explorar los datos por sí mismo y desarrollar su propia comprensión del conjunto de datos.
Aprendizaje por refuerzo. El aprendizaje por refuerzo se utiliza normalmente para enseñar a una máquina a completar un proceso de varios pasos para el que hay reglas claramente definidas. Los científicos de datos programan un algoritmo para completar una tarea y le dan señales positivas o negativas a medida que resuelve cómo completar una tarea. Pero en su mayor parte, el algoritmo decide por sí mismo qué pasos dar a lo largo del camino.

Cómo funciona el aprendizaje automático supervisado

El aprendizaje automático supervisado requiere que el científico de datos entrene el algoritmo con entradas etiquetadas y salidas deseadas. Los algoritmos de aprendizaje supervisado son buenos para las siguientes tareas:

Clasificación binaria. Dividir los datos en dos categorías.
Clasificación multiclase. Elegir entre más de dos tipos de respuestas.
Modelado de regresión. Predicción de valores continuos.
Ensamblaje. Combinar las predicciones de múltiples modelos de aprendizaje automático para producir una predicción precisa.

Cómo funciona el aprendizaje automático no supervisado

Los algoritmos de aprendizaje automático no supervisado no requieren que los datos estén etiquetados. Tamizan los datos sin etiquetar para buscar patrones que puedan utilizarse para agrupar los puntos de datos en subconjuntos. La mayoría de los tipos de aprendizaje profundo, incluidas las redes neuronales, son algoritmos no supervisados. Los algoritmos de aprendizaje no supervisado son buenos para las siguientes tareas:

Agrupación. Dividir el conjunto de datos en grupos basados en la similitud.
Detección de anomalías. Identificar puntos de datos inusuales en un conjunto de datos.
Minería de asociación. Identificación de conjuntos de elementos en un conjunto de datos que aparecen juntos con frecuencia.
Reducción de la dimensionalidad. Reducción del número de variables en un conjunto de datos.

Cómo funciona el aprendizaje semisupervisado

El aprendizaje semisupervisado funciona cuando los científicos de datos alimentan una pequeña cantidad de datos de entrenamiento etiquetados a un algoritmo. A partir de esto, el algoritmo aprende las dimensiones del conjunto de datos, que luego puede aplicar a nuevos datos no etiquetados. El rendimiento de los algoritmos suele mejorar cuando se entrenan con conjuntos de datos etiquetados. Pero etiquetar los datos puede llevar mucho tiempo y ser costoso. El aprendizaje semisupervisado se sitúa en un punto intermedio entre el rendimiento del aprendizaje supervisado y la eficacia del aprendizaje no supervisado. Algunas áreas en las que se utiliza el aprendizaje semisupervisado son:

Traducción automática. Enseñar algoritmos para traducir el lenguaje basándose en menos de un diccionario completo de palabras.
Detección de fraude. Identificar casos de fraude cuando sólo se tienen unos pocos ejemplos positivos.
Etiquetar datos. Los algoritmos entrenados en pequeños conjuntos de datos pueden aprender a aplicar etiquetas de datos a conjuntos más grandes de forma automática.

Cómo funciona el aprendizaje por refuerzo

El aprendizaje por refuerzo funciona programando un algoritmo con un objetivo distinto y un conjunto prescrito de reglas para lograr ese objetivo. Los científicos de datos también programan el algoritmo para que busque recompensas positivas -que recibe cuando realiza una acción que es beneficiosa para el objetivo final- y evite castigos -que recibe cuando realiza una acción que lo aleja de su objetivo final-. El aprendizaje por refuerzo se utiliza a menudo en áreas como:

Robótica. Los robots pueden aprender a realizar tareas en el mundo físico utilizando esta técnica.
Videojuegos. El aprendizaje por refuerzo se ha utilizado para enseñar a los robots a jugar a una serie de videojuegos.
Gestión de recursos. Dados unos recursos finitos y un objetivo definido, el aprendizaje por refuerzo puede ayudar a las empresas a planificar cómo asignar los recursos.

El aprendizaje automático es como la estadística con esteroides.

Usos del aprendizaje automático

Hoy en día, el aprendizaje automático se utiliza en una amplia gama de aplicaciones. Quizás uno de los ejemplos más conocidos de aprendizaje automático en acción es el motor de recomendación que impulsa el News Feed de Facebook.

Facebook utiliza el aprendizaje automático para personalizar la forma en que se entrega el feed de cada miembro. Si un miembro se detiene con frecuencia a leer las publicaciones de un grupo en particular, el motor de recomendaciones empezará a mostrar más actividad de ese grupo antes en el feed.

En el fondo, el motor está tratando de reforzar los patrones conocidos en el comportamiento online del miembro. En caso de que el miembro cambie sus patrones y no lea las publicaciones de ese grupo en las próximas semanas, el News Feed se ajustará en consecuencia.

Además de los motores de recomendación, otros usos del aprendizaje automático son los siguientes:

Gestión de las relaciones con los clientes: el software de CRM puede utilizar modelos de aprendizaje automático para analizar el correo electrónico e indicar a los miembros del equipo de ventas que respondan primero a los mensajes más importantes. Los sistemas más avanzados pueden incluso recomendar respuestas potencialmente eficaces.

Inteligencia empresarial: los proveedores de BI y análisis utilizan el aprendizaje automático en su software para identificar puntos de datos potencialmente importantes, patrones de puntos de datos y anomalías.

Sistemas de información de recursos humanos: los sistemas HRIS pueden utilizar modelos de aprendizaje automático para filtrar las solicitudes e identificar los mejores candidatos para un puesto vacante.

Autos de autoconducción — Los algoritmos de aprendizaje automático pueden incluso hacer posible que un coche semiautónomo reconozca un objeto parcialmente visible y alerte al conductor.

Asistentes virtuales — Los asistentes inteligentes suelen combinar modelos de aprendizaje automático supervisados y no supervisados para interpretar el habla natural y suministrar el contexto.

Ventajas y desventajas

El aprendizaje automático ha visto potentes casos de uso que van desde la predicción del comportamiento de los clientes hasta constituir el sistema operativo de los coches de autoconducción. Pero el hecho de que algunas industrias hayan visto beneficios no significa que el aprendizaje automático esté exento de desventajas.

Cuando se trata de ventajas, el aprendizaje automático puede ayudar a las empresas a entender a sus clientes a un nivel más profundo. Al recopilar datos de los clientes y correlacionarlos con comportamientos a lo largo del tiempo, los algoritmos de aprendizaje automático pueden aprender asociaciones y ayudar a los equipos a adaptar el desarrollo de productos y las iniciativas de marketing a la demanda de los clientes.

Algunas empresas de Internet utilizan el aprendizaje automático como motor principal de sus modelos de negocio. Uber, por ejemplo, utiliza algoritmos para emparejar a los conductores con los pasajeros. Google utiliza el aprendizaje automático para hacer aparecer los anuncios adecuados en las búsquedas.

Pero el aprendizaje automático tiene desventajas. La primera y más importante es que puede ser caro. Los proyectos de aprendizaje automático suelen estar dirigidos por científicos de datos, que cobran sueldos elevados. Estos proyectos también requieren una infraestructura de software que puede ser de alto coste.

También existe el problema del sesgo del aprendizaje automático. Los algoritmos que se entrenan en conjuntos de datos que excluyen a ciertas poblaciones o contienen errores pueden conducir a modelos inexactos del mundo que, en el mejor de los casos, fallan y, en el peor, son discriminatorios. Cuando una empresa basa sus procesos de negocio principales en modelos sesgados, puede toparse con daños normativos y de reputación.

Elegir el modelo de aprendizaje automático adecuado

El proceso de elección del modelo de aprendizaje automático adecuado para resolver un problema puede llevar mucho tiempo si no se aborda de forma estratégica.

Paso 1: Alinear el problema con las posibles entradas de datos que deben considerarse para la solución. Este paso requiere la ayuda de científicos de datos y expertos que tengan un profundo conocimiento del problema.

Paso 2: Recoger los datos, formatearlos y etiquetarlos si es necesario. Este paso lo suelen llevar a cabo los científicos de datos, con ayuda de los encargados de la gestión de datos.

Paso 3: Elegir qué algoritmo(s) utilizar y probar para ver su rendimiento. Este paso lo suelen llevar a cabo los científicos de datos.

Paso 4: Seguir afinando los resultados hasta que alcancen un nivel de precisión aceptable. Este paso lo suelen llevar a cabo los científicos de datos con la retroalimentación de los expertos que tienen un profundo conocimiento del problema.

Importancia del aprendizaje automático interpretable por humanos

Explicar cómo funciona un modelo específico de ML puede ser un reto cuando el modelo es complejo. Hay algunas industrias verticales en las que los científicos de datos tienen que utilizar modelos de aprendizaje automático simples porque es importante para el negocio explicar cómo se tomaron todas y cada una de las decisiones. Esto es especialmente cierto en industrias con fuertes cargas de cumplimiento como la banca y los seguros.

Los modelos complejos pueden hacer predicciones precisas, pero explicar a un profano cómo se determinó un resultado puede ser difícil.

El futuro del aprendizaje automático

Aunque los algoritmos de aprendizaje automático existen desde hace décadas, han alcanzado una nueva popularidad a medida que la inteligencia artificial (IA) ha crecido en importancia. Los modelos de aprendizaje profundo, en particular, impulsan las aplicaciones de IA más avanzadas de hoy en día.

Las plataformas de aprendizaje automático se encuentran entre los ámbitos más competitivos de la tecnología empresarial, con la mayoría de los principales proveedores, incluidos Amazon, Google, Microsoft, IBM y otros, compitiendo por contratar a los clientes para los servicios de plataforma que cubren el espectro de las actividades de aprendizaje automático, incluida la recopilación de datos, la preparación de datos, la clasificación de datos, la creación de modelos, la formación y el despliegue de aplicaciones.

A medida que el aprendizaje automático sigue aumentando su importancia para las operaciones empresariales y la IA se vuelve cada vez más práctica en los entornos de las empresas, la guerra de las plataformas de aprendizaje automático no hará más que intensificarse.

El aprendizaje profundo funciona de forma muy diferente al aprendizaje automático tradicional.

La investigación continua sobre el aprendizaje profundo y la IA se centra cada vez más en el desarrollo de aplicaciones más generales. Los modelos de IA actuales requieren un amplio entrenamiento para producir un algoritmo altamente optimizado para realizar una tarea. Pero algunos investigadores están explorando formas de hacer que los modelos sean más flexibles y están buscando técnicas que permitan a una máquina aplicar el contexto aprendido de una tarea a futuras tareas diferentes.

Historia del aprendizaje automático

1642 – Blaise Pascal inventa una máquina mecánica que puede sumar, restar, multiplicar y dividir.

1679 – Gottfried Wilhelm Leibniz concibe el sistema de código binario.

1834 – Charles Babbage concibe la idea de un dispositivo general de uso general que pudiera programarse con tarjetas perforadas.

1842 – Ada Lovelace describe una secuencia de operaciones para resolver problemas matemáticos utilizando la máquina teórica de tarjetas perforadas de Charles Babbage y se convierte en la primera programadora.

1847 – George Boole crea la lógica booleana, una forma de álgebra en la que todos los valores pueden reducirse a los valores binarios de verdadero o falso.

1936 – El lógico y criptoanalista inglés Alan Turing propone una máquina universal que podría descifrar y ejecutar un conjunto de instrucciones. Su prueba publicada se considera la base de la informática.

1952 – Arthur Samuel crea un programa para ayudar a un ordenador IBM a mejorar en las damas cuanto más juegue.

1959 – MADALINE se convierte en la primera red neuronal artificial aplicada a un problema del mundo real: eliminar el eco de las líneas telefónicas.

1985 – La red neuronal artificial de Terry Sejnowski y Charles Rosenberg se enseñó a sí misma a pronunciar correctamente 20.000 palabras en una semana.

1997 – Deep Blue de IBM venció al gran maestro de ajedrez Garry Kasparov.

1999 – Un prototipo de estación de trabajo inteligente CAD revisó 22.000 mamografías y detectó el cáncer con un 52% más de precisión que los radiólogos.

2006 – El informático Geoffrey Hinton inventa el término aprendizaje profundo para describir la investigación en redes neuronales.

2012 – Una red neuronal no supervisada creada por Google aprendió a reconocer gatos en vídeos de YouTube con una precisión del 74,8%.

2014 – Un chatbot supera el Test de Turing al convencer al 33% de los jueces humanos de que era un adolescente ucraniano llamado Eugene Goostman.

2014 – Google’s AlphaGo defeats the human champion in Go, the most difficult board game in the world.

2016 – LipNet, DeepMind’s artificial-intelligence system, identifies lip-read words in video with an accuracy of 93.4%.

2019 – Amazon controls 70% of the market share for virtual assistants in the U.S.

Aprendizaje automático