Machine learning: ¿en qué consiste el aprendizaje automático?

La inteligencia artificial (IA) es un componente esencial en el proceso de digitalización que tanto está cambiando la sociedad en nuestra era. Lo que tiempo atrás parecía formar parte de una película de ciencia ficción ha ido materializándose en la realidad, de forma que hoy en día conversamos con ordenadores, podemos averiguar desde el móvil el camino más corto a una gasolinera y nuestros relojes nos informan de la actividad física que hemos realizado durante el día. La tecnología se vuelve cada día más inteligente, al mismo tiempo que los investigadores, programadores e informáticos adquieren el papel de profesores, pues intentan enseñar a los sistemas informáticos a aprender por ellos mismos.

El aprendizaje automático no solo adquiere importancia para los investigadores o las compañías de TI como Google o Microsoft, sino que también desempeña un papel muy importante en el marketing online, que va viéndose modificado con el avance de la IA. En este texto te aclaramos cómo se ha ido desarrollando la ya nombrada IA en los últimos años, qué se entiende por machine learning, los métodos existentes de este aprendizaje automático y los motivos que impulsan a los profesionales del marketing a apostar por los sistemas de autoaprendizaje.

La historia del machine learning

Desde hace siglos empezaron a gestarse en la mente de los seres humanos ideas relativas a los robots y los autómatas. Ya los escritores del romanticismo trataron el tema de la IA y, de hecho, a día de hoy aún nos siguen sorprendiendo los robots que aparecen en películas, libros y videojuegos, produciendo en nosotros un sentimiento que oscila entre el miedo y la fascinación. No obstante, no es hasta los años 50 del siglo pasado cuando realmente se comienzan a hacer realidad los procesos de aprendizaje automático en un momento en el que los ordenadores eran muy desconocidos y la IA formaba parte de la fantasía más que de la realidad. De hecho, aunque en los dos siglos anteriores teóricos como Thomas Bayes, Adrien-Marie Legendre y Pierre-Simon Laplace ya habían dado los primeros pasos sentando las bases de las investigaciones posteriores, no fue hasta el trabajo de Alan Turing cuando se materializó el proyecto de máquinas capaces de aprender.

Cita

“In such a case one would have to admit that the progress of the machine had not been foreseen when its original instructions were put in. It would be like a pupil who had learnt much from his master, but had added much more by his own work. When this happens I feel that one is obliged to regard the machine as showing intelligence.”

Alan Turing en una conferencia en 1947. (Cita de B. E. Carpenter and R. W. Doran (eds.), A. M. Turing's Ace Report of 1946 and Other Papers)

En 1950 Turing desarrolló el conocido Test de Turing, una especie de juego en el que una máquina finge ante un humano ser también uno de ellos. Esta máquina pasa la prueba en el momento en el que la persona interlocutora no sabe si de verdad está hablando con otra de carne y hueso. Hasta entonces nadie había llegado tan lejos, pero dos años más tarde Arthur Samuel desarrolló otra máquina capaz de jugar a las damas que, además, mejoraba con cada juego, es decir, el programa tenía la capacidad de aprender. Finalmente en 1957 Frank Rosenblatt desarrolló con el perceptrón una red neuronal artificial, esto es, el primer algoritmo que podía “aprender a aprender”. 

Desde este momento los investigadores han ido dando a las máquinas problemas de lógica cada vez más complejos que superaban unas veces mejor que otras. Entretanto las grandes empresas han contribuido a impulsar el aprendizaje automático. IBM desarrolló un sistema informático con una enorme base de datos, capaz de responder a preguntas formuladas en lenguaje natural. Se le denominó Watson y lo hicieron participar en “Jeopardy”, concurso de televisión estadounidense de gran audiencia, en el que Watson consiguió ganar. Este acontecimiento se asimila mucho a la competición de ajedrez de 1997 entre el campeón del mundo Garri Kasparow y otro ordenador de IBM, Deep Blue. También aquí ganó la máquina.

Google y Facebook también recurren al machine learning para poder conocer mejor a sus usuarios y ofrecerles una mayor variedad de funciones. Por ejemplo, DeepFace de Facebook es un programa de reconocimiento facial en imágenes con un grado de exactitud del 97 %. Al mismo tiempo Google ha mejorado claramente con Google Brain Project el reconocimiento de voz en los sistemas operativos de Android, la búsqueda de fotos con Google+ así como las recomendaciones de vídeos en YouTube.

¿Qué es machine learning?

En principio, las máquinas, los ordenadores y los programas funcionan solo de la manera en que previamente han sido programados, por ejemplo, si se establece la orden “en caso de A, haz B” los sistemas siempre responderán B a A. No obstante, nuestras expectativas para con los sistemas de computación modernos son cada vez mayores y los programadores no pueden prever todos los casos posibles y dictar una solución en consecuencia. Por ello es necesario que el software sea capaz de tomar decisiones por sí mismo y reaccione de forma apropiada a situaciones desconocidas, para lo que se requieren algoritmos que permitan al programa aprender, o lo que es lo mismo, que el programa sea dotado en un primer momento de datos para que este pueda entender un segundo patrón y establezca asociaciones.

En torno a los sistemas de aprendizaje autónomos surgen siempre términos relacionados que hay que comprender para tener una idea más clara de lo que significa machine learning.

Inteligencia artificial (IA)

Los proyectos en torno a la inteligencia artificial (IA) tienen como objetivo crear programas que puedan comportarse como si de personas se trataran. Por consiguiente, estos necesitan analizar el entorno para tomar la decisión más acertada, o como diríamos en lenguaje común, deben comportarse de manera inteligente. Además nos topamos con el problema de la denominación, más cuando ni siquiera estamos seguros de los criterios para calificar nuestra propia inteligencia, la inteligencia humana. En la actualidad la IA, o aquello que reciba esta designación, no puede imitar a la inteligencia del ser humano, en la que se incluye también la emocional. Por el contrario, se aíslan aspectos que llevan a cabo una tarea específica, lo que se conoce generalmente como “inteligencia artificial débil”.

Red neuronal

Una de las ramas de las investigaciones relativas a la inteligencia artificial es la neuroinformática, que intenta continuamente crear programas informáticos que se asimilen al cerebro humano, contemplando el sistema nervioso de forma abstracta, esto es, liberado de sus funciones biológicas y limitado únicamente a su funcionamiento. Bajo el término de red neuronal artificial no se hace referencia a una manifestación real, sino al conjunto de procesos matemáticos abstractos con los que se crea “una red de neuronas” (funciones matemáticas o algoritmos) que pueden resolver tareas complejas al igual que el cerebro humano. Las conexiones entre neuronas son de diferentes fortalezas y pueden adaptarse a los distintos problemas.

Big data

En principio, el término big data sirve para describir la incontable información de la que se dispone, sin que realmente exista un punto de inflexión entre lo que se considera data y lo que se estima como big data. El motivo de que en los últimos años haya crecido la atención de los medios con respecto a los macrodatos reside en su origen, ya que en muchos casos el flujo de información proviene de los propios datos de usuarios (intereses, perfiles de movimiento, datos personales, etc.). Esto permite a las empresas personalizar la oferta todo lo posible a los clientes al obtener esta información de Google, Amazon o Facebook. Además, los sistemas de computación tradicionales no son capaces de analizar correctamente este volumen de información, dado que el software tradicional solo encuentra lo que el usuario busca, motivo por el que se necesitan en primer lugar sistemas de aprendizaje autónomo que puedan encontrar relaciones previamente desconocidas.

Data mining

La minería de datos o data mining hace referencia al análisis del big data, ya que en sí la recopilación de información carece de valor y solo adquiere importancia cuando de ella se pueden extraer y analizar rasgos relevantes. Por eso, mientras el aprendizaje automático se ocupa principalmente de aplicar patrones conocidos, la minería de datos es la encargada de encontrar nuevos patrones.

Diferentes métodos de machine learning

Los programadores diferencian principalmente entre el aprendizaje supervisado y el no supervisado, cuyos algoritmos difieren en gran medida, aunque también se distinguen niveles intermedios graduales. En el aprendizaje supervisado (supervised learning) se surte de ejemplos al sistema y el programador establece qué valor recibe cada dato, por ejemplo, si este pertenece a la categoría A o B. A partir de entonces el sistema de autoaprendizaje saca conclusiones, reconoce patrones y, por consiguiente, puede lidiar mejor con los datos desconocidos, siempre con el objetivo de reducir progresivamente la tasa de error.

Un ejemplo conocido de aprendizaje supervisado es el filtro de spam. En función de las características que presente el mensaje recibido, el sistema decide si debe aparecer en la bandeja de entrada o si, por el contrario, se almacena directamente en la bandeja de correo no deseado. Si el sistema comete un error, el usuario puede reajustar las características manualmente de modo que el filtro adaptará sus cálculos en un futuro, permitiendo al software conseguir cada vez mejores resultados. Este tipo de programa de filtrado se basa en el teorema de Bayes, de la teoría de la probabilidad, y por consiguiente recibe el nombre de filtro de Bayes.

Por otro lado, en el aprendizaje no supervisado (unsupervised learning) se suprime la figura del “profesor” presente en el modelo supervisado y encargado de establecer relaciones así como de dar un feedback a las decisiones que el sistema toma de forma independiente. En lugar de ello, este programa intenta reconocer patrones por sí mismo para lo que recurre, entre otros, al análisis de grupos (clustering), consistente en seleccionar un elemento de todos los datos, analizar sus características y después compararlo con los elementos ya analizados. En caso de que ya se hayan estudiado elementos con los mismos valores, el objeto de estudio se añade a estos pero, si no es el caso, se almacena de forma aislada.

Los sistemas que se basan en el aprendizaje no supervisado se llevan a cabo, entre otros, en las redes neuronales. Se usan, por ejemplo, para garantizar la seguridad de la red, dado que pueden reconocer los comportamientos anormales. Así, si el sistema, al analizar un elemento (que supone un ciberataque) no es capaz de asociarlo con ninguno de los grupos conocidos, reconoce el riesgo que este elemento conlleva y hace saltar la alarma.

Pero como ya se ha indicado, junto a estos dos sistemas principales existen también otros niveles: aprendizaje semisupervisado (semi-supervised learning), aprendizaje por esfuerzo (reinforcement learning) y aprendizaje activo (active learning). Estos tres métodos pertenecen al aprendizaje supervisado y se diferencian en el tipo y volumen de participación del usuario.

Además, hay que diferenciar también entre el aprendizaje poco profundo (shallow learning) y profundo (deep learning). Mientras que el primero consiste en un método relativamente sencillo cuyos resultados suelen ser bastante superficiales, el aprendizaje profundo lleva consigo un volumen de datos más difíciles de interpretar, complejidad que reside en el origen de la información. Así, por ejemplo, los programas que se ocupan del reconocimiento facial, de voz o de escritura se basan en datos naturales, difíciles de entender desde un punto de vista matemático. Por eso, aunque en un principio resulten muy fáciles de procesar para los seres humanos, aumentan en dificultad cuando son las máquinas las que se encargan de la actividad. 

 

Existe también una relación estrecha entre los conceptos de deep learning y la red neuronal artificial, pues la forma en la que se entrenan las redes neuronales puede ser descrita como aprendizaje profundo. De hecho, recibe la denominación de profundo dado que la red de neuronas está ordenada en diferentes niveles jerárquicos. Se inicia en el primer nivel con una capa de neuronas de entrada que registran los datos, empiezan con el análisis y envían los resultados a las siguientes uniones neuronales. Finalmente esta información, que cada vez se va perfeccionando más, alcanza el nivel de salida y la red da un valor. Los numerosos niveles que se encuentran entre la entrada y la salida se denominan capas ocultas (hidden layers).


Un ejemplo que sirve para aclarar en qué consiste el aprendizaje profundo es la búsqueda de imágenes de Google. La red que respalda al algoritmo de búsqueda solo entrega a los usuarios fotos de, por ejemplo, gatos si son gatos lo que el usuario ha incluido en su búsqueda, gracias a que el sistema de aprendizaje automático de Google es capaz de reconocer objetos dentro de una imagen. De modo que cuando Google registra una nueva imagen en su catálogo, las neuronas de entrada del sistema empiezan a procesar los datos –teniendo en cuenta que en los sistemas de computación las fotos solo están formadas por cifras.

Durante el transcurso por los diferentes niveles, la red solo filtra la información que considera necesaria para poder decidir finalmente los objetos que componen la imagen, en este caso y siguiendo el ejemplo anterior, los gatos. En la fase de entrenamiento los programadores dan a cada imagen también una categoría para que el sistema pueda aprender, de modo que si la máquina no muestra los resultados esperados, es decir, si muestra una imagen con perros en vez de con gatos, los desarrolladores pueden adaptar estas neuronas individuales. Estas disponen, al igual que en nuestro cerebro, de diferentes baremos y umbrales que pueden ajustarse en el sistema de aprendizaje autónomo.

Machine learning: su papel en el marketing

En la actualidad, el aprendizaje automático desempeña importantes funciones en el ámbito del marketing, aunque por regla general las empresas hacen uso de esta avanzada tecnología internamente, especialmente en el caso de Google. De hecho, estos sistemas son tan nuevos que no se pueden adquirir como si de soluciones out of the box se trataran, listas para hacer uso de ellas, sino que son los grandes proveedores de Internet los que desarrollan sus propios sistemas, impulsando los avances en este campo. Esto, unido a que también existen soluciones de código abierto promovidas por investigadores independientes cuyo interés no se basa en el beneficio económico, lleva consigo un progreso cada vez mayor en esta área.

El marketing, además de por una parte creativa, está compuesto por aspectos analíticos. De hecho, las estadísticas sobre la conducta de los clientes (comportamiento de compra, número de visitas en una web, uso de determinadas apps, etc.) desempeñan un papel fundamental a la hora de decidir sobre determinadas campañas publicitarias. Por eso, cuanto mayor sea el volumen de datos del que se dispone, mayor es también la cantidad de información que se puede deducir de ellos. No obstante, para poder trabajar con tal maraña de datos se requieren programas informáticos, donde los sistemas de machine learning entran en acción, dado que estos programas de aprendizaje automático pueden reconocer patrones y en consecuencia hacer pronósticos bien fundamentados, actividad para la que las personas se ven limitadas, pues difícilmente pueden tratar datos de forma objetiva.

Por norma general, cuando un analista trabaja con los datos tiene ciertas expectativas sobre los valores, preferencias inevitables que a menudo conllevan la tergiversación de los resultados. De hecho, cuanto mayor sea el volumen de datos con los que los analistas trabajan, más se acentúan estas divergencias. No obstante, aunque las máquinas inteligentes también pueden tener ciertos prejuicios, dado que inconscientemente los seres humanos las programan con este rasgo, son más objetivas pues tratan con hechos estables, permitiendo que en la mayoría de los casos puedan realizar análisis relevantes.

Además, con estos sistemas de aprendizaje automático se mejora y facilita enormemente la presentación de los resultados de los análisis. La tecnología de visualización de datos automática (automated data visualization) sirve para que el programa seleccione por sí mismo la presentación adecuada de información y datos, especialmente importante al permitir a los analistas saber los pronósticos y descubrimientos realizados por la máquina, pues en el entramado de información les resulta muy difícil presentar los resultados de la medición por sí mismos. Esto explica por qué la visualización debe ejecutarse con los cálculos de la computadora.

El machine learning también tiene cabida en el área de presentación de contenido a través del diseño generativo. Con este sistema, en vez de establecer el mismo customer journey para todos los clientes, es decir, el mismo trayecto que los usuarios siguen hasta la adquisición de un producto o servicio, es posible individualizar cada experiencia. Esto quiere decir que, aunque el contenido que se muestra al usuario sigue siendo desarrollado por editores y diseñadores, es el sistema inteligente el que selecciona los componentes que presentar a un usuario concreto. Hoy estos sistemas se configuran incluso para que sean capaces de diseñar por ellos mismos, como es el caso de Dreamcatcher, que sirve para crear los componentes de una máquina.

Igualmente, los chatbots pueden también sacar partido de los programas de aprendizaje automático para mejorar su diseño. En la actualidad muchas empresas recurren a estos programas para que se encarguen de una parte de la atención al cliente, aunque en muchos casos la interacción con estos operadores virtuales enerva a los usuarios pues, al basarse en la información de bases de datos integradas manualmente, las capacidades de estas máquinas para comunicarse de forma natural son muy limitadas. Sin embargo, un chatbot que se base en un sistema de aprendizaje autónomo y tenga un buen sistema de reconocimiento de voz puede eliminar estas barreras. Asimismo, aprobaría también el test de Turing, es decir, daría a los clientes la sensación de que realmente hablan con una persona.

Las conocidas sugerencias de Amazon y Netflix han contribuido al desarrollo del machine learning, beneficiando en gran medida a los profesionales del marketing. Un factor importante en el éxito de estos proveedores se basa en la capacidad de sus programas de predecir lo que el usuario querrá en un futuro próximo, pues en función de los datos recopilados estos sistemas pueden recomendar a los usuarios otros productos relacionados. Lo que un principio se realizaba de una forma muy general (a nuestros clientes les gusta A, por lo que la mayoría también querrá B) tiene hoy un mayor grado de precisión gracias a estos programas inteligentes (el cliente X ha adquirido los productos A, B y C por lo que el producto D probablemente también le guste).

En resumen, se puede afirmar que los sistemas de aprendizaje automático pueden influir en cuatro puntos importantes en el marketing online:

  1. Volumen de información: aquellos programas que funcionan gracias al machine learning y han sido bien programados permiten analizar un volumen elevado de datos y ofrecer pronósticos fiables, de manera que los expertos en marketing pueden obtener conclusiones más exactas sobre el éxito o el fracaso de determinadas campañas y medidas de marketing.

  2. Velocidad: los análisis suponen una cantidad de tiempo considerable si se pretenden hacer a mano, por lo que el uso de un sistema de aprendizaje autónomo reducirá el tiempo de análisis, permitiendo al mismo tiempo reaccionar con mayor rapidez a los cambios.

  3. Automatización: con el aprendizaje automático resulta más fácil mecanizar procesos complejos y permite a los sistemas modernos adaptarse a las nuevas circunstancias de forma autónoma.

  4. Personalización: estos programas permiten aconsejar a un sinnúmero de clientes de forma individual, al recopilar y analizar los datos de cada cliente. Las recomendaciones individuales y los customer journeys personalizados permiten llevar a cabo un marketing mucho más efectivo.

 

 

 

Otros campos de aplicación para sistemas de machine learning

El marketing no es el único ámbito en el que la aplicación del aprendizaje automático crece progresivamente, sino que también tiene presencia en otros muchos campos: contribuye al progreso de la ciencia, apoya el avance de la tecnología, facilita el día a día gracias a los dispositivos electrónicos, etc. Estos son solo algunos ejemplos dentro de la gran variedad de ámbitos de actuación del machine learning, lo que nos hace suponer que en un futuro no tan lejano este tipo de sistemas inteligentes estará presente en todos los aspectos de nuestra vida.

Ciencia

En el ámbito de la ciencia el aprendizaje automático tiene una importancia igual o mayor que en el ámbito del marketing, dado que el procesamiento inteligente del big data facilita enormemente el trabajo de los investigadores, permitiendo, por ejemplo, a la física de partículas tomar un mayor volumen de valores de medición, procesarlos y de esta forma determinar las desviaciones. Pero también en medicina es de gran utilidad pues ya a día de hoy los médicos recurren a la inteligencia artificial para realizar diagnósticos y aplicar tratamientos, además de utilizar el aprendizaje automático para pronosticar diabetes o infartos.

Robótica

La omnipresencia de los robots es especialmente importante en las fábricas. Estos son necesarios en la producción en masa, ya que permiten automatizar diferentes procesos de trabajo, pero en general tienen poca relación con los sistemas de autoaprendizaje, pues se programan para realizar una actividad concreta de forma repetitiva y sin variaciones. Sin embargo, si el aprendizaje autónomo se introdujese en estos procesos, las máquinas podrían aprender a dominar otras tareas. Pero los robots que integran sistemas inteligentes también pueden ser útiles en otros muchos campos que abarcan desde la carrera espacial hasta el ámbito doméstico.

Tráfico

Uno de los grandes retos del machine learning es la conducción autónoma. Conseguir que los coches sean capaces de conducir por sí mismos y sin causar accidentes fuera de los circuitos de prueba puede hacerse realidad gracias a estos sistemas inteligentes. Como no es posible programar todas las situaciones, es importante dotar a los coches autónomos de sistemas de aprendizaje automático, pero no es la conducción autónoma el único campo en el que estos sistemas han dejado huella, dado que los algoritmos inteligentes en forma de redes neuronales pueden analizar el tráfico y desarrollar sistemas efectivos que, por ejemplo, regulen semáforos inteligentes, aliviando así el flujo de tráfico y evitando la formación de atascos.

Internet

En Internet este aprendizaje inteligente constituye una pieza muy importante. Anteriormente ya se ha nombrado el filtro de spam. Con un aprendizaje progresivo este programa filtra cada vez con mayor exactitud los mensajes no deseados y hace que el spam desaparezca de la bandeja de entrada. Lo mismo ocurre con los programas inteligentes que protegen a los sistemas de computación de virus y malwares cada vez con mayor efectividad. Los algoritmos de búsqueda de los buscadores, especialmente RankBrain de Google, también son sistemas de autoaprendizaje. Incluso cuando el algoritmo no sabe cómo lidiar con la búsqueda de un usuario porque es la primera vez que alguien la realiza, puede deducir sobre qué puede tratar su consulta.

Asistentes personales

En el ámbito privado del propio hogar la importancia de estos sistemas de computación cada vez más inteligentes va aumentando, transformando las viviendas tradicionales en casas inteligentes. Moley Robotics ha desarrollado, por ejemplo, una cocina inteligente que con sus brazos mecánicos puede preparar comidas. También los asistentes personales como Google Home y Amazon Echo, desde los que es posible dirigir la propia vivienda, recurren al machine learning para entender a los usuarios de la mejor forma posible. Asimismo, muchas personas transportan consigo asistentes, ya que Siri, Cortana y el asistente de Google permiten a los usuarios hacer preguntas o mandar órdenes al smartphone a través de comandos de voz.

Juegos

Desde el inicio de los estudios en torno a la inteligencia artificial llamó la atención de los investigadores la capacidad de estos programas para poder participar en juegos, lo que se ha demostrado en el ajedrez, las damas o Go, juego procedente de China y probablemente el tablero de juego más complejo del mundo, enfrentándose sistemas de machine learning y seres humanos. En el caso de los videojuegos, los desarrolladores recurren a estas máquinas para hacer sus juegos más interesantes. Además, los diseñadores de juegos pueden instalar este aprendizaje autónomo para crear un juego lo más equilibrado posible entre el ordenador y los jugadores reales.