PathMBA Vault

Analytics and data science

Cómo aprenden las máquinas (y usted gana)

por

«Aprendizaje automático». Ha escuchado el término y probablemente asiente con la cabeza cuando alguien le diga lo importante que es. Pero en secreto puede que no esté seguro de qué es o cómo funciona. Pida a sus científicos de datos que se lo expliquen y puede que se pierda en un mar de charlas especializadas sobre bifurcaciones, nodos foliares, puntos de división y recursiones. Olvídese de todo eso. Lo único que necesita saber es que el aprendizaje automático aplica modelos estadísticos a los datos de los que dispone para hacer predicciones inteligentes sobre los datos que no tiene.

Esas predicciones pueden ayudarle a encontrar señales en el ruido y a extraer valor de todos los datos que recopila. La ventaja —de hecho, la imprescindible— de utilizar el aprendizaje automático es su velocidad y su fuerza bruta. Puede extraer enormes franjas de datos en segundos o minutos, encontrar patrones y hacer predicciones de formas que ningún analista humano podría empezar a emular. El aprendizaje automático, entre otras cosas, ayuda a las empresas a detectar que los pacientes tienen convulsiones mucho antes de que se produzcan realmente.

Lo mejor de todo es que no importa cuánto trabajo le dedique, el estudiante nunca se agota ni se aburre. He aquí un vistazo a cómo funciona.

Ejemplo: Cómo una empresa de cable descubre qué clientes podrían cancelar el servicio

Los desertores de una empresa de cable han empezado a superar en número a los nuevos clientes. La empresa quiere lanzar ofertas de descuentos para evitar más cancelaciones, pero no quiere ofrecer descuentos a los clientes satisfechos que estén dispuestos a pagar su tarifa actual. La empresa no tiene datos explícitos sobre los «posibles cortadores de cables», por lo que utilizará su base de datos de clientes y el aprendizaje automático para detectar a los posibles desertores y dirigirse únicamente a ellos con sus ofertas de descuentos. Seguiremos el proceso de aprendizaje automático mientras se trata de clasificar a dos clientes, Karl y Cathy, mediante un ejercicio típico de aprendizaje automático: un árbol de decisiones.

1. Proceso: decida lo que quiere saber

Una máquina no puede elegir aprender algo por sí sola (todavía). En cambio, los científicos de datos le dicen lo que quieren que aprenda.

2. Construir un modelo

Para aprender, la máquina debe acceder a datos detallados de los clientes: datos demográficos, comportamiento de compra, otros servicios por los que pagan los clientes, si han llamado para quejarse o cancelar un servicio, y mucho más. Con estas variables, los científicos de datos crean un modelo estadístico que determina qué tan predictiva es cada variable en términos de la respuesta que la máquina intenta aprender.

3. Acumule respuestas

Para cada pregunta, la probabilidad se refina en una u otra dirección en función de las respuestas hasta ese momento. La máquina busca combinaciones de atributos que creen un alto nivel de certeza sobre la respuesta que busca.

R1511Z_VISION_A
R1511Z_VISION_B
R1511Z_VISION_C
R1511Z_VISION_D
R1511Z_VISION_E

4. Tomar una decisión

Con el tiempo, la probabilidad se pone muy ponderada de una forma u otra. Puede que eso venga después de unas cuantas preguntas o de docenas de ellas. Los científicos de datos deciden qué tan seguros quieren que tenga la máquina en su respuesta. Puede que digan que una vez que tenga un 95% de confianza, puede parar.
R1511Z_VISION_F

5. Iterar

Ahora el ordenador puede realizar la misma evaluación miles o incluso millones de veces en otras entradas de su conjunto de datos, clasificando con confianza cada entrada en el grupo A o el grupo B. Ha aprendido.

Creada en colaboración con Randal S. Olson y R2D3