PathMBA Vault

Analytics and data science

Cómo detectar una oportunidad de aprendizaje automático, aunque no sea científico de datos

por Kathryn Hume

Cómo detectar una oportunidad de aprendizaje automático, aunque no sea científico de datos

oct17-20-Sylverarts-iStock-652583080

SylverArts/iStock

La inteligencia artificial ya no es solo un subcampo especializado de la informática. Los gigantes de la tecnología llevan años utilizando la IA: los algoritmos de aprendizaje automático impulsan las recomendaciones de productos de Amazon, Google Maps y el contenido que Facebook, Instagram y Twitter muestran en las redes sociales. Pero el adagio de William Gibson se aplica bien a la adopción de la IA: el futuro ya está aquí, pero no está distribuido de manera uniforme.

La empresa promedio se enfrenta a muchos desafíos para empezar con el aprendizaje automático, incluida la escasez de científicos de datos. Pero igual de importante es la escasez de ejecutivos y empleados no técnicos capaces de detectar las oportunidades de IA. Y detectar esas oportunidades no requiere un doctorado en estadística ni siquiera la habilidad de escribir código. (Alerta de spoiler, requerirá un breve viaje de regreso al álgebra del instituto).

Tener una intuición sobre el funcionamiento de los algoritmos de aprendizaje automático, incluso en el sentido más general, se está convirtiendo en una importante habilidad empresarial. Los científicos del aprendizaje automático no pueden trabajar en el vacío; las partes interesadas de la empresa deberían ayudarlas a identificar los problemas que vale la pena resolver y a asignar expertos en la materia para que resuman sus conocimientos en etiquetas para conjuntos de datos, proporcionar comentarios sobre los resultados y fijar los objetivos del éxito algorítmico.

Como Andrew Ng ha escrito: «Casi todo el progreso reciente de la IA se debe a un tipo, en el que algunos datos de entrada (A) se utilizan para generar rápidamente una respuesta simple (B)».

Pero, ¿cómo funciona esto? Piense en las matemáticas del instituto —le prometo que será breve— cuando aprendió la ecuación para una línea recta: y = mx + b. Las ecuaciones algebraicas como esta representan la relación entre dos variables, x e y. En el instituto, le dirán qué son m y b, se le dará un valor de entrada para x y, a continuación, se le pedirá que los introduzca en la ecuación para resolver y. En este caso, empiece con la ecuación y, a continuación, calcule valores determinados.

El aprendizaje supervisado invierte este proceso, resolviendo m y b, dado un conjunto de x e y. En el aprendizaje supervisado, se comienza con muchos detalles (los datos) y se deduce la ecuación general. Y la parte de aprendizaje significa que puede actualizar la ecuación a medida que vea más x e y, cambiando la pendiente de la recta para que se ajuste mejor a los datos. La ecuación casi nunca identifica la relación entre cada x e y con una precisión del 100%, pero la generalización es eficaz porque más adelante podrá utilizarla para hacer álgebra con datos nuevos. Una vez que haya encontrado una pendiente que capture una relación entre x e y de forma fiable, si se le da un nuevo valor x, puede hacer una suposición fundamentada sobre el valor correspondiente de y.

Como puede imaginar, muchos problemas interesantes de aprendizaje automático no se pueden reducir a una simple ecuación, como y = mx + b. Pero, en esencia, los algoritmos de aprendizaje automático supervisados también resuelven versiones complejas de m, basándose en valores etiquetados para x e y, de modo que pueden predecir las y futuras a partir de las x futuras. Si alguna vez ha hecho un curso de estadística o ha trabajado con análisis predictivo, todo esto le debería resultar familiar: es la idea detrás regresión lineal, una de las formas más sencillas de aprendizaje supervisado.

Volviendo a la formulación de Ng, el aprendizaje supervisado requiere que tenga ejemplos tanto de los datos de entrada como de la respuesta, tanto de las x como de las y. Si tiene ambas, el aprendizaje supervisado le permite crear una ecuación que se aproxime a esa relación, de modo que en el futuro pueda adivinar los valores y para cualquier valor nuevo de x.

Así que la cuestión de cómo identificar las oportunidades de la IA comienza con la pregunta: ¿Cuáles son algunos resultados que vale la pena adivinar? ¿Y tenemos los datos necesarios para realizar el aprendizaje supervisado?

Por ejemplo, supongamos que un científico de datos tiene la tarea de predecir los precios inmobiliarios de un vecindario. Tras analizar los datos, descubre que el precio de la vivienda (y) está estrechamente correlacionado con el tamaño de la casa (x). Así que utilizaría muchos puntos de datos que contenían el tamaño y el precio de las casas, utilizaría las estadísticas para estimar la pendiente (m) y, a continuación, utilizaría la ecuación y = mx + b para predecir el precio de una casa determinada en función de su tamaño. Esto es regresión lineal y sigue siendo increíblemente potente.

Las organizaciones utilizan técnicas similares para predecir las ventas futuras de productos, el riesgo de la cartera de inversiones o la rotación de clientes. Una vez más, las estadísticas detrás de los diferentes algoritmos varían en complejidad. Algunas técnicas generan predicciones puntuales simples (¡Creemos que y ocurrirá!) y otros ofrecen una serie de posibles predicciones con tasas de confianza afiliadas (hay un 70% de probabilidades de que se produzca y, pero si cambiamos una suposición, nuestra confianza cae al 60%).

Todos estos son ejemplos de problemas de predicción, pero el aprendizaje supervisado también se utiliza para la clasificación.

Las tareas de clasificación agrupan los datos en grupos. Aquí, una científica de datos busca características en los datos que sean proxies fiables para las categorías que quiere separar: si los datos tienen la característica x, van al grupo uno; si no, van al grupo dos. Todavía puede pensar que se utilizan las x para predecir las y, pero en este caso y no es un número sino un tipo.

Herramientas relacionadas

Las organizaciones utilizan algoritmos de clasificación para filtrar el spam, diagnosticar anomalías en las radiografías, identificar los documentos relevantes para una demanda, ordenar los currículums de un trabajo o segmentar a los clientes. Pero la clasificación adquiere su verdadero poder cuando aumenta el número de clases. La clasificación puede extenderse más allá de las opciones binarias, como «¿Es spam o no?» para incluir muchos cubos diferentes. Las tareas de percepción, como entrenar a un ordenador para que reconozca los objetos de las imágenes, también son tareas de clasificación, solo que tienen muchas clases de salida (por ejemplo, los nombres de las distintas especies de animales) en lugar de solo Cubeta 1 y Cubeta 2. Esto hace que los sistemas de aprendizaje supervisado parezcan más inteligentes de lo que son, ya que asumimos que su capacidad para aprender conceptos refleja la nuestra. De hecho, solo agrupan los datos en los cubos 1, 2, 3… n, según la «m» aprendida para la función.

Hasta ahora, todo esto parece bastante abstracto. ¿Cómo puede poner los pies en la tierra y aprender a identificar estas estructuras matemáticas en su trabajo diario?

Hay varias formas de determinar si una tarea presenta una buena oportunidad de aprendizaje supervisado.

Primero, anote lo que hace en su trabajo. Divida sus actividades en: cosas que hace a diario o con regularidad y cosas que hace esporádicamente; cosas que se han convertido en algo natural frente a cosas que requieren una deliberación paciente o mucha reflexión; y cosas que forman parte de un proceso en lugar de cosas que hace por su cuenta.

Para las tareas que realiza con normalidad, por su cuenta, y que parecen automáticas, identifique cuántas personas de su organización realizan tareas similares y cuántas personas las han realizado históricamente.

Examine la naturaleza de la tarea. ¿Incluye predecir algo o agrupar algo en categorías?

Pregúntese: si 10 colegas de su organización realizaran la tarea, ¿estarían todos de acuerdo en la respuesta? Si los humanos no están de acuerdo en que algo es verdadero o falso, los ordenadores no pueden transformar de forma fiable las decisiones en patrones estadísticos.

¿Cuánto tiempo lleva la gente de la organización haciendo algo similar a esta tarea? Si ha pasado mucho tiempo, ¿la organización ha mantenido un registro de las tareas completadas correctamente? En caso afirmativo, podría utilizarse como conjunto de datos de entrenamiento para su algoritmo de aprendizaje supervisado. Si no, puede que tenga que empezar a recopilar estos datos hoy mismo y, entonces, puede mantener a un humano informado para que entrene el algoritmo con el tiempo.

A continuación, siéntese con un equipo de ciencia de datos y cuénteles sobre la tarea. Explíqueles su proceso de pensamiento y dígales en qué aspectos de la información se centra al completar su tarea. Esto les ayudará a determinar si la automatización es factible y a determinar los aspectos de los datos que mejor predicen el resultado deseado.

Pregúntese si esto fuera automático, ¿cómo cambiaría eso los productos que ofrecemos a nuestros clientes? Pregunte, ¿qué es lo peor que le podría pasar a la empresa si se automatizara? Y, por último, pregunte, ¿qué es lo peor que le puede pasar a la empresa si el algoritmo arroja una respuesta incorrecta o una respuesta con una tasa de precisión del 65 o el 70%? ¿Cuál es el umbral de precisión que necesita la empresa para automatizar esta tarea?

Tener éxito con el aprendizaje supervisado implica un cambio en la perspectiva de la forma en que se realiza el trabajo. Implica utilizar el trabajo anterior —todo ese juicio humano y experiencia en la materia— para crear un algoritmo que aplique esos conocimientos a los trabajos futuros. Cuando se usa bien, hace que los empleados sean más productivos y crea nuevo valor. Pero todo comienza con identificar los problemas que vale la pena resolver y pensar en ellos en términos de entradas y salidas, x e y.