PathMBA Vault

Gestión propia

Cómo explorar la causa y el efecto como un científico de datos

por Thomas C. Redman

La capacidad de pensar de forma analítica es importante para cualquier gerente en la actualidad. Los primeros pasos, como he explicado antes, implican recopilar datos, hacer algunos gráficos sencillos, sacar conclusiones básicas y planificar los próximos pasos. Pero los datos no revelan sus secretos fácilmente. Si bien podemos utilizar los datos para entender la correlación, la comprensión más fundamental de la causa y el efecto requiere más. Y confundir las dos cosas puede llevar a resultados desastrosos.

Cada gerente debe hacer la distinción entre «correlación» y «causa y efecto» con regularidad, ya que el tema surge de muchas formas. Siempre llegan nuevos temas de producción, marketing, planificación e inversión, que requieren un análisis cuidadoso. El big data y la analítica avanzada producen correlaciones inesperadas, y es esencial separar la verdadera oportunidad de la falsa provocación. Por último, gran parte de la gestión implica tomar medidas sobre cosas que puede controlar para afectar a los resultados deseados.

Usaré mis datos dietéticos personales para explorar ambas cosas.

Como antecedente, he tenido la suerte de tener una buena salud. Me gusta hacer ejercicio y hacer suficiente. Aun así, a lo largo de los años, mi peso ha subido sigilosamente. ¡El problema es que también me gusta comer! He pensado en hacer dieta de pasada, pero aparte de algunos puntos que nos han dicho a todos (por ejemplo, «Demasiada carne roja es mala para usted»), no entiendo la nutrición. Hasta septiembre pasado, siempre encontraba una excusa cómoda para no hacerlo.

A partir del 22 de septiembre, seguí las recetas de mi último blog. Encontré un programa en Internet donde podría registrar mi ingesta de comida. Fue un poco más difícil de lo que esperaba, pero seguí así. Y después de tres meses, dibujé algunos complots. Para que quede claro, publico estos argumentos porque son absolutamente típicos de los análisis exitosos en los que he participado a lo largo de mi carrera.

En el primer gráfico de abajo, he trazado mi peso (puntos azules) y mi ingesta diaria de calorías (línea azul). La trama también incluye un «rango de calorías recomendado» (líneas verdes).

Caloric Intake Chart

Ahora vamos a profundizar. Es fácil darse cuenta de que comí demasiado en las semanas dos a cuatro y que mi peso subió. Esto tiene sentido, existe una relación causal entre la ingesta calórica y el aumento de peso. Esta correlación tiene una explicación en el mundo real.

Por desgracia, la recomendación obvia, «coma menos», ¡es totalmente insatisfactoria! Si pudiera hacerlo, no tendría sobrepeso. Tenemos que profundizar un poco más.

Una posible explicación es que estuve de viaje la mayoría de esas semanas. Lo he marcado y el posterior viaje en la trama. El complot confirma mis sospechas: mis ya dudosos hábitos alimenticios empeoran aún más cuando viajo.

Tenga en cuenta que, aunque la correlación entre el viaje y el peso es tentadora, la trama no logra, por sí sola, la causa y el efecto. Estoy seguro de que no viajo porque como demasiado. Pero aún no sé por qué como demasiado cuando viajo. Hay factores más profundos a la espera de ser descubiertos. ¿El problema es una combinación de comer en restaurantes desconocidos, demasiada «bebida y cena», demasiada comida rápida en los aeropuertos o algo más? Simplemente no lo sé todavía. Viajar es una causa «inmediata» de mi mal control de peso, pero no como una causa «raíz» directamente abordable.

Este debate subraya un punto crítico: si bien la correlación no implica causalidad, sí me proporciona un excelente punto de partida desde el que podemos profundizar en los datos, considerar otras pruebas, etc.

Mi aumento de peso en las dos semanas hasta el 9 de noviembre fue desconcertante al principio, ya que mantuve mi ingesta de calorías en el rango aceptable. Luego hice un gráfico de mis «minutos de acondicionamiento físico» semanales. Mi ejercicio fue muy bajo durante ese período. De nuevo, tiene sentido: el ejercicio consume calorías y menos ejercicio significa más peso. ¡No puedo dejar mi régimen de ejercicios!

Exercise Chart

Pero tengamos cuidado. Si bien la falta de ejercicio parece ser la causa principal, puede que no sea tan simple. Puede ser que más ejercicio me lleve a comer más, anulando las calorías quemadas. Por ejemplo, suelo dar un largo paseo en bicicleta los domingos de verano. Si no recuerdo mal, estoy hambriento esas noches. Pero en este momento, no tengo los datos para investigar. Así que el ejercicio solo califica como «causa principal, en igualdad de condiciones».

El argumento final de este post es mi consumo de grasas todos los días. Incluso durante las últimas semanas, cuando mi consumo total de calorías era un poco más bajo y mi peso se mantuvo estable, comí demasiada grasa. Consulté a una nutricionista y me dijo que un gramo de grasa tiene nueve calorías y un gramo de carbohidratos solo cuatro. Tenga en cuenta que, aunque no he establecido ninguna correlación en los datos, mis sospechas sobre el consumo de grasas están motivadas por una explicación convincente de la realidad subyacente.

Fat Intake Chart

Mi siguiente paso fue simplemente pasar mis nueve «días con más grasa», identificar a los tres grandes infractores y reducirlos.

He aquí por qué estos análisis son tan relevantes. En primer lugar, simplemente debe tener los datos. Mi intuición me dice que el ejercicio es bueno para mí, pero mi intuición sobre la dieta, hasta septiembre pasado, a menudo se equivocaba. También en los negocios. En mi consultoría, la gente me dice todo el tiempo: «Sabemos…» sea lo que sea. A veces tienen razón. Pero a menudo simplemente se equivocan.

En segundo lugar, no puede tener miedo de hacer preguntas difíciles tanto sobre los datos como sobre otros. No soy psicólogo, pero creo que parte del machismo de «sabemos…» tiene sus raíces en el miedo a equivocarse. Del mismo modo, me pareció una tontería hablar con la nutricionista, pero me ayudó a hacerme una mejor idea de por qué es importante la grasa.

En tercer lugar, tiene que estar atento a los datos incorrectos. Mi ingesta calórica parece demasiado baja en dos días, así que las grafiqué con una x roja. Casi siempre ocurre que no se puede confiar en algunos datos. Gestionar datos incorrectos es cada vez más importante cuando las distinciones son buenas o hay mucho en juego, pero cuando hay relativamente pocos puntos sospechosos, a menudo puede completar uno o dos análisis sin preocuparse.

En cuarto lugar, unas cuantas tramas bien elegidas dan grandes pistas sobre las causas fundamentales. En mi caso, los posibles factores que contribuyen al control del peso en torno a los viajes, el ejercicio y la ingesta de grasas se han aclarado por sí mismos. Al mismo tiempo, aún no podemos confirmar que ninguna sea la causa principal. Eso requiere datos y una comprensión profunda de «lo que está sucediendo» que se refuercen mutuamente. Esta es la norma en todos los negocios.

En quinto lugar, es muy fácil confundir la correlación con la causa principal. He oído un gran ejemplo hace poco. Mi hijo y su esposa habían asistido a un taller en el que un presentador señaló que «hay mucho más sexo en los hogares en los que los maridos comparten la crianza de los hijos y las tareas del hogar». Una correlación interesante, pero desprovista de causa y efecto. ¿El hecho de que los maridos hagan más tareas del hogar lleva al sexo o el sexo hace que los maridos hagan más tareas del hogar? ¿O hay factores más profundos en juego? De hecho, La correlación puede que ni siquiera sea correcta. En lugar de asumir la causalidad, trate la correlación como una pista que se puede combinar con otras pruebas para llegar a una conclusión. La correlación no es causalidad. ¡Pero es un punto de partida fantástico!

Mientras redactaba este post, unas seis semanas después de hacer estos planes, he perdido cuatro libras. ¿Impresionado? ¡No lo sea! La gente pierde esa cantidad de peso todo el tiempo. Como en todos los negocios, las verdaderas preguntas son «¿Funcionará a largo plazo?» y «¿Tendré la disciplina necesaria para seguir adelante?»

Por último, por supuesto, estos complots son solo el principio. La nutrición, como los negocios, es compleja. Los que lo entiendan seguramente preguntarán: «¿Come suficiente fruta?» «¿Qué hay de las grasas saturadas?» o «¿Dónde encaja la hidratación?» En cada análisis útil, los primeros complots conducen inevitablemente a otros.

Al igual que en mi último post, espero que los lectores se entusiasmen con la idea de que pueden y deben usar los datos para explorar la causa y el efecto. Al fin y al cabo, ¡la analítica es demasiado divertida como para dejarla en manos de los científicos de datos!