PathMBA Vault

Analytics and data science

Cómo contar una historia con datos

por Jim Stikeleather

Una visualización excelente, según Edward Tufte, expresa «ideas complejas comunicadas con claridad, precisión y eficiencia». Yo añadiría que una visualización excelente también cuenta una historia mediante la representación gráfica de la información estadística. Como comenté en un publicación anterior, la visualización en su función educativa o de confirmación es realmente una forma dinámica de persuasión. Pocas formas de comunicación son tan persuasivas como una narración convincente. Para ello, la visualización tiene que contar una historia al público. La narración ayuda al espectador a obtener información a partir de los datos. (Para un buen ejemplo, cuánto piensa los esteroides han influido en el béisbol?)

Entonces, ¿cómo cuenta un diseñador visual una historia con una visualización? El análisis tiene que encontrar la historia que respaldan los datos. El periodismo tradicional hace esto todo el tiempo, y a los periodistas se les ha dado muy bien contar historias con la visualización a través de infografías. En ese sentido, he aquí algunas estrategias periodísticas para contar una buena historia que se aplican también a las visualizaciones de datos.

  1. Encuentre una narración convincente. Además de dar un cuenta de los hechos y establecer las conexiones entre ellos, no sea aburrido. Está compitiendo por el tiempo y la atención del espectador, así que asegúrese de que la narración tenga un gancho, un impulso o un propósito cautivador. Encontrar la estructura narrativa le ayudará a decidir si realmente tiene una historia que contar. Si no lo hace, quizás esta visualización debería admitir el análisis de datos exploratorios (EDA) en lugar de transmitir información. Sin embargo, para el diseñador de una visualización exploratoria sigue siendo importante despertar la imaginación de los espectadores para fomentar examinar las relaciones entre y facilitar la interacción con los datos, piense en la gameificación.
  2. Piense en su público. ¿Qué sabe el público sobre el tema? ¿Está dirigido a los responsables de la toma de decisiones, las partes interesadas en general u otras personas? La visualización debe enmarcarse en torno al nivel de información del que ya dispone el público, correcto e incorrecto:
  • Novato: primera exposición al tema, pero no quiere una simplificación excesiva
  • Generalista: conoce el tema, pero busca una visión general, la comprensión y los temas principales
  • Gerencial: comprensión profunda y práctica de las complejidades e interrelaciones con acceso a los detalles
  • [Experto](http://web.mit.edu/hdenny/Public/blog post images/DataGovScreenshot_blog.jpg): más exploración y descubrimiento y menos narración con gran detalle
  • Ejecutivo: solo tiene tiempo de deducir el significado y las conclusiones de las probabilidades ponderadas
  1. Sea objetivo y ofrezca equilibrio. Una visualización debería ser desprovisto de sesgos. Incluso si se trata de argumentar para influir, debe basarse en lo que dicen los datos, no en lo que quiere que digan. Tufte encontró varios gráficos que engañaban a los espectadores acerca de los datos subyacentes y creó una fórmula para cuantificar un gráfico tan engañoso llamado» Factor de mentiras.». El factor de mentira equivale al tamaño del efecto que se muestra en el gráfico, dividido por el tamaño del efecto en los datos. A veces no es intencional: un número tres veces más grande que otro se percibirá nueve veces más grande si se representa en 3D. Hay formas sencillas de fomentar la objetividad: etiquetar para evitar la ambigüedad, hacer que las dimensiones gráficas coincidan con las dimensiones de los datos, utilizar unidades estandarizadas y evitar que los elementos de diseño comprometan los datos. El equilibrio puede provenir de representaciones alternativas (varios clústeres; intervalos de confianza en lugar de líneas; cambios en los plazos; paletas y asignaciones de colores alternativas; escala variable) de los datos de la misma visualización. Mantener la objetividad y el equilibrio no es un esfuerzo trivial y se infringe fácilmente sin querer. Los espectadores y los responsables de la toma de decisiones acabarán descubriendo inconsistencias, lo que a su vez hará que el diseñador pierda la confianza y la credibilidad, por muy buena que sea la historia.
  2. No censure. No sea selectivo con los datos que incluye o excluye, a menos que esté seguro de que está ofreciendo a su audiencia la mejor representación de lo que «dicen» los datos. Esta selectividad incluye el uso de valores discretos cuando los datos son continuos; la forma de tratar los valores faltantes, atípicos y fuera de rango; rangos temporales arbitrarios; valores limitados, volúmenes, rangos e intervalos. Con el tiempo, los espectadores se darán cuenta y perderán la confianza en la visualización (y en cualquier otra que pueda producir).
  3. Por último, editar, editar, editar. Además, trate de explicar los datos, no solo de decorarlos. No caiga en la trampa de «se ve guay», cuando puede que no sea la mejor manera de explicar los datos. Como saben los periodistas y escritores, si dedica más tiempo a editar y mejorar su visualización que a crearla, probablemente esté haciendo algo bien.