Cuando la visualización de datos funciona y cuándo no
por Jim Stikeleather
Me incomoda el creciente énfasis en el big data y su estilista, la visualización. No me malinterprete. Me encantan las representaciones infográficas de grandes conjuntos de datos. El valor de representar la información de forma concisa y eficaz se remonta a Florence Nightingale, cuando desarrolló un nuevo tipo de gráfico circular para demostrar claramente que morían más soldados por enfermedades prevenibles que por sus heridas. Por otro lado, veo hermosos ejercicios de efectos especiales que muestran habilidades estadísticas y técnicas, pero que no tienen claramente un propósito informativo. Eso es lo que me hace retorcerme.
En última instancia, la visualización de datos consiste en comunicar una idea que impulsará la acción. Comprender los criterios de la información para obtener información valiosa y el razonamiento detrás de la creación de visualizaciones de datos le ayudará a hacerlo con eficiencia e impacto.
Para que la información proporcione información valiosa, debe ser interpretable, relevante y novedosa. Con tantos datos desestructurados en la actualidad, es fundamental que los datos que se analizan generen información interpretable. Recopilar muchos datos sin los metadatos asociados (por ejemplo, qué es, dónde se recopilaron, cuándo, cómo y por quién) reduce las oportunidades de jugar con los datos, interpretarlos y obtener información a partir de ellos. También debe ser relevante para las personas que desean obtener información y para el propósito con el que se examina la información. Por último, debe ser original o arrojar nueva luz sobre una zona. Si la información no cumple con alguno de estos criterios, ninguna visualización puede convertirla en valiosa. Eso significa que solo una pequeña parte de los datos que podamos dar vida visualmente valdrá la pena.
Una vez que hayamos reducido el universo de datos a los que cumplan estos tres requisitos, también debemos entender las razones legítimas para crear visualizaciones de datos y reconocer qué factores afectan a la calidad de las visualizaciones de datos. Hay tres motivos principales para visualizar los datos:* Confirmación: Si ya tenemos un conjunto de suposiciones sobre el funcionamiento del sistema que nos interesa (por ejemplo, un mercado, los clientes o la competencia), las visualizaciones nos pueden ayudar a comprobar esas suposiciones. También nos permiten observar si el sistema subyacente se ha desviado del modelo que teníamos y evaluar el riesgo de las acciones que vamos a emprender en función de esas suposiciones. Ve este enfoque en algunos paneles empresariales.
- Educación: La visualización ofrece dos formas de educación. Una es simplemente informar: así es como medimos el sistema de interés subyacente y estos son los valores de esas medidas de forma comparativa, por ejemplo, a lo largo del tiempo o con respecto a otros sistemas o modelos. La otra es desarrollar la intuición y nuevos conocimientos sobre el comportamiento de un sistema conocido a medida que evoluciona y cambia con el tiempo, de modo que los humanos puedan hacerse una idea experiencial del sistema en un período de tiempo extremadamente reducido. Este modelo lo ve a menudo en la «gameificación» de la formación y el desarrollo.
- Exploración: Cuando tenemos grandes conjuntos de datos sobre un sistema que nos interesa y el objetivo es proporcionar interacciones hombre-máquina (HMI) óptimas con esos datos para analizar relaciones, procesos, modelos, etc., podemos utilizar la visualización como ayuda a crear un modelo que nos permita predecir y gestionar mejor el sistema. La práctica de utilizar el descubrimiento visual en lugar de la estadística se denomina análisis exploratorio de datos (EDA) y muy pocas empresas lo utilizan.
Suponiendo que el creador de la visualización lo haya entendido bien (un propósito bien definido; la cantidad de datos y metadatos necesaria y suficiente para que la visualización sea interpretable; permitir información relevante y original para la empresa), ¿qué nos da la confianza de que ahora vale la pena poner en práctica estas ideas? Nuestra capacidad para entender y controlar hasta cierto punto tres áreas de riesgo puede definir el valor resultante de las visualizaciones para la empresa:* Calidad de los datos: La calidad de los datos subyacentes es crucial para el valor de la visualización. ¿Qué tan completo y fiable es? Como ocurre con todos los procesos analíticos, poner basura significa sacar la basura.
- Contexto: El objetivo de la visualización es hacer que grandes cantidades de datos sean accesibles para que podamos aplicar nuestro ordenador de detección de patrones perfeccionado evolutivamente, es decir, nuestro cerebro — para extraer información de ello. Para ello, necesitamos acceder a todas las posibles relaciones de los elementos de datos. Este contexto es la fuente de información. Omitir cualquier información o metadatos contextuales (o, más adecuadamente, «metacontenido») corre el riesgo de impedir nuestra comprensión.
- Sesgos: El creador de la visualización puede influir en la semántica de la visualización y en la sintaxis de los elementos de la visualización mediante la elección de colores, el posicionamiento y los trucos visuales (como el 3D innecesario o el 2D cuando el 3D es más informativo), cualquiera de los cuales puede dificultar la interpretación de los datos. Esto también crea el riesgo de «especificar previamente» las funciones y los resultados detectables mediante los algoritmos integrados utilizados por el creador (algo que la EDA pretende superar). Esto, a su vez, puede influir significativamente en la forma en que los espectadores entienden la visualización y en la información que obtendrán de ella.
Hacer caso omiso de estos requisitos y riesgos puede socavar el propósito de la visualización y confundir en lugar de esclarecer.
Visualización de datos
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.