Cuatro formas de ver Twitter
por Scott Berinato
La visualización de datos mola. También se está volviendo cada vez más útil, a medida que la vibrante comunidad online de visualizadores de datos (programadores, diseñadores, artistas y estadísticos, a veces todos en una sola persona) crece y las herramientas para ejecutar sus visiones mejoran.
Jeff Clark forma parte de esta comunidad. Él, como muchos entusiastas de la visualización de datos, se enamoró después de inspirarse en un pionero Martín Wattenberg es mapa de árboles emblemáticos que visualizaba el mercado de valores.
El último trabajo de Clark es muy prometedor. Ha creado cuatro motores que visualizan esa enorme pila de datos conocida como Twitter. Básicamente, las cuatro palabras de búsqueda utilizadas en los tuits y, a continuación, buscan relaciones con otras palabras o con otros tuiteros. Funcionan casi en tiempo real.
«Twitter es una fuente de datos obvia para obtener mucha información textual», afirma Clark. «De hecho, ha demostrado ser un gran patio de recreo para poner a prueba ideas de visualización de datos». Clark admite fácilmente que no todas las visualizaciones son producto de su genialidad en el diseño. Son sus habilidades de programación las que le permiten crear motores que impulsen las visualizaciones. «Dedico bastante tiempo a analizar lo que hay ahí fuera. Tomaré lo que alguien hizo visualmente y usaré una fuente de datos diferente. Twitter Spectrum se basaba en las cosas que la gente buscaba en Google. Chris Harrison hizo un trabajo interesante que se ve muy bien y pensé: puedo hacer algo así basado en datos en tiempo real. Así que lo llevé a Twitter».
Sus herramientas están definitivamente en las primeras etapas, pero incluso ahora, es fácil imaginarse adónde podrían llevarse.
Tome Twitter Venn. Introduce tres términos de búsqueda y la aplicación muestra un diagrama de Venn que muestra la frecuencia de uso de cada término y la frecuencia de superposición de los términos en un solo tuit. Como ventaja adicional, muestra un pequeño mapa de palabras con los términos más comunes relacionados con cada término de búsqueda; tuits por día para cada término por sí solo y cada combinación de términos; y un tuit reciente. Escribí «Apple, Google, Microsoft». Esto es lo que tiene:
Enseguida veo que los tuits de Apple están dominando, no es sorprendente. Pero observe la alta frecuencia de palabras inesperadas como «ganar», «gratis» y «capacitivo» que se utilizan con el término «manzana». Eso sugiere marketing (¿spam?) de productos Apple a través de Twitter, es decir, «Gane un iPad gratis…».
Me sorprendió la relativa poca frecuencia de los tuits de «Google». De hecho, había de media más tuits que incluían «Microsoft» y «Google» que otros que solo mencionaban «Google».
Entonces fui a Espectro de Twitter, una herramienta similar que compara dos términos de búsqueda y muestra qué palabras se asocian más a cada término y qué palabras se utilizan con más frecuencia en los tuits con ambos términos. Este es el espectro de Twitter de «Google, Microsoft»:
Me encanta que la palabra «uf» esté en un punto muerto entre Google y Microsoft. Pero el protagonismo de los términos de las redes sociales en el lado azul frente a los términos de búsqueda en el lado rojo es fascinante. Parece que dos ejércitos marchan uno contra el otro listos para librar guerras diferentes.
Clark también creó TwitArcs. Creo que este es un trabajo en progreso y Clark dice: «Visualmente me gusta, pero puede que sea lo menos útil hasta ahora». En este caso, escribe el identificador de un tuitero y devuelve una secuencia de los tuits de esa persona con arcos que unen palabras comunes entre los tuits (a la derecha) y los que retuitean comunes (a la izquierda). Al pasar el ratón por encima, se resalta el último tuit del arco. He aquí un TwitArc de @timoreilly:
Por último, el gráfico de flujo. Introduzca un término de búsqueda y el motor de Clark devolverá la frecuencia de las palabras más comunes encontradas en su término de búsqueda en los últimos 1000 tuits. Ve un flujo literal de conversación. También puede resaltar un término para ver cómo ha cambiado su frecuencia a lo largo del tiempo y verá los tuits más recientes que incluyen tanto su término de búsqueda como el término destacado.
A veces, 1000 tuits con su término pueden durar semanas. Para mi término de búsqueda, «Tiger Woods», que introduje ayer por la tarde justo después de que se conociera la noticia de que hablaría en público, 1000 tuits cubiertos unos 20 minutos. Este es el gráfico de flujo de «Tiger Woods» con la palabra «silencio» resaltada:
No es difícil imaginar cómo se puede aplicar esto a las empresas. Ya me imagino a los vendedores ansiosos viendo pasar la transmisión en su debut comercial en la Super Bowl del año que viene.
Clark, como muchos visualizadores de datos, cree que estamos al frente de una revolución en la presentación de la información. «Hay mucho trabajo por hacer llamado visualización científica o gráficos de inteligencia empresarial», afirma. «Y es pragmático, tratar de resolver problemas prácticos. Todo es estándar, gráfico de barras o circular. Pero esas formas estándar no son adecuadas cuando se intenta explotar un espacio de datos más rico. El mundo está lleno de datos complejos y acabamos de empezar a tener las herramientas para darles sentido. Estamos buscando nuevas formas de presentar los datos».
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.