El Data Storytelling es una forma “trendy” de decir que: si tienen datos, han hecho análisis y han llegado a conclusiones relevantes, ahora deben comunicarlo bien y construir argumentos sólidos para explicar esos resultados. Básicamente es la construcción de una narrativa para explicar el resultado de un análisis de datos, y tratar de incidir en las personas a las cuales va dirigido. Trataré de ir explicando cómo se va construyendo, o cómo lo hago yo por lo menos, con un ejemplo.
Digamos que tenemos interés de explicar cómo han cambiado los accidentes de tránsito en los últimos años, en particular por el impacto de la pandemia, ya que hubo cambios significativos en la circulación de vehículos debido a restricciones vehiculares, por lo menos en Costa Rica. Lo primero es obtener datos, por suerte el COSEVI (Consejo de Seguridad Vial de Costa Rica), tiene publicado datos abiertos del 2016 al 2020 (datos en este link https://datosabiertos.csv.go.cr/datasets/193472/consolidado-de-accidentes-de-transito-con-victimas/ ), lástima que no incluya el 2021 (a la publicación de esta columna).
Una vez con los datos, lo primero que hacemos es explorarlos, esto consiste en agruparlos y graficarlos de diferentes maneras para ver posibles tendencias. Lo más lógico es hacer un gráfico de líneas, dado que es una serie temporal (muestra cambios en el tiempo), y ver la cantidad de accidentes por mes en cada año,
Al ver este gráfico, Inmediatamente se nota algo diferente con la línea morada que corresponde al año 2020. Los años anteriores parecen comportarse de una manera similar entre ellos, pero el 2020 no. Veamos esto con un poco más detalle,
Marcamos en rojo intenso el año 2020, y colocamos una línea donde la tendencia en general comienza a ser diferente para ese año, esto en el mes de marzo. Ese mes comienza a alejarse de lo que sucedía en años anteriores, y ya para abril (que indico con la flecha) el cambio es bastante grande, de hecho el más bajo observado en esos 5 años.
¿Qué sucedió? El 2020 fue el año de inicio de la pandemia COVID, y ocurrieron dos cosas importantes en los meses de marzo y abril de ese año. En marzo, hubo un cierre total de escuelas y colegios. Gran parte de la circulación diaria de vehículos, ocurre debido a la movilidad escolar, por tanto esa reducción podría ser resultado de ese cambio. ¿y en abril?, ese mes ocurrió algo que nunca había ocurrido en Costa Rica, Una restricción vehicular bastante intensa, que redujo alrededor de un 90% la circulación en semana santa del 2020. En principio podemos esperar que una reducción en la circulación de vehículos, tendrá una reducción proporcional en la cantidad de accidentes. La reducción, especialmente a partir de abril de ese año, fue muy alta, de hecho la más alta experimentada en esos 5 años (y sospecho que en la historia). Ahora bien, la historia no termina allí, veamos los siguientes dos puntos marcados por las flechas,
Noten como entre abril y diciembre del 2020, los accidentes, aunque se mantuvieron menores que en los 4 años anteriores, experimentaron un aumento, ¿por qué? el resto del año 2020, hubo medidas similares aunque variables, los accidentes fueron aumentando paulatinamente, hasta llegar a niveles más altos a fin de año (aunque siempre menores que los años anteriores) ¿Qué pasó?. Resulta ser que cuando se aplican medidas a nivel país, una cosa es la medida, y otra es la respuesta de la población. A medida que avanzaba el 2020 y sabíamos más de la pandemia, las actitudes de la población fueron cambiando, las personas que trabajan debían continuar su actividad, y presupone entonces que muchas personas continuaron movilizándose en vehículos a pesar de la medida (respaldado por datos de Google Mobility). No tengo datos del 2021, pero viendo la tendencia del 2020, es posible que se mantuviera menor, pero no tanto como lo experimentado en abril del 2020.
Les acabo de dar un ejemplo de Data Storytelling. Utilicé dos cosas importantes en el relato, la primera es crear un flujo en la descripción de inicio a fin, y la segunda, utilizar recursos de visualización de datos. En general las técnicas de data stroytelling involucran aspectos de diseño, escritura, visualización de información, y oratoria (en presentaciones audiovisuales).
En términos del ejemplo lo desarrollé en términos de la narrativa de la siguiente manera: 1. crear contexto y un objetivo, 2. mostrar algo crítico (un “conflicto”), 3. resolver (dar una solución o respuesta a lo observado). Para iniciar muestro un gráfico, y explico de donde viene, noten cómo utilizo gráficamente colores que diferencian los años, pero que no destaca ningún año sobre otro por su color, que deje al lector notar el problema.
Una vez apuntada una diferencia (en el año 2020), genero un nuevo gráfico, que su función es la de resaltar el año diferente, y describir en qué se diferencia (conflicto), luego generar una expectativa de que debe ser resuelta. Utilizo recursos gráficos como flechas y colores para destacar algo en particular, esto para guiar al lector a ver lo que yo, como autor, quiero que vea.
Al final muestro un gráfico que muestra una tendencia. Noten como hago el color de los otros años más tenue (un gris claro), para ir enfocando en el 2020, y marco una línea punteada que por instinto nos muestra la tendencia a crecimiento, y una segunda flecha final para así destacar un rango.
Este es un ejemplo sencillo, hay muchos medios por los cuales hacer Data Storytelling, puede ser presentaciones, videos o hasta sitios web interactivos, yo lo he puesto en práctica desde presentaciones científicas, TEDx y hasta en páginas web, la combinación es una buena narrativa con visualizaciones adecuadas, no se trata de ser escritores y diseñadores perfectos, pero si entender bien qué es lo que quiere comunicar y a quién va dirigido y cómo quiero incidir en ese público.
Dr. Tomás de Camino Beck,
Director de la Escuela de Sistemas Inteligentes
Universidad Cenfotec