Esta semana enfoco mi atención a la propagación de información en redes. La idea es explicar, apoyado en un modelo estadístico, cómo se propaga la información y el efecto que tiene replicar un “post” en las redes sociales. La intención de esta columna, no es la de construir un modelo riguroso, sino más bien uno para explicar, sin embargo el modelo que utilizo es bastante formal y creo que sirve de base para un trabajo de graduación o tesis, ¿alguien?
Las redes sociales han sido un motor moderno de propagación de información. La forma en que se propaga tiene que ver con la estructura de las relaciones en redes sociales. Si lo vemos como un diagrama, donde los nodos (bolas) son las personas, y las líneas las relaciones, las redes sociales tienen una forma (topología) similar a esta,
En esta red, cada nodo representa a una persona. Hay un nodo que está mucho más conectado (el rojo) y tiene efecto sobre un número mayor de nodos. Los nodos azules tiene menos conexiones que el rojo, pero tienen más que los nodos grises. En general esa estructura se mantiene en casi todas las redes sociales y tiene que ver con las relaciones humanas que se reflejan hacia relaciones en la red. Esa estructura hace que al publicar un tweet por ejemplo, cuando algunos de estos tweets son “favorecidos” por nodos como el rojo, comienzan a dominar rápidamente, a diferencia de que solamente un nodo gris favorezca el tweet. La propagación y viralidad, es el resultado de interacción entre estos nodos rojos, azules y grises.
Ahora bien, la propagación de información no es igual para todos los posts. Su propagación tiene que ver con popularidad de las personas, re-posteos, comentarios, likes, discusiones en redes, etc. Todos estos mecanismos de interacción “replicación” replican y refuerzan un post. La replicación no es uniforme para todos los posts, sino que algunos pocos tienen mucho más capacidad de ser replicados, ya sea por diseño (que no es sencillo) o por casualidad.
La red hace que cuando se publica un post se propague y se amplifique y replique rápidamente. Acá, lo que quiero es modelar ese proceso de replicación, no la estructura de la red.
Para modelar el mecanismo de amplificación de un post, y con amplificación me refiero a cómo se va propagando de forma acelerada en la red, voy a utilizar un modelo estadístico que se denomina la “Urna de Polya”.
Urna de Polya
La Urna de Polya es un modelo estadístico que permite simular procesos de reforzamiento, es decir, donde algún evento es amplificado aunque ocurra de forma aleatoria. El nombre se debe a un matemático famoso llamado George Polya (pueden buscar ese nombre, que además fue un gran docente).
La urna funciona así: imaginemos un frasco (Urna) con dos bolas numeradas 1 y 2,
Del frasco escogemos al azar una de las bolas, y luego regresamos la bola, pero agregamos una extra con el mismo número,
En el ejemplo anterior sacamos la bola 2, y regresamos esta bola con una adicional (roja en la imagen). En el paso 1, cada bola tenía la misma probabilidad de salir, 50-50, pero al sacar la bola 2 y duplicarla, ya a partir del paso 2, tenemos una mayor probabilidad de sacar al azar la bola 2 (2/3) que sacar una con el número 1 (1/3).
Luego de repetir este proceso (sacar bola al azar y retornar duplicada) un número grande de veces, si vemos solamente la bola 2 por ejemplo,
El gráfico lo que nos muestra es que, de 1500 simulaciones, el resultado puede ser terminar con casi 100% bola 2, pero también es posible terminar con 0% bola 2, y cualquier valor intermedio. Todo depende de cual bola salió en los pasos iniciales, es decir la ventaja se genera al inicio de la simulación.
¿Qué significa esto en términos de propagación de información? Significa que aquellos posts que se ven beneficiados inicialmente, serán rápidamente tendencia en la red, y con solamente el proceso de replicación con reforzamiento, digamos con sólo darle “like” a un post.
Muchas de las estrategias de mercadeo intentan eso, favorecer inicialmente un post, para que domine de alguna manera, instigando a los “likes” y compartir. Así por ejemplo al tener más “likes” se va acelerando la aparición de otros likes, hasta cubrir un cierto dominio de la red. Algunos de ustedes probablemente habrán experimentado la “viralización” de un post, que en muy poco tiempo puede alcanzar miles o incluso millones de likes. Es decir, a medida que obtenga mayor cantidad de likes, se hace más probable que le aparezca a otra persona, incluso fuera de su círculo social cercano.
Pero este modelo solo no es suficiente, pues todavía es posible una situación donde un post no “despegue”, para eso construyo un modelo algo más complejo.
Una urna más compleja
La Urna de Polya se puede modificar para simular otros efectos de este proceso de amplificación. En la urna anterior, en realidad cualquier bola podría dominar al final, pero como indiqué, qué pasa si un post, que es representado por una bola, hace que haya muchas más interacciones como: likes, reposts, comentarios múltiples, compartir en otras redes, con personas incluso fuera de la red. Si esto sucede, en lugar de simplemente duplicar, hay una bola, que en particular tiene una probabilidad de que al ser seleccionada y al sacarla del frasco, devuelva más bolas. Algo así como esto,
Acá el proceso es diferente. Si lo vemos en el ejemplo de la imagen anterior, si sale la bola 3, esta puede agregar de 1 a 6 bolas adicionales al frasco, es decir, la bola 3 tiene mayor capacidad de ser replicada por múltiples maneras, comparada a solamente duplicación de todas las otras bolas.
Después de 3000 iteraciones, con unas 500 simulaciones, como se puede observar en el siguiente gráfico,
la proporción de bolas número 3 tiene una alta probabilidad de que termine “dominando” la urna, es decir, que el frasco termine con casi 100% de bolas número 3, esto porque tiene una mayor probabilidad de ser replicado en cada iteración, se refuerza su efecto, y una vez que domina, ya no interesa incluso cuánto se replica.
En términos de tendencias virales en redes, lo que significa es que ciertos posts, generan una interacción favorable que hace que dominen la red, Así por ejemplo, si las 10 bolas fueran temas dominantes, con sólo que uno de ellos tenga mayor interacción, hace que un solo tema domine. Es decir, posts que no solamente gustan, sino que son comentados y re compartidos. Los posts virales tienen esa característica. Dicho de otro modo, la viralidad es instigada porque su contenido invita a mayor reforzamiento, lo cual por simple azar, en un proceso como el de Polya, lo lleva a altos niveles de propagación.
Algunas conclusiones de todo esto
1. El favorecer o promover ciertos posts temprano, permite que se propaguen rápidamente y se hagan virales
2. Los posts que generan mayor interacción (más que solo likes) van acelerando su capacidad de propagarse
3. Posts conflictivos, que generan discusión y mayor interacción, tienden a propagarse aceleradamente. Esta es probablemente una de las razones por la cual se propaga información falsa más rápido que información verdadera. Al generar posiciones opuestas que generan gran interacción con un post, tanto por parte de los que lo favorecen, como los que no.
4. Las redes sociales son máquinas de propagación de información, tanto así que pueden cambiar rápidamente la opinión de grandes grupos de personas, por esta razón son agresivamente utilizadas para propaganda (propaganda como la manipulación de la opinión pública)
5. El fenómeno de interacción de redes sociales, es extremadamente importante para el entendimiento de la opinión pública, para el mercadeo de productos, para la difusión de cultura, noticias, etc. representa un terreno interesante para estudios sociológicos y antropológicos.
Material Adicional
Para aquellos más cercanos a los números y estadísticas, las simulaciones las programé en python, y podrán encontrar el código en este notebook link.
Director Escuela de Sistemas Inteligentes
Universidad CENFOTEC