El sentimiento de Bogotá durante el Covid-19: Monitoreo en tiempo real de la pandemia en Twitter


Photo by Tengyart on Unsplash


En Aleph monitoreamos entre el 22 de marzo y el 4 de abril todos los tweets que hablaron de Bogotá. Nuestra inteligencia artificial se los leyó todos y los clasificó según su sentimiento (positivo, negativo, o neutro). Te mostramos una nube de palabras interactiva que te permite entender rápidamente qué pasó con los temas de los que habló la gente, positiva y negativamente.


Puedes filtrar por día, hora y sentimiento la nube de palabras interactiva que encuentras a continuación. Si tocas una de las palabras te mostrará tweets (con los filtros que seleccionaste) que tienen estas palabras. De esta manera podrás entender rápidamente porqué la gente está molesta o feliz por algún tema en particular.


Fianalmente, podrás ver el sentimiento acumulado y filtrarlo por días y horas. También podrás ver el comportamiento entre horas para que de esta manera puedas hacerte una idea de la evolución de los sentimientos de los bogotanos en el tiempo.



Esperamos que esta herramienta sirva como un sistema de alertas tempranas durante la pandemia.


Feliz teletrabajo :)

El algoritmo de clasificación de sentimientos es el resultado de técnicas aplicadas de machine learning, en donde el computador aprende cuáles son las palabras que mejor predicen un sentimiento positivo, negativo o neutro.


En otras palabras, se parte de una base de datos de textos en español; cada texto tiene un sentimiento asociado: positivo, negativo o neutro que ha sido clasificado manualmente. Con esta base de datos se hace un ejercicio de ciencia de datos, aplicando una serie de algoritmos que aprenden (Naive Bayes, Random Forest, Support Vector Machines, Neural Networks, etc) sobre el 70% de los datos para que aprendan de estos. Una vez que los algoritmos han aprendido intentan predecir el 30% de los datos restantes y se calcula qué tan bien los predijeron. Nos quedamos con el mejor predictor y después lo utilizamos para clasificar los tweets.