ABSTRACT Sentiment analysis or opinion mining is a branch of computing that allows analyzing opinions, feelings and emotions in certain areas of social interest such as products, services, organizations, companies, events and topics of current interest. In this sense, the objective of this paper was to identify the feelings and topics present in the tweets mentioning the Cuban vaccines Soberana 02 and Abdala on Twitter social network. The programming languages Python and R with their specific libraries for data science were chosen. The first part of the study, which ranged from web scraping to the quantification of the most used words, was carried out with Python and the libraries tweepy, pandas, re, nltk and matplotlib. While the second, which was the sentiment analysis and topic detection, was implemented with R and used tokenizers, tm, syuzhet, topic modeling, tidyverse, barplot, and wordcloud. It was obtained that among the terms with which there is more dialogue on Twitter are doses, vaccines, efficacy, Cubans, candidates, millions, country, people, received and population. In the tweets, the predominant emotions were fear and confidence, slightly above it; in the polarity, the positive one predominated, as an expression of the lived context in which the vaccination campaign was developed. A consensus can be perceived around the vaccines Soberana 02 and Abdala, from the identified topics and the terms that were related to the predominant emotions, as well as the polarity.
RESUMEN El análisis de sentimientos o minería de opiniones es una rama de la computación que permite analizar opiniones, sentimientos y emociones en ciertas áreas de interés social como productos, servicios, organizaciones, compañías, eventos y temas de interés actual. En tal sentido se propuso identificar los sentimientos y tópicos presentes en los tweets que hicieron mención a las vacunas cubanas Soberana 02 y Abdala en la red social Twitter. Se optó por los lenguajes de programación Python y R con sus librerías específicas para la ciencia de datos. La primera parte del estudio, que abarcó desde el web scraping hasta la cuantificación de las palabras más usadas, se realizó con Python y las siguientes librerías: tweepy, pandas, re, nltk y matplotlib. Mientras que la segunda, que fue la del análisis de sentimientos y detección de tópicos, se implementó con R y se utilizó: tokenizers, tm, syuzhet, topic modeling, tidyverse, barplot y wordcloud. Se obtuvo que entre los términos con que más se dialoga en Twitter están dosis, vacunas, eficacia, cubanos, candidatos, millones, país, personas, recibido y población. En los tweets las emociones predominantes fueron el miedo y, ligeramente por encima, la confianza; en la polaridad predominó la positiva, como expresión del contexto vivido en el cual se desarrolló la campaña de vacunación. A partir de los tópicos identificados y los términos que se relacionaron con las emociones predominantes, así como por la polaridad, se aprecia consenso en torno a las vacunas Soberana 02 y Abdala.