Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia

Autores
Iguaran Fernández, Juan José
Año de publicación
2023
Idioma
español castellano
Tipo de recurso
tesis de maestría
Estado
versión publicada
Colaborador/a o director/a de tesis
Pérez, Juan Manuel
Descripción
El estudio de Twitter como medio para el análisis de fenómenos sociales mediante técnicas de procesamiento del lenguaje natural (NLP) ha generado gran interés en los últimos años debido a la disponibilidad de grandes cantidades de datos en un ambiente relativamente espontáneo. Dentro de estas técnicas, la detección de emociones en el texto es especialmente relevante, ya que permite identificar la respuesta subjetiva de las personas ante los distintos eventos sociales presentados. Los modelos de lenguaje basados en redes neuronales, como los Transformers y específicamente BERT, han reemplazado las técnicas tradicionales de NLP debido a su capacidad para capturar el sentido y las relaciones entre las palabras en el texto. Sin embargo, en español hay pocos estudios de detección de emociones en redes sociales y ninguno que utilice modelos de lenguaje basados en Transformers en un contexto político. El objetivo del trabajo fue utilizar modelos basados en BERT para detectar emociones en Twitter durante las elecciones presidenciales de Colombia en 2022, etiquetando manualmente un conjunto de tweets y realizando experimentos de clasificación con modelos pre-entrenados en español. Los resultados de predicción de los modelos sirvieron para analizar las respuestas emocionales de los usuarios, asociando los tweets a sectores políticos, así como la variación temporal. Se encontró una mayor presencia de las emociones asco y alegría en los tweets etiquetados manualmente, lo que resultó en un mejor rendimiento de los modelos en tweets etiquetados con estas emociones. Además, el modelo RoBERTuito se destacó en su desempeño en todas las emociones debido a su pre entrenamiento específico para tweets en español. También se observó que los tweets asociados a la derecha expresaba más asco, mientras que aquellos asociados a la izquierda mostraban más alegría, y que los días con eventos políticos relevantes generaban más etiquetas emocionales.
The study of Twitter as a means for analyzing social phenomena through natural language processing (NLP) techniques has generated great interest in recent years due to the availability of large amounts of data in a relatively spontaneous environment. Within these techniques, emotion detection in text is particularly relevant as it allows for identifying the subjective response of individuals to different social events presented. Language models based on neural networks, such as Transformers and specifically BERT, have replaced traditional NLP techniques due to their ability to capture the meaning and relationships between words in text. However, there are few studies on emotion detection in Spanish social networks and none that use language models based on Transformers in a political context. The objective of the study was to use BERT-based models to detect emotions on Twitter during the 2022 Colombian presidential elections, manually labeling a set of tweets and conducting classification experiments with pre-trained models in Spanish. The prediction results of the models were used to analyze users’ emotional responses, associating tweets with political sectors as well as temporal variation. A higher presence of emotions such as disgust and joy was found in manually labeled tweets, resulting in better model performance on tweets labeled with these emotions. Additionally, the RoBERTuito model stood out in its performance on all emotions due to its specific pre-training for Spanish tweets. It was also observed that tweets associated with the right expressed more disgust, while those associated with the left showed more joy, and that days with relevant political events generated more emotional labels.
Fil: Iguaran Fernández, Juan José. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
BERT
NLP
COLOMBIA
ELECCIONES
DETECCION DE EMOCIONES
BERT
NLP
COLOMBIA
ELECTIONS
EMOTION IDENTIFICATION
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n7536_IguaranFernandez

id BDUBAFCEN_9d715a8c66b04739658873e436054fa4
oai_identifier_str tesis:tesis_n7536_IguaranFernandez
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Identificación de emociones en Twitter durante el proceso electoral de 2022 en ColombiaEmotion identification on twitter during the 2022 electoral process in ColombiaIguaran Fernández, Juan JoséBERTNLPCOLOMBIAELECCIONESDETECCION DE EMOCIONESBERTNLPCOLOMBIAELECTIONSEMOTION IDENTIFICATIONEl estudio de Twitter como medio para el análisis de fenómenos sociales mediante técnicas de procesamiento del lenguaje natural (NLP) ha generado gran interés en los últimos años debido a la disponibilidad de grandes cantidades de datos en un ambiente relativamente espontáneo. Dentro de estas técnicas, la detección de emociones en el texto es especialmente relevante, ya que permite identificar la respuesta subjetiva de las personas ante los distintos eventos sociales presentados. Los modelos de lenguaje basados en redes neuronales, como los Transformers y específicamente BERT, han reemplazado las técnicas tradicionales de NLP debido a su capacidad para capturar el sentido y las relaciones entre las palabras en el texto. Sin embargo, en español hay pocos estudios de detección de emociones en redes sociales y ninguno que utilice modelos de lenguaje basados en Transformers en un contexto político. El objetivo del trabajo fue utilizar modelos basados en BERT para detectar emociones en Twitter durante las elecciones presidenciales de Colombia en 2022, etiquetando manualmente un conjunto de tweets y realizando experimentos de clasificación con modelos pre-entrenados en español. Los resultados de predicción de los modelos sirvieron para analizar las respuestas emocionales de los usuarios, asociando los tweets a sectores políticos, así como la variación temporal. Se encontró una mayor presencia de las emociones asco y alegría en los tweets etiquetados manualmente, lo que resultó en un mejor rendimiento de los modelos en tweets etiquetados con estas emociones. Además, el modelo RoBERTuito se destacó en su desempeño en todas las emociones debido a su pre entrenamiento específico para tweets en español. También se observó que los tweets asociados a la derecha expresaba más asco, mientras que aquellos asociados a la izquierda mostraban más alegría, y que los días con eventos políticos relevantes generaban más etiquetas emocionales.The study of Twitter as a means for analyzing social phenomena through natural language processing (NLP) techniques has generated great interest in recent years due to the availability of large amounts of data in a relatively spontaneous environment. Within these techniques, emotion detection in text is particularly relevant as it allows for identifying the subjective response of individuals to different social events presented. Language models based on neural networks, such as Transformers and specifically BERT, have replaced traditional NLP techniques due to their ability to capture the meaning and relationships between words in text. However, there are few studies on emotion detection in Spanish social networks and none that use language models based on Transformers in a political context. The objective of the study was to use BERT-based models to detect emotions on Twitter during the 2022 Colombian presidential elections, manually labeling a set of tweets and conducting classification experiments with pre-trained models in Spanish. The prediction results of the models were used to analyze users’ emotional responses, associating tweets with political sectors as well as temporal variation. A higher presence of emotions such as disgust and joy was found in manually labeled tweets, resulting in better model performance on tweets labeled with these emotions. Additionally, the RoBERTuito model stood out in its performance on all emotions due to its specific pre-training for Spanish tweets. It was also observed that tweets associated with the right expressed more disgust, while those associated with the left showed more joy, and that days with relevant political events generated more emotional labels.Fil: Iguaran Fernández, Juan José. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesPérez, Juan Manuel2023-11-28info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n7536_IguaranFernandezspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-04T09:45:42Ztesis:tesis_n7536_IguaranFernandezInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-04 09:45:44.133Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
Emotion identification on twitter during the 2022 electoral process in Colombia
title Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
spellingShingle Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
Iguaran Fernández, Juan José
BERT
NLP
COLOMBIA
ELECCIONES
DETECCION DE EMOCIONES
BERT
NLP
COLOMBIA
ELECTIONS
EMOTION IDENTIFICATION
title_short Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
title_full Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
title_fullStr Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
title_full_unstemmed Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
title_sort Identificación de emociones en Twitter durante el proceso electoral de 2022 en Colombia
dc.creator.none.fl_str_mv Iguaran Fernández, Juan José
author Iguaran Fernández, Juan José
author_facet Iguaran Fernández, Juan José
author_role author
dc.contributor.none.fl_str_mv Pérez, Juan Manuel
dc.subject.none.fl_str_mv BERT
NLP
COLOMBIA
ELECCIONES
DETECCION DE EMOCIONES
BERT
NLP
COLOMBIA
ELECTIONS
EMOTION IDENTIFICATION
topic BERT
NLP
COLOMBIA
ELECCIONES
DETECCION DE EMOCIONES
BERT
NLP
COLOMBIA
ELECTIONS
EMOTION IDENTIFICATION
dc.description.none.fl_txt_mv El estudio de Twitter como medio para el análisis de fenómenos sociales mediante técnicas de procesamiento del lenguaje natural (NLP) ha generado gran interés en los últimos años debido a la disponibilidad de grandes cantidades de datos en un ambiente relativamente espontáneo. Dentro de estas técnicas, la detección de emociones en el texto es especialmente relevante, ya que permite identificar la respuesta subjetiva de las personas ante los distintos eventos sociales presentados. Los modelos de lenguaje basados en redes neuronales, como los Transformers y específicamente BERT, han reemplazado las técnicas tradicionales de NLP debido a su capacidad para capturar el sentido y las relaciones entre las palabras en el texto. Sin embargo, en español hay pocos estudios de detección de emociones en redes sociales y ninguno que utilice modelos de lenguaje basados en Transformers en un contexto político. El objetivo del trabajo fue utilizar modelos basados en BERT para detectar emociones en Twitter durante las elecciones presidenciales de Colombia en 2022, etiquetando manualmente un conjunto de tweets y realizando experimentos de clasificación con modelos pre-entrenados en español. Los resultados de predicción de los modelos sirvieron para analizar las respuestas emocionales de los usuarios, asociando los tweets a sectores políticos, así como la variación temporal. Se encontró una mayor presencia de las emociones asco y alegría en los tweets etiquetados manualmente, lo que resultó en un mejor rendimiento de los modelos en tweets etiquetados con estas emociones. Además, el modelo RoBERTuito se destacó en su desempeño en todas las emociones debido a su pre entrenamiento específico para tweets en español. También se observó que los tweets asociados a la derecha expresaba más asco, mientras que aquellos asociados a la izquierda mostraban más alegría, y que los días con eventos políticos relevantes generaban más etiquetas emocionales.
The study of Twitter as a means for analyzing social phenomena through natural language processing (NLP) techniques has generated great interest in recent years due to the availability of large amounts of data in a relatively spontaneous environment. Within these techniques, emotion detection in text is particularly relevant as it allows for identifying the subjective response of individuals to different social events presented. Language models based on neural networks, such as Transformers and specifically BERT, have replaced traditional NLP techniques due to their ability to capture the meaning and relationships between words in text. However, there are few studies on emotion detection in Spanish social networks and none that use language models based on Transformers in a political context. The objective of the study was to use BERT-based models to detect emotions on Twitter during the 2022 Colombian presidential elections, manually labeling a set of tweets and conducting classification experiments with pre-trained models in Spanish. The prediction results of the models were used to analyze users’ emotional responses, associating tweets with political sectors as well as temporal variation. A higher presence of emotions such as disgust and joy was found in manually labeled tweets, resulting in better model performance on tweets labeled with these emotions. Additionally, the RoBERTuito model stood out in its performance on all emotions due to its specific pre-training for Spanish tweets. It was also observed that tweets associated with the right expressed more disgust, while those associated with the left showed more joy, and that days with relevant political events generated more emotional labels.
Fil: Iguaran Fernández, Juan José. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description El estudio de Twitter como medio para el análisis de fenómenos sociales mediante técnicas de procesamiento del lenguaje natural (NLP) ha generado gran interés en los últimos años debido a la disponibilidad de grandes cantidades de datos en un ambiente relativamente espontáneo. Dentro de estas técnicas, la detección de emociones en el texto es especialmente relevante, ya que permite identificar la respuesta subjetiva de las personas ante los distintos eventos sociales presentados. Los modelos de lenguaje basados en redes neuronales, como los Transformers y específicamente BERT, han reemplazado las técnicas tradicionales de NLP debido a su capacidad para capturar el sentido y las relaciones entre las palabras en el texto. Sin embargo, en español hay pocos estudios de detección de emociones en redes sociales y ninguno que utilice modelos de lenguaje basados en Transformers en un contexto político. El objetivo del trabajo fue utilizar modelos basados en BERT para detectar emociones en Twitter durante las elecciones presidenciales de Colombia en 2022, etiquetando manualmente un conjunto de tweets y realizando experimentos de clasificación con modelos pre-entrenados en español. Los resultados de predicción de los modelos sirvieron para analizar las respuestas emocionales de los usuarios, asociando los tweets a sectores políticos, así como la variación temporal. Se encontró una mayor presencia de las emociones asco y alegría en los tweets etiquetados manualmente, lo que resultó en un mejor rendimiento de los modelos en tweets etiquetados con estas emociones. Además, el modelo RoBERTuito se destacó en su desempeño en todas las emociones debido a su pre entrenamiento específico para tweets en español. También se observó que los tweets asociados a la derecha expresaba más asco, mientras que aquellos asociados a la izquierda mostraban más alegría, y que los días con eventos políticos relevantes generaban más etiquetas emocionales.
publishDate 2023
dc.date.none.fl_str_mv 2023-11-28
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_bdcc
info:ar-repo/semantics/tesisDeMaestria
format masterThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n7536_IguaranFernandez
url https://hdl.handle.net/20.500.12110/tesis_n7536_IguaranFernandez
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1842340663645962240
score 12.623145