Aprendizaje automático y procesamiento del lenguaje natural en la comunicación política online y las redes sociales

Autores
Albanese, Federico
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Feuerstein, Esteban Zindel
Lombardi, Leandro Ezequiel
Descripción
El presente trabajo doctoral examina las dinámicas de interacción en redes sociales y el impacto de los medios de comunicación en la formación y difusión de opiniones políticas. Utilizando técnicas de machine learning, procesamiento de lenguaje natural, análisis de grafos y estimación de impacto causal, esta investigación analiza datos de millones de usuarios y publicaciones provenientes de Twitter, Facebook, Instagram y Reddit. Hemos identificado cómo las estructuras de comunidades virtuales y los patrones de interacción contribuyen a fenómenos como la polarización política, la confirmación de sesgos y la formación de cámaras de eco. Además, hemos desarrollado una nueva metodología para la detección eficiente de tópicos en textos cortos, típicos de las redes sociales, que supera en rendimiento a las técnicas tradicionales en tareas como la detección no supervisada de tópicos y en sistemas de recomendación. Nuestros experimentos también muestran una relación causal significativa entre la cobertura mediática de ciertos temas y las variaciones en las encuestas de opinión pública durante procesos electorales. Los resultados indican que el impacto de estos temas en la opinión sobre candidatos políticos depende de su mera mención, independientemente del sesgo o sentimiento con el que se presenta el tema. Por otro lado, hemos examinado la interacción recíproca entre la agenda de temas utilizada por los medios y la utilizada por los usuarios de redes sociales, destacando cómo ambas se influencian mutuamente en la configuración de un discurso público. En términos del comportamiento de los usuarios, observamos diferencias significativas en cómo se reciben los mensajes de los políticos dependiendo de la plataforma, y cómo los usuarios cambian de comunidades políticas y de ideología cuando son ignorados dentro de una comunidad online. La presente tesis también analiza cómo la difusión de noticias con distintos sesgos políticos en comunidades cerradas refuerza la confirmación de sesgos, limita el debate de ideas diferentes y favorece la propagación de información falsa. Por último, se presenta un análisis adversarial de los sistemas de recomendación en redes sociales, mostrando la eficacia de algoritmos maliciosos como SAVAGE en escenarios donde los usuarios están distanciados dentro de la red, lo cual es crucial para entender cómo las recomendaciones de contenido pueden ser manipuladas en contextos políticos. Este estudio no solo busca ofrecer una visión clara de las interacciones en redes sociales y el impacto de los medios de comunicación en el debate político, sino que también sugiere enfoques para un análisis más efectivo y ético en la era digital.
This doctoral thesis examines the dynamics of user interaction on social media and the impact of mass media on the formation and dissemination of political opinions. Using machine learning techniques, natural language processing, graph analysis, and causal impact estimation, this research analyzes data from millions of users and posts from Twitter, Facebook, Instagram, and Reddit. We have identified how the structures of online communities and interaction patterns contribute to phenomena such as political polarization, bias confirmation, and the formation of echo chambers. Furthermore, we have developed a new methodology for the detection of topics in short texts, typical in social media, which outperforms traditional techniques in tasks such as unsupervised topic detection and recommendation systems. Our experiments also show a significant causal relationship between media coverage of certain topics and variations in public opinion polls during electoral processes. The results indicate that the impact of these topics on opinions about political candidates depends solely on their mention, regardless of the bias or sentiment with which the topic is presented. On the other hand, we have examined the reciprocal interaction between the agenda of topics used by the mass medias and the agenda used by social media users, highlighting how both mutually influence each other, shaping the public discourse. In terms of user behavior, we observe significant differences in how messages from politicians are received depending on the platform, and how users change political communities and ideologies when ignored within an online community, measured through PageRank. This thesis also analyzes how the dissemination of news with different political biases in closed communities reinforces bias confirmation, limits the debate of different ideas, and fosters the spread of fake news. Lastly, an adversarial analysis of recommendation systems in social media is presented, demonstrating the effectiveness of malicious algorithms like SAVAGE in scenarios where users are distanced within the network, which is crucial for understanding how content recommendations can be manipulated in political contexts. This study not only seeks to provide a clear view of interactions on social media and the impact of media on the political debate but also suggests approaches for a more effective and ethical analysis in the digital era.
Fil: Albanese, Federico. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
PROCESAMIENTO DEL LENGUAJE NATURAL
APRENDIZAJE AUTOMATICO
REDES SOCIALES
CIENCIAS SOCIALES COMPUTACIONALES
COMUNICACION POLITICA
NATURAL LANGUAGE PROCESSING
MACHINE LEARNING
SOCIAL MEDIA
COMPUTATIONAL SOCIAL SCIENCE
POLITICAL COMUNICATION
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n7670_Albanese

id BDUBAFCEN_fa53d1cab3b7c05a0361e1c2f1c125b7
oai_identifier_str tesis:tesis_n7670_Albanese
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Aprendizaje automático y procesamiento del lenguaje natural en la comunicación política online y las redes socialesMachine learning and natural language processing strategies for social networks and online political communicationAlbanese, FedericoPROCESAMIENTO DEL LENGUAJE NATURALAPRENDIZAJE AUTOMATICOREDES SOCIALESCIENCIAS SOCIALES COMPUTACIONALESCOMUNICACION POLITICANATURAL LANGUAGE PROCESSINGMACHINE LEARNINGSOCIAL MEDIACOMPUTATIONAL SOCIAL SCIENCEPOLITICAL COMUNICATIONEl presente trabajo doctoral examina las dinámicas de interacción en redes sociales y el impacto de los medios de comunicación en la formación y difusión de opiniones políticas. Utilizando técnicas de machine learning, procesamiento de lenguaje natural, análisis de grafos y estimación de impacto causal, esta investigación analiza datos de millones de usuarios y publicaciones provenientes de Twitter, Facebook, Instagram y Reddit. Hemos identificado cómo las estructuras de comunidades virtuales y los patrones de interacción contribuyen a fenómenos como la polarización política, la confirmación de sesgos y la formación de cámaras de eco. Además, hemos desarrollado una nueva metodología para la detección eficiente de tópicos en textos cortos, típicos de las redes sociales, que supera en rendimiento a las técnicas tradicionales en tareas como la detección no supervisada de tópicos y en sistemas de recomendación. Nuestros experimentos también muestran una relación causal significativa entre la cobertura mediática de ciertos temas y las variaciones en las encuestas de opinión pública durante procesos electorales. Los resultados indican que el impacto de estos temas en la opinión sobre candidatos políticos depende de su mera mención, independientemente del sesgo o sentimiento con el que se presenta el tema. Por otro lado, hemos examinado la interacción recíproca entre la agenda de temas utilizada por los medios y la utilizada por los usuarios de redes sociales, destacando cómo ambas se influencian mutuamente en la configuración de un discurso público. En términos del comportamiento de los usuarios, observamos diferencias significativas en cómo se reciben los mensajes de los políticos dependiendo de la plataforma, y cómo los usuarios cambian de comunidades políticas y de ideología cuando son ignorados dentro de una comunidad online. La presente tesis también analiza cómo la difusión de noticias con distintos sesgos políticos en comunidades cerradas refuerza la confirmación de sesgos, limita el debate de ideas diferentes y favorece la propagación de información falsa. Por último, se presenta un análisis adversarial de los sistemas de recomendación en redes sociales, mostrando la eficacia de algoritmos maliciosos como SAVAGE en escenarios donde los usuarios están distanciados dentro de la red, lo cual es crucial para entender cómo las recomendaciones de contenido pueden ser manipuladas en contextos políticos. Este estudio no solo busca ofrecer una visión clara de las interacciones en redes sociales y el impacto de los medios de comunicación en el debate político, sino que también sugiere enfoques para un análisis más efectivo y ético en la era digital.This doctoral thesis examines the dynamics of user interaction on social media and the impact of mass media on the formation and dissemination of political opinions. Using machine learning techniques, natural language processing, graph analysis, and causal impact estimation, this research analyzes data from millions of users and posts from Twitter, Facebook, Instagram, and Reddit. We have identified how the structures of online communities and interaction patterns contribute to phenomena such as political polarization, bias confirmation, and the formation of echo chambers. Furthermore, we have developed a new methodology for the detection of topics in short texts, typical in social media, which outperforms traditional techniques in tasks such as unsupervised topic detection and recommendation systems. Our experiments also show a significant causal relationship between media coverage of certain topics and variations in public opinion polls during electoral processes. The results indicate that the impact of these topics on opinions about political candidates depends solely on their mention, regardless of the bias or sentiment with which the topic is presented. On the other hand, we have examined the reciprocal interaction between the agenda of topics used by the mass medias and the agenda used by social media users, highlighting how both mutually influence each other, shaping the public discourse. In terms of user behavior, we observe significant differences in how messages from politicians are received depending on the platform, and how users change political communities and ideologies when ignored within an online community, measured through PageRank. This thesis also analyzes how the dissemination of news with different political biases in closed communities reinforces bias confirmation, limits the debate of different ideas, and fosters the spread of fake news. Lastly, an adversarial analysis of recommendation systems in social media is presented, demonstrating the effectiveness of malicious algorithms like SAVAGE in scenarios where users are distanced within the network, which is crucial for understanding how content recommendations can be manipulated in political contexts. This study not only seeks to provide a clear view of interactions on social media and the impact of media on the political debate but also suggests approaches for a more effective and ethical analysis in the digital era.Fil: Albanese, Federico. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesFeuerstein, Esteban ZindelLombardi, Leandro Ezequiel2024-12-10info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n7670_Albanesespainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-10-16T09:28:56Ztesis:tesis_n7670_AlbaneseInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-10-16 09:28:57.668Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Aprendizaje automático y procesamiento del lenguaje natural en la comunicación política online y las redes sociales
Machine learning and natural language processing strategies for social networks and online political communication
title Aprendizaje automático y procesamiento del lenguaje natural en la comunicación política online y las redes sociales
spellingShingle Aprendizaje automático y procesamiento del lenguaje natural en la comunicación política online y las redes sociales
Albanese, Federico
PROCESAMIENTO DEL LENGUAJE NATURAL
APRENDIZAJE AUTOMATICO
REDES SOCIALES
CIENCIAS SOCIALES COMPUTACIONALES
COMUNICACION POLITICA
NATURAL LANGUAGE PROCESSING
MACHINE LEARNING
SOCIAL MEDIA
COMPUTATIONAL SOCIAL SCIENCE
POLITICAL COMUNICATION
title_short Aprendizaje automático y procesamiento del lenguaje natural en la comunicación política online y las redes sociales
title_full Aprendizaje automático y procesamiento del lenguaje natural en la comunicación política online y las redes sociales
title_fullStr Aprendizaje automático y procesamiento del lenguaje natural en la comunicación política online y las redes sociales
title_full_unstemmed Aprendizaje automático y procesamiento del lenguaje natural en la comunicación política online y las redes sociales
title_sort Aprendizaje automático y procesamiento del lenguaje natural en la comunicación política online y las redes sociales
dc.creator.none.fl_str_mv Albanese, Federico
author Albanese, Federico
author_facet Albanese, Federico
author_role author
dc.contributor.none.fl_str_mv Feuerstein, Esteban Zindel
Lombardi, Leandro Ezequiel
dc.subject.none.fl_str_mv PROCESAMIENTO DEL LENGUAJE NATURAL
APRENDIZAJE AUTOMATICO
REDES SOCIALES
CIENCIAS SOCIALES COMPUTACIONALES
COMUNICACION POLITICA
NATURAL LANGUAGE PROCESSING
MACHINE LEARNING
SOCIAL MEDIA
COMPUTATIONAL SOCIAL SCIENCE
POLITICAL COMUNICATION
topic PROCESAMIENTO DEL LENGUAJE NATURAL
APRENDIZAJE AUTOMATICO
REDES SOCIALES
CIENCIAS SOCIALES COMPUTACIONALES
COMUNICACION POLITICA
NATURAL LANGUAGE PROCESSING
MACHINE LEARNING
SOCIAL MEDIA
COMPUTATIONAL SOCIAL SCIENCE
POLITICAL COMUNICATION
dc.description.none.fl_txt_mv El presente trabajo doctoral examina las dinámicas de interacción en redes sociales y el impacto de los medios de comunicación en la formación y difusión de opiniones políticas. Utilizando técnicas de machine learning, procesamiento de lenguaje natural, análisis de grafos y estimación de impacto causal, esta investigación analiza datos de millones de usuarios y publicaciones provenientes de Twitter, Facebook, Instagram y Reddit. Hemos identificado cómo las estructuras de comunidades virtuales y los patrones de interacción contribuyen a fenómenos como la polarización política, la confirmación de sesgos y la formación de cámaras de eco. Además, hemos desarrollado una nueva metodología para la detección eficiente de tópicos en textos cortos, típicos de las redes sociales, que supera en rendimiento a las técnicas tradicionales en tareas como la detección no supervisada de tópicos y en sistemas de recomendación. Nuestros experimentos también muestran una relación causal significativa entre la cobertura mediática de ciertos temas y las variaciones en las encuestas de opinión pública durante procesos electorales. Los resultados indican que el impacto de estos temas en la opinión sobre candidatos políticos depende de su mera mención, independientemente del sesgo o sentimiento con el que se presenta el tema. Por otro lado, hemos examinado la interacción recíproca entre la agenda de temas utilizada por los medios y la utilizada por los usuarios de redes sociales, destacando cómo ambas se influencian mutuamente en la configuración de un discurso público. En términos del comportamiento de los usuarios, observamos diferencias significativas en cómo se reciben los mensajes de los políticos dependiendo de la plataforma, y cómo los usuarios cambian de comunidades políticas y de ideología cuando son ignorados dentro de una comunidad online. La presente tesis también analiza cómo la difusión de noticias con distintos sesgos políticos en comunidades cerradas refuerza la confirmación de sesgos, limita el debate de ideas diferentes y favorece la propagación de información falsa. Por último, se presenta un análisis adversarial de los sistemas de recomendación en redes sociales, mostrando la eficacia de algoritmos maliciosos como SAVAGE en escenarios donde los usuarios están distanciados dentro de la red, lo cual es crucial para entender cómo las recomendaciones de contenido pueden ser manipuladas en contextos políticos. Este estudio no solo busca ofrecer una visión clara de las interacciones en redes sociales y el impacto de los medios de comunicación en el debate político, sino que también sugiere enfoques para un análisis más efectivo y ético en la era digital.
This doctoral thesis examines the dynamics of user interaction on social media and the impact of mass media on the formation and dissemination of political opinions. Using machine learning techniques, natural language processing, graph analysis, and causal impact estimation, this research analyzes data from millions of users and posts from Twitter, Facebook, Instagram, and Reddit. We have identified how the structures of online communities and interaction patterns contribute to phenomena such as political polarization, bias confirmation, and the formation of echo chambers. Furthermore, we have developed a new methodology for the detection of topics in short texts, typical in social media, which outperforms traditional techniques in tasks such as unsupervised topic detection and recommendation systems. Our experiments also show a significant causal relationship between media coverage of certain topics and variations in public opinion polls during electoral processes. The results indicate that the impact of these topics on opinions about political candidates depends solely on their mention, regardless of the bias or sentiment with which the topic is presented. On the other hand, we have examined the reciprocal interaction between the agenda of topics used by the mass medias and the agenda used by social media users, highlighting how both mutually influence each other, shaping the public discourse. In terms of user behavior, we observe significant differences in how messages from politicians are received depending on the platform, and how users change political communities and ideologies when ignored within an online community, measured through PageRank. This thesis also analyzes how the dissemination of news with different political biases in closed communities reinforces bias confirmation, limits the debate of different ideas, and fosters the spread of fake news. Lastly, an adversarial analysis of recommendation systems in social media is presented, demonstrating the effectiveness of malicious algorithms like SAVAGE in scenarios where users are distanced within the network, which is crucial for understanding how content recommendations can be manipulated in political contexts. This study not only seeks to provide a clear view of interactions on social media and the impact of media on the political debate but also suggests approaches for a more effective and ethical analysis in the digital era.
Fil: Albanese, Federico. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description El presente trabajo doctoral examina las dinámicas de interacción en redes sociales y el impacto de los medios de comunicación en la formación y difusión de opiniones políticas. Utilizando técnicas de machine learning, procesamiento de lenguaje natural, análisis de grafos y estimación de impacto causal, esta investigación analiza datos de millones de usuarios y publicaciones provenientes de Twitter, Facebook, Instagram y Reddit. Hemos identificado cómo las estructuras de comunidades virtuales y los patrones de interacción contribuyen a fenómenos como la polarización política, la confirmación de sesgos y la formación de cámaras de eco. Además, hemos desarrollado una nueva metodología para la detección eficiente de tópicos en textos cortos, típicos de las redes sociales, que supera en rendimiento a las técnicas tradicionales en tareas como la detección no supervisada de tópicos y en sistemas de recomendación. Nuestros experimentos también muestran una relación causal significativa entre la cobertura mediática de ciertos temas y las variaciones en las encuestas de opinión pública durante procesos electorales. Los resultados indican que el impacto de estos temas en la opinión sobre candidatos políticos depende de su mera mención, independientemente del sesgo o sentimiento con el que se presenta el tema. Por otro lado, hemos examinado la interacción recíproca entre la agenda de temas utilizada por los medios y la utilizada por los usuarios de redes sociales, destacando cómo ambas se influencian mutuamente en la configuración de un discurso público. En términos del comportamiento de los usuarios, observamos diferencias significativas en cómo se reciben los mensajes de los políticos dependiendo de la plataforma, y cómo los usuarios cambian de comunidades políticas y de ideología cuando son ignorados dentro de una comunidad online. La presente tesis también analiza cómo la difusión de noticias con distintos sesgos políticos en comunidades cerradas refuerza la confirmación de sesgos, limita el debate de ideas diferentes y favorece la propagación de información falsa. Por último, se presenta un análisis adversarial de los sistemas de recomendación en redes sociales, mostrando la eficacia de algoritmos maliciosos como SAVAGE en escenarios donde los usuarios están distanciados dentro de la red, lo cual es crucial para entender cómo las recomendaciones de contenido pueden ser manipuladas en contextos políticos. Este estudio no solo busca ofrecer una visión clara de las interacciones en redes sociales y el impacto de los medios de comunicación en el debate político, sino que también sugiere enfoques para un análisis más efectivo y ético en la era digital.
publishDate 2024
dc.date.none.fl_str_mv 2024-12-10
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n7670_Albanese
url https://hdl.handle.net/20.500.12110/tesis_n7670_Albanese
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1846142823975354368
score 12.712165