Análisis de sentimiento en tweets de fútbol argentino

Autores
Ferreyra, Mario Ezequiel
Año de publicación
2021
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Luque, Franco Martín
Descripción
Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021.
Fil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
En la actualidad la cantidad de datos que se genera en las redes sociales es gigantesca. Aquı́ es donde los sistemas de Análisis de Sentimiento resultan de gran utilidad, ya que su principal objetivo es identificar opiniones positivas o negativas en los textos de los usuarios sobre algún producto o marca. Para la construcción de sistemas de Análisis de Sentimiento se utilizan conjuntos de datos anotados con polaridad. Sin embargo, los recursos disponibles para el idioma español son limitados, particularmente para el castellano de Argentina a donde prácticamente no existen. En este trabajo construimos un corpus de tweets en español de Argentina orientado al tópico del Fútbol Argentino. Para ello se recolectó una gran cantidad de tweets, que luego pasó por etapas de filtrado y anotación realizada por voluntarios, aplicando criterios claros y explı́citos definidos por nosotros. Luego, diseñamos e implementamos distintos sistemas de clasificación de sentimiento, usando técnicas estándar de preprocesamiento, recursos lingüı́sticos y distintas representaciones de los tweet. Realizamos experimentos utilizando para entrenar y evaluar el corpus de nuestra creación, ası́ como también otros corpus en español previamente existentes. Finalmente hicimos un análisis de los modelos y de los resultados de la evaluación.
Currently the amount of data generated on social networks is gigantic. This is where Sentiment Analysis systems are very useful, since their main objective is to identify positive or negative opinions in users’ texts about a product or brand. For the construction of Sentiment Analysis systems, datasets annotated with polarity are used. However, the resources available for the Spanish language are limited, particularly for the Castilian of Argentina where they practically do not exist. In this work we build a corpus of tweets in Spanish from Argentina oriented to the topic of Argentine Soccer. For this, a large number of tweets were collected, which then went through filtering and annotation stages carried out by volunteers, applying clear and explicit criteria defined by us. Then, we designed and implemented different sentiment classification systems, using standard preprocessing techniques, language resources, and different representations of tweets. We carry out experiments using the corpus of our creation, as well as previously existing Spanish corpora, for training and evaluation. Finally we did an analysis of the models and the evaluation results.
publishedVersion
Fil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia
Inteligencia artificial
Procesamiento de lenguaje natural
Análisis de sentimiento
Español de Argentina
Recursos Lingüísticos
Natural language processing
Artificial intelligence
Sentiment analysis
Linguistic resources
Twitter
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/18384

id RDUUNC_51ae35daebd7720032dcd0642f3f476d
oai_identifier_str oai:rdu.unc.edu.ar:11086/18384
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Análisis de sentimiento en tweets de fútbol argentinoFerreyra, Mario EzequielInteligencia artificialProcesamiento de lenguaje naturalAnálisis de sentimientoEspañol de ArgentinaRecursos LingüísticosNatural language processingArtificial intelligenceSentiment analysisLinguistic resourcesTwitterTesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021.Fil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.En la actualidad la cantidad de datos que se genera en las redes sociales es gigantesca. Aquı́ es donde los sistemas de Análisis de Sentimiento resultan de gran utilidad, ya que su principal objetivo es identificar opiniones positivas o negativas en los textos de los usuarios sobre algún producto o marca. Para la construcción de sistemas de Análisis de Sentimiento se utilizan conjuntos de datos anotados con polaridad. Sin embargo, los recursos disponibles para el idioma español son limitados, particularmente para el castellano de Argentina a donde prácticamente no existen. En este trabajo construimos un corpus de tweets en español de Argentina orientado al tópico del Fútbol Argentino. Para ello se recolectó una gran cantidad de tweets, que luego pasó por etapas de filtrado y anotación realizada por voluntarios, aplicando criterios claros y explı́citos definidos por nosotros. Luego, diseñamos e implementamos distintos sistemas de clasificación de sentimiento, usando técnicas estándar de preprocesamiento, recursos lingüı́sticos y distintas representaciones de los tweet. Realizamos experimentos utilizando para entrenar y evaluar el corpus de nuestra creación, ası́ como también otros corpus en español previamente existentes. Finalmente hicimos un análisis de los modelos y de los resultados de la evaluación.Currently the amount of data generated on social networks is gigantic. This is where Sentiment Analysis systems are very useful, since their main objective is to identify positive or negative opinions in users’ texts about a product or brand. For the construction of Sentiment Analysis systems, datasets annotated with polarity are used. However, the resources available for the Spanish language are limited, particularly for the Castilian of Argentina where they practically do not exist. In this work we build a corpus of tweets in Spanish from Argentina oriented to the topic of Argentine Soccer. For this, a large number of tweets were collected, which then went through filtering and annotation stages carried out by volunteers, applying clear and explicit criteria defined by us. Then, we designed and implemented different sentiment classification systems, using standard preprocessing techniques, language resources, and different representations of tweets. We carry out experiments using the corpus of our creation, as well as previously existing Spanish corpora, for training and evaluation. Finally we did an analysis of the models and the evaluation results.publishedVersionFil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Luque, Franco Martín2021info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/18384spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-10-23T11:15:46Zoai:rdu.unc.edu.ar:11086/18384Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-10-23 11:15:46.985Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Análisis de sentimiento en tweets de fútbol argentino
title Análisis de sentimiento en tweets de fútbol argentino
spellingShingle Análisis de sentimiento en tweets de fútbol argentino
Ferreyra, Mario Ezequiel
Inteligencia artificial
Procesamiento de lenguaje natural
Análisis de sentimiento
Español de Argentina
Recursos Lingüísticos
Natural language processing
Artificial intelligence
Sentiment analysis
Linguistic resources
Twitter
title_short Análisis de sentimiento en tweets de fútbol argentino
title_full Análisis de sentimiento en tweets de fútbol argentino
title_fullStr Análisis de sentimiento en tweets de fútbol argentino
title_full_unstemmed Análisis de sentimiento en tweets de fútbol argentino
title_sort Análisis de sentimiento en tweets de fútbol argentino
dc.creator.none.fl_str_mv Ferreyra, Mario Ezequiel
author Ferreyra, Mario Ezequiel
author_facet Ferreyra, Mario Ezequiel
author_role author
dc.contributor.none.fl_str_mv Luque, Franco Martín
dc.subject.none.fl_str_mv Inteligencia artificial
Procesamiento de lenguaje natural
Análisis de sentimiento
Español de Argentina
Recursos Lingüísticos
Natural language processing
Artificial intelligence
Sentiment analysis
Linguistic resources
Twitter
topic Inteligencia artificial
Procesamiento de lenguaje natural
Análisis de sentimiento
Español de Argentina
Recursos Lingüísticos
Natural language processing
Artificial intelligence
Sentiment analysis
Linguistic resources
Twitter
dc.description.none.fl_txt_mv Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021.
Fil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
En la actualidad la cantidad de datos que se genera en las redes sociales es gigantesca. Aquı́ es donde los sistemas de Análisis de Sentimiento resultan de gran utilidad, ya que su principal objetivo es identificar opiniones positivas o negativas en los textos de los usuarios sobre algún producto o marca. Para la construcción de sistemas de Análisis de Sentimiento se utilizan conjuntos de datos anotados con polaridad. Sin embargo, los recursos disponibles para el idioma español son limitados, particularmente para el castellano de Argentina a donde prácticamente no existen. En este trabajo construimos un corpus de tweets en español de Argentina orientado al tópico del Fútbol Argentino. Para ello se recolectó una gran cantidad de tweets, que luego pasó por etapas de filtrado y anotación realizada por voluntarios, aplicando criterios claros y explı́citos definidos por nosotros. Luego, diseñamos e implementamos distintos sistemas de clasificación de sentimiento, usando técnicas estándar de preprocesamiento, recursos lingüı́sticos y distintas representaciones de los tweet. Realizamos experimentos utilizando para entrenar y evaluar el corpus de nuestra creación, ası́ como también otros corpus en español previamente existentes. Finalmente hicimos un análisis de los modelos y de los resultados de la evaluación.
Currently the amount of data generated on social networks is gigantic. This is where Sentiment Analysis systems are very useful, since their main objective is to identify positive or negative opinions in users’ texts about a product or brand. For the construction of Sentiment Analysis systems, datasets annotated with polarity are used. However, the resources available for the Spanish language are limited, particularly for the Castilian of Argentina where they practically do not exist. In this work we build a corpus of tweets in Spanish from Argentina oriented to the topic of Argentine Soccer. For this, a large number of tweets were collected, which then went through filtering and annotation stages carried out by volunteers, applying clear and explicit criteria defined by us. Then, we designed and implemented different sentiment classification systems, using standard preprocessing techniques, language resources, and different representations of tweets. We carry out experiments using the corpus of our creation, as well as previously existing Spanish corpora, for training and evaluation. Finally we did an analysis of the models and the evaluation results.
publishedVersion
Fil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021.
publishDate 2021
dc.date.none.fl_str_mv 2021
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/18384
url http://hdl.handle.net/11086/18384
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1846785236148420608
score 12.982451