Análisis de sentimiento en tweets de fútbol argentino
- Autores
- Ferreyra, Mario Ezequiel
- Año de publicación
- 2021
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Luque, Franco Martín
- Descripción
- Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021.
Fil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
En la actualidad la cantidad de datos que se genera en las redes sociales es gigantesca. Aquı́ es donde los sistemas de Análisis de Sentimiento resultan de gran utilidad, ya que su principal objetivo es identificar opiniones positivas o negativas en los textos de los usuarios sobre algún producto o marca. Para la construcción de sistemas de Análisis de Sentimiento se utilizan conjuntos de datos anotados con polaridad. Sin embargo, los recursos disponibles para el idioma español son limitados, particularmente para el castellano de Argentina a donde prácticamente no existen. En este trabajo construimos un corpus de tweets en español de Argentina orientado al tópico del Fútbol Argentino. Para ello se recolectó una gran cantidad de tweets, que luego pasó por etapas de filtrado y anotación realizada por voluntarios, aplicando criterios claros y explı́citos definidos por nosotros. Luego, diseñamos e implementamos distintos sistemas de clasificación de sentimiento, usando técnicas estándar de preprocesamiento, recursos lingüı́sticos y distintas representaciones de los tweet. Realizamos experimentos utilizando para entrenar y evaluar el corpus de nuestra creación, ası́ como también otros corpus en español previamente existentes. Finalmente hicimos un análisis de los modelos y de los resultados de la evaluación.
Currently the amount of data generated on social networks is gigantic. This is where Sentiment Analysis systems are very useful, since their main objective is to identify positive or negative opinions in users’ texts about a product or brand. For the construction of Sentiment Analysis systems, datasets annotated with polarity are used. However, the resources available for the Spanish language are limited, particularly for the Castilian of Argentina where they practically do not exist. In this work we build a corpus of tweets in Spanish from Argentina oriented to the topic of Argentine Soccer. For this, a large number of tweets were collected, which then went through filtering and annotation stages carried out by volunteers, applying clear and explicit criteria defined by us. Then, we designed and implemented different sentiment classification systems, using standard preprocessing techniques, language resources, and different representations of tweets. We carry out experiments using the corpus of our creation, as well as previously existing Spanish corpora, for training and evaluation. Finally we did an analysis of the models and the evaluation results.
publishedVersion
Fil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. - Materia
-
Inteligencia artificial
Procesamiento de lenguaje natural
Análisis de sentimiento
Español de Argentina
Recursos Lingüísticos
Natural language processing
Artificial intelligence
Sentiment analysis
Linguistic resources
Twitter - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- Repositorio
.jpg)
- Institución
- Universidad Nacional de Córdoba
- OAI Identificador
- oai:rdu.unc.edu.ar:11086/18384
Ver los metadatos del registro completo
| id |
RDUUNC_51ae35daebd7720032dcd0642f3f476d |
|---|---|
| oai_identifier_str |
oai:rdu.unc.edu.ar:11086/18384 |
| network_acronym_str |
RDUUNC |
| repository_id_str |
2572 |
| network_name_str |
Repositorio Digital Universitario (UNC) |
| spelling |
Análisis de sentimiento en tweets de fútbol argentinoFerreyra, Mario EzequielInteligencia artificialProcesamiento de lenguaje naturalAnálisis de sentimientoEspañol de ArgentinaRecursos LingüísticosNatural language processingArtificial intelligenceSentiment analysisLinguistic resourcesTwitterTesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021.Fil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.En la actualidad la cantidad de datos que se genera en las redes sociales es gigantesca. Aquı́ es donde los sistemas de Análisis de Sentimiento resultan de gran utilidad, ya que su principal objetivo es identificar opiniones positivas o negativas en los textos de los usuarios sobre algún producto o marca. Para la construcción de sistemas de Análisis de Sentimiento se utilizan conjuntos de datos anotados con polaridad. Sin embargo, los recursos disponibles para el idioma español son limitados, particularmente para el castellano de Argentina a donde prácticamente no existen. En este trabajo construimos un corpus de tweets en español de Argentina orientado al tópico del Fútbol Argentino. Para ello se recolectó una gran cantidad de tweets, que luego pasó por etapas de filtrado y anotación realizada por voluntarios, aplicando criterios claros y explı́citos definidos por nosotros. Luego, diseñamos e implementamos distintos sistemas de clasificación de sentimiento, usando técnicas estándar de preprocesamiento, recursos lingüı́sticos y distintas representaciones de los tweet. Realizamos experimentos utilizando para entrenar y evaluar el corpus de nuestra creación, ası́ como también otros corpus en español previamente existentes. Finalmente hicimos un análisis de los modelos y de los resultados de la evaluación.Currently the amount of data generated on social networks is gigantic. This is where Sentiment Analysis systems are very useful, since their main objective is to identify positive or negative opinions in users’ texts about a product or brand. For the construction of Sentiment Analysis systems, datasets annotated with polarity are used. However, the resources available for the Spanish language are limited, particularly for the Castilian of Argentina where they practically do not exist. In this work we build a corpus of tweets in Spanish from Argentina oriented to the topic of Argentine Soccer. For this, a large number of tweets were collected, which then went through filtering and annotation stages carried out by volunteers, applying clear and explicit criteria defined by us. Then, we designed and implemented different sentiment classification systems, using standard preprocessing techniques, language resources, and different representations of tweets. We carry out experiments using the corpus of our creation, as well as previously existing Spanish corpora, for training and evaluation. Finally we did an analysis of the models and the evaluation results.publishedVersionFil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Luque, Franco Martín2021info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/18384spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-10-23T11:15:46Zoai:rdu.unc.edu.ar:11086/18384Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-10-23 11:15:46.985Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse |
| dc.title.none.fl_str_mv |
Análisis de sentimiento en tweets de fútbol argentino |
| title |
Análisis de sentimiento en tweets de fútbol argentino |
| spellingShingle |
Análisis de sentimiento en tweets de fútbol argentino Ferreyra, Mario Ezequiel Inteligencia artificial Procesamiento de lenguaje natural Análisis de sentimiento Español de Argentina Recursos Lingüísticos Natural language processing Artificial intelligence Sentiment analysis Linguistic resources |
| title_short |
Análisis de sentimiento en tweets de fútbol argentino |
| title_full |
Análisis de sentimiento en tweets de fútbol argentino |
| title_fullStr |
Análisis de sentimiento en tweets de fútbol argentino |
| title_full_unstemmed |
Análisis de sentimiento en tweets de fútbol argentino |
| title_sort |
Análisis de sentimiento en tweets de fútbol argentino |
| dc.creator.none.fl_str_mv |
Ferreyra, Mario Ezequiel |
| author |
Ferreyra, Mario Ezequiel |
| author_facet |
Ferreyra, Mario Ezequiel |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Luque, Franco Martín |
| dc.subject.none.fl_str_mv |
Inteligencia artificial Procesamiento de lenguaje natural Análisis de sentimiento Español de Argentina Recursos Lingüísticos Natural language processing Artificial intelligence Sentiment analysis Linguistic resources |
| topic |
Inteligencia artificial Procesamiento de lenguaje natural Análisis de sentimiento Español de Argentina Recursos Lingüísticos Natural language processing Artificial intelligence Sentiment analysis Linguistic resources |
| dc.description.none.fl_txt_mv |
Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021. Fil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. En la actualidad la cantidad de datos que se genera en las redes sociales es gigantesca. Aquı́ es donde los sistemas de Análisis de Sentimiento resultan de gran utilidad, ya que su principal objetivo es identificar opiniones positivas o negativas en los textos de los usuarios sobre algún producto o marca. Para la construcción de sistemas de Análisis de Sentimiento se utilizan conjuntos de datos anotados con polaridad. Sin embargo, los recursos disponibles para el idioma español son limitados, particularmente para el castellano de Argentina a donde prácticamente no existen. En este trabajo construimos un corpus de tweets en español de Argentina orientado al tópico del Fútbol Argentino. Para ello se recolectó una gran cantidad de tweets, que luego pasó por etapas de filtrado y anotación realizada por voluntarios, aplicando criterios claros y explı́citos definidos por nosotros. Luego, diseñamos e implementamos distintos sistemas de clasificación de sentimiento, usando técnicas estándar de preprocesamiento, recursos lingüı́sticos y distintas representaciones de los tweet. Realizamos experimentos utilizando para entrenar y evaluar el corpus de nuestra creación, ası́ como también otros corpus en español previamente existentes. Finalmente hicimos un análisis de los modelos y de los resultados de la evaluación. Currently the amount of data generated on social networks is gigantic. This is where Sentiment Analysis systems are very useful, since their main objective is to identify positive or negative opinions in users’ texts about a product or brand. For the construction of Sentiment Analysis systems, datasets annotated with polarity are used. However, the resources available for the Spanish language are limited, particularly for the Castilian of Argentina where they practically do not exist. In this work we build a corpus of tweets in Spanish from Argentina oriented to the topic of Argentine Soccer. For this, a large number of tweets were collected, which then went through filtering and annotation stages carried out by volunteers, applying clear and explicit criteria defined by us. Then, we designed and implemented different sentiment classification systems, using standard preprocessing techniques, language resources, and different representations of tweets. We carry out experiments using the corpus of our creation, as well as previously existing Spanish corpora, for training and evaluation. Finally we did an analysis of the models and the evaluation results. publishedVersion Fil: Ferreyra, Mario Ezequiel. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. |
| description |
Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11086/18384 |
| url |
http://hdl.handle.net/11086/18384 |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC |
| reponame_str |
Repositorio Digital Universitario (UNC) |
| collection |
Repositorio Digital Universitario (UNC) |
| instname_str |
Universidad Nacional de Córdoba |
| instacron_str |
UNC |
| institution |
UNC |
| repository.name.fl_str_mv |
Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba |
| repository.mail.fl_str_mv |
oca.unc@gmail.com |
| _version_ |
1846785236148420608 |
| score |
12.982451 |