Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage
- Autores
- Salles Santos, Thiago; Brito, Mozar José; Alves Pereira, Denilson
- Año de publicación
- 2025
- Idioma
- inglés
- Tipo de recurso
- artículo
- Estado
- versión publicada
- Descripción
- Opinion mining is a natural language processing task that aims to classify user opinions expressed on ecommerce platforms, social networks and other media. It is an important tool for decision making, monitoring products/services, detecting trends, developing marketing strategies, among others. Much research has been carried out addressing opinions in the English language. The Portuguese language is still very lacking in linguistic resources aimed at training machine learning models. This work contributes to the evaluation of approaches based on the BERT language model for opinion mining in the Portuguese language, in particular, by creating and evaluating a dataset with labeled data in the domain of the beverage called Cachaça. This is a popular drink in Brazil, and of great economic importance. As a result of the experimental evaluation, the approaches based on the BERT model stood out in relation to two baselines, and in a crossdomain evaluation, they achieved values greater than 0.97 in the F1 metric for classification into 2 classes and 0.64 for 3 classes, in the dataset labeled for the cachaça beverage.
La minería de opinión es una tarea de procesamiento del lenguaje natural que busca clasificar las opiniones de los usuarios expresadas en plataformas de comercio electrónico, redes sociales y otros medios. Es una herramienta importante para la toma de decisiones, el monitoreo de productos/servicios, la detección de tendencias y el desarrollo de estrategias de marketing, entre otros. Se han realizado numerosas investigaciones sobre opiniones en inglés. El portugués aún carece de recursos lingüísticos para el entrenamiento de modelos de aprendizaje automático. Este trabajo contribuye a la evaluación de enfoques basados en el modelo lingüístico BERT para la minería de opinión en portugués, en particular mediante la creación y evaluación de un conjunto de datos etiquetados en el dominio de la cachaça. Esta bebida es popular en Brasil y de gran importancia económica. Como resultado de la evaluación experimental, los enfoques basados en el modelo BERT destacaron en relación con dos líneas base y, en una evaluación interdominio, alcanzaron valores superiores a 0,97 en la métrica F1 para la clasificación en dos clases y 0,64 para tres clases, en el conjunto de datos etiquetado para la cachaça.
Facultad de Informática - Materia
-
Ciencias Informáticas
BERT
Cachaça
Opinion Mining
Sentiment Analysis
Social Network
análisis de sentimientos
minería de opinión
redes sociales - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/186931
Ver los metadatos del registro completo
| id |
SEDICI_79e00d6522082119da84117e1ec92a3c |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/186931 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça BeverageEvaluación de enfoques basados en el modelo BERT para la minería de opinión sobre la bebida cachaçaSalles Santos, ThiagoBrito, Mozar JoséAlves Pereira, DenilsonCiencias InformáticasBERTCachaçaOpinion MiningSentiment AnalysisSocial Networkanálisis de sentimientosminería de opiniónredes socialesOpinion mining is a natural language processing task that aims to classify user opinions expressed on ecommerce platforms, social networks and other media. It is an important tool for decision making, monitoring products/services, detecting trends, developing marketing strategies, among others. Much research has been carried out addressing opinions in the English language. The Portuguese language is still very lacking in linguistic resources aimed at training machine learning models. This work contributes to the evaluation of approaches based on the BERT language model for opinion mining in the Portuguese language, in particular, by creating and evaluating a dataset with labeled data in the domain of the beverage called Cachaça. This is a popular drink in Brazil, and of great economic importance. As a result of the experimental evaluation, the approaches based on the BERT model stood out in relation to two baselines, and in a crossdomain evaluation, they achieved values greater than 0.97 in the F1 metric for classification into 2 classes and 0.64 for 3 classes, in the dataset labeled for the cachaça beverage.La minería de opinión es una tarea de procesamiento del lenguaje natural que busca clasificar las opiniones de los usuarios expresadas en plataformas de comercio electrónico, redes sociales y otros medios. Es una herramienta importante para la toma de decisiones, el monitoreo de productos/servicios, la detección de tendencias y el desarrollo de estrategias de marketing, entre otros. Se han realizado numerosas investigaciones sobre opiniones en inglés. El portugués aún carece de recursos lingüísticos para el entrenamiento de modelos de aprendizaje automático. Este trabajo contribuye a la evaluación de enfoques basados en el modelo lingüístico BERT para la minería de opinión en portugués, en particular mediante la creación y evaluación de un conjunto de datos etiquetados en el dominio de la cachaça. Esta bebida es popular en Brasil y de gran importancia económica. Como resultado de la evaluación experimental, los enfoques basados en el modelo BERT destacaron en relación con dos líneas base y, en una evaluación interdominio, alcanzaron valores superiores a 0,97 en la métrica F1 para la clasificación en dos clases y 0,64 para tres clases, en el conjunto de datos etiquetado para la cachaça.Facultad de Informática2025-10info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulohttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdf107-117http://sedici.unlp.edu.ar/handle/10915/186931enginfo:eu-repo/semantics/altIdentifier/issn/1666-6038info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.25.e09info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-11-12T11:15:39Zoai:sedici.unlp.edu.ar:10915/186931Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-11-12 11:15:39.277SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage Evaluación de enfoques basados en el modelo BERT para la minería de opinión sobre la bebida cachaça |
| title |
Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage |
| spellingShingle |
Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage Salles Santos, Thiago Ciencias Informáticas BERT Cachaça Opinion Mining Sentiment Analysis Social Network análisis de sentimientos minería de opinión redes sociales |
| title_short |
Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage |
| title_full |
Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage |
| title_fullStr |
Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage |
| title_full_unstemmed |
Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage |
| title_sort |
Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage |
| dc.creator.none.fl_str_mv |
Salles Santos, Thiago Brito, Mozar José Alves Pereira, Denilson |
| author |
Salles Santos, Thiago |
| author_facet |
Salles Santos, Thiago Brito, Mozar José Alves Pereira, Denilson |
| author_role |
author |
| author2 |
Brito, Mozar José Alves Pereira, Denilson |
| author2_role |
author author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas BERT Cachaça Opinion Mining Sentiment Analysis Social Network análisis de sentimientos minería de opinión redes sociales |
| topic |
Ciencias Informáticas BERT Cachaça Opinion Mining Sentiment Analysis Social Network análisis de sentimientos minería de opinión redes sociales |
| dc.description.none.fl_txt_mv |
Opinion mining is a natural language processing task that aims to classify user opinions expressed on ecommerce platforms, social networks and other media. It is an important tool for decision making, monitoring products/services, detecting trends, developing marketing strategies, among others. Much research has been carried out addressing opinions in the English language. The Portuguese language is still very lacking in linguistic resources aimed at training machine learning models. This work contributes to the evaluation of approaches based on the BERT language model for opinion mining in the Portuguese language, in particular, by creating and evaluating a dataset with labeled data in the domain of the beverage called Cachaça. This is a popular drink in Brazil, and of great economic importance. As a result of the experimental evaluation, the approaches based on the BERT model stood out in relation to two baselines, and in a crossdomain evaluation, they achieved values greater than 0.97 in the F1 metric for classification into 2 classes and 0.64 for 3 classes, in the dataset labeled for the cachaça beverage. La minería de opinión es una tarea de procesamiento del lenguaje natural que busca clasificar las opiniones de los usuarios expresadas en plataformas de comercio electrónico, redes sociales y otros medios. Es una herramienta importante para la toma de decisiones, el monitoreo de productos/servicios, la detección de tendencias y el desarrollo de estrategias de marketing, entre otros. Se han realizado numerosas investigaciones sobre opiniones en inglés. El portugués aún carece de recursos lingüísticos para el entrenamiento de modelos de aprendizaje automático. Este trabajo contribuye a la evaluación de enfoques basados en el modelo lingüístico BERT para la minería de opinión en portugués, en particular mediante la creación y evaluación de un conjunto de datos etiquetados en el dominio de la cachaça. Esta bebida es popular en Brasil y de gran importancia económica. Como resultado de la evaluación experimental, los enfoques basados en el modelo BERT destacaron en relación con dos líneas base y, en una evaluación interdominio, alcanzaron valores superiores a 0,97 en la métrica F1 para la clasificación en dos clases y 0,64 para tres clases, en el conjunto de datos etiquetado para la cachaça. Facultad de Informática |
| description |
Opinion mining is a natural language processing task that aims to classify user opinions expressed on ecommerce platforms, social networks and other media. It is an important tool for decision making, monitoring products/services, detecting trends, developing marketing strategies, among others. Much research has been carried out addressing opinions in the English language. The Portuguese language is still very lacking in linguistic resources aimed at training machine learning models. This work contributes to the evaluation of approaches based on the BERT language model for opinion mining in the Portuguese language, in particular, by creating and evaluating a dataset with labeled data in the domain of the beverage called Cachaça. This is a popular drink in Brazil, and of great economic importance. As a result of the experimental evaluation, the approaches based on the BERT model stood out in relation to two baselines, and in a crossdomain evaluation, they achieved values greater than 0.97 in the F1 metric for classification into 2 classes and 0.64 for 3 classes, in the dataset labeled for the cachaça beverage. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-10 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Articulo http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo |
| format |
article |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/186931 |
| url |
http://sedici.unlp.edu.ar/handle/10915/186931 |
| dc.language.none.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/issn/1666-6038 info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.25.e09 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf 107-117 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1848605864216231936 |
| score |
13.24909 |