Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage

Autores
Salles Santos, Thiago; Brito, Mozar José; Alves Pereira, Denilson
Año de publicación
2025
Idioma
inglés
Tipo de recurso
artículo
Estado
versión publicada
Descripción
Opinion mining is a natural language processing task that aims to classify user opinions expressed on ecommerce platforms, social networks and other media. It is an important tool for decision making, monitoring products/services, detecting trends, developing marketing strategies, among others. Much research has been carried out addressing opinions in the English language. The Portuguese language is still very lacking in linguistic resources aimed at training machine learning models. This work contributes to the evaluation of approaches based on the BERT language model for opinion mining in the Portuguese language, in particular, by creating and evaluating a dataset with labeled data in the domain of the beverage called Cachaça. This is a popular drink in Brazil, and of great economic importance. As a result of the experimental evaluation, the approaches based on the BERT model stood out in relation to two baselines, and in a crossdomain evaluation, they achieved values greater than 0.97 in the F1 metric for classification into 2 classes and 0.64 for 3 classes, in the dataset labeled for the cachaça beverage.
La minería de opinión es una tarea de procesamiento del lenguaje natural que busca clasificar las opiniones de los usuarios expresadas en plataformas de comercio electrónico, redes sociales y otros medios. Es una herramienta importante para la toma de decisiones, el monitoreo de productos/servicios, la detección de tendencias y el desarrollo de estrategias de marketing, entre otros. Se han realizado numerosas investigaciones sobre opiniones en inglés. El portugués aún carece de recursos lingüísticos para el entrenamiento de modelos de aprendizaje automático. Este trabajo contribuye a la evaluación de enfoques basados en el modelo lingüístico BERT para la minería de opinión en portugués, en particular mediante la creación y evaluación de un conjunto de datos etiquetados en el dominio de la cachaça. Esta bebida es popular en Brasil y de gran importancia económica. Como resultado de la evaluación experimental, los enfoques basados en el modelo BERT destacaron en relación con dos líneas base y, en una evaluación interdominio, alcanzaron valores superiores a 0,97 en la métrica F1 para la clasificación en dos clases y 0,64 para tres clases, en el conjunto de datos etiquetado para la cachaça.
Facultad de Informática
Materia
Ciencias Informáticas
BERT
Cachaça
Opinion Mining
Sentiment Analysis
Social Network
análisis de sentimientos
minería de opinión
redes sociales
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/186931

id SEDICI_79e00d6522082119da84117e1ec92a3c
oai_identifier_str oai:sedici.unlp.edu.ar:10915/186931
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça BeverageEvaluación de enfoques basados en el modelo BERT para la minería de opinión sobre la bebida cachaçaSalles Santos, ThiagoBrito, Mozar JoséAlves Pereira, DenilsonCiencias InformáticasBERTCachaçaOpinion MiningSentiment AnalysisSocial Networkanálisis de sentimientosminería de opiniónredes socialesOpinion mining is a natural language processing task that aims to classify user opinions expressed on ecommerce platforms, social networks and other media. It is an important tool for decision making, monitoring products/services, detecting trends, developing marketing strategies, among others. Much research has been carried out addressing opinions in the English language. The Portuguese language is still very lacking in linguistic resources aimed at training machine learning models. This work contributes to the evaluation of approaches based on the BERT language model for opinion mining in the Portuguese language, in particular, by creating and evaluating a dataset with labeled data in the domain of the beverage called Cachaça. This is a popular drink in Brazil, and of great economic importance. As a result of the experimental evaluation, the approaches based on the BERT model stood out in relation to two baselines, and in a crossdomain evaluation, they achieved values greater than 0.97 in the F1 metric for classification into 2 classes and 0.64 for 3 classes, in the dataset labeled for the cachaça beverage.La minería de opinión es una tarea de procesamiento del lenguaje natural que busca clasificar las opiniones de los usuarios expresadas en plataformas de comercio electrónico, redes sociales y otros medios. Es una herramienta importante para la toma de decisiones, el monitoreo de productos/servicios, la detección de tendencias y el desarrollo de estrategias de marketing, entre otros. Se han realizado numerosas investigaciones sobre opiniones en inglés. El portugués aún carece de recursos lingüísticos para el entrenamiento de modelos de aprendizaje automático. Este trabajo contribuye a la evaluación de enfoques basados en el modelo lingüístico BERT para la minería de opinión en portugués, en particular mediante la creación y evaluación de un conjunto de datos etiquetados en el dominio de la cachaça. Esta bebida es popular en Brasil y de gran importancia económica. Como resultado de la evaluación experimental, los enfoques basados en el modelo BERT destacaron en relación con dos líneas base y, en una evaluación interdominio, alcanzaron valores superiores a 0,97 en la métrica F1 para la clasificación en dos clases y 0,64 para tres clases, en el conjunto de datos etiquetado para la cachaça.Facultad de Informática2025-10info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulohttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdf107-117http://sedici.unlp.edu.ar/handle/10915/186931enginfo:eu-repo/semantics/altIdentifier/issn/1666-6038info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.25.e09info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-11-12T11:15:39Zoai:sedici.unlp.edu.ar:10915/186931Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-11-12 11:15:39.277SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage
Evaluación de enfoques basados en el modelo BERT para la minería de opinión sobre la bebida cachaça
title Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage
spellingShingle Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage
Salles Santos, Thiago
Ciencias Informáticas
BERT
Cachaça
Opinion Mining
Sentiment Analysis
Social Network
análisis de sentimientos
minería de opinión
redes sociales
title_short Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage
title_full Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage
title_fullStr Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage
title_full_unstemmed Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage
title_sort Evaluation of Approaches Based on the BERT Model for Opinion Mining about the Cachaça Beverage
dc.creator.none.fl_str_mv Salles Santos, Thiago
Brito, Mozar José
Alves Pereira, Denilson
author Salles Santos, Thiago
author_facet Salles Santos, Thiago
Brito, Mozar José
Alves Pereira, Denilson
author_role author
author2 Brito, Mozar José
Alves Pereira, Denilson
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
BERT
Cachaça
Opinion Mining
Sentiment Analysis
Social Network
análisis de sentimientos
minería de opinión
redes sociales
topic Ciencias Informáticas
BERT
Cachaça
Opinion Mining
Sentiment Analysis
Social Network
análisis de sentimientos
minería de opinión
redes sociales
dc.description.none.fl_txt_mv Opinion mining is a natural language processing task that aims to classify user opinions expressed on ecommerce platforms, social networks and other media. It is an important tool for decision making, monitoring products/services, detecting trends, developing marketing strategies, among others. Much research has been carried out addressing opinions in the English language. The Portuguese language is still very lacking in linguistic resources aimed at training machine learning models. This work contributes to the evaluation of approaches based on the BERT language model for opinion mining in the Portuguese language, in particular, by creating and evaluating a dataset with labeled data in the domain of the beverage called Cachaça. This is a popular drink in Brazil, and of great economic importance. As a result of the experimental evaluation, the approaches based on the BERT model stood out in relation to two baselines, and in a crossdomain evaluation, they achieved values greater than 0.97 in the F1 metric for classification into 2 classes and 0.64 for 3 classes, in the dataset labeled for the cachaça beverage.
La minería de opinión es una tarea de procesamiento del lenguaje natural que busca clasificar las opiniones de los usuarios expresadas en plataformas de comercio electrónico, redes sociales y otros medios. Es una herramienta importante para la toma de decisiones, el monitoreo de productos/servicios, la detección de tendencias y el desarrollo de estrategias de marketing, entre otros. Se han realizado numerosas investigaciones sobre opiniones en inglés. El portugués aún carece de recursos lingüísticos para el entrenamiento de modelos de aprendizaje automático. Este trabajo contribuye a la evaluación de enfoques basados en el modelo lingüístico BERT para la minería de opinión en portugués, en particular mediante la creación y evaluación de un conjunto de datos etiquetados en el dominio de la cachaça. Esta bebida es popular en Brasil y de gran importancia económica. Como resultado de la evaluación experimental, los enfoques basados en el modelo BERT destacaron en relación con dos líneas base y, en una evaluación interdominio, alcanzaron valores superiores a 0,97 en la métrica F1 para la clasificación en dos clases y 0,64 para tres clases, en el conjunto de datos etiquetado para la cachaça.
Facultad de Informática
description Opinion mining is a natural language processing task that aims to classify user opinions expressed on ecommerce platforms, social networks and other media. It is an important tool for decision making, monitoring products/services, detecting trends, developing marketing strategies, among others. Much research has been carried out addressing opinions in the English language. The Portuguese language is still very lacking in linguistic resources aimed at training machine learning models. This work contributes to the evaluation of approaches based on the BERT language model for opinion mining in the Portuguese language, in particular, by creating and evaluating a dataset with labeled data in the domain of the beverage called Cachaça. This is a popular drink in Brazil, and of great economic importance. As a result of the experimental evaluation, the approaches based on the BERT model stood out in relation to two baselines, and in a crossdomain evaluation, they achieved values greater than 0.97 in the F1 metric for classification into 2 classes and 0.64 for 3 classes, in the dataset labeled for the cachaça beverage.
publishDate 2025
dc.date.none.fl_str_mv 2025-10
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Articulo
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/186931
url http://sedici.unlp.edu.ar/handle/10915/186931
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/issn/1666-6038
info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.25.e09
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
107-117
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1848605864216231936
score 13.24909