Evaluación de modelos de procesamiento de lenguaje natural para medir similaridad entre escenarios escritos en español

Autores
Pérez, Gabriela Alejandra; Mostaccio, Catalina Alba; Antonelli, Leandro
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
La ingeniería de requerimientos es una fase crítica en el desarrollo de software; busca comprender y documentar los requisitos del sistema desde etapas tempranas. Con frecuencia, la especificación de requerimientos es realizada de forma conjunta entre clientes y el equipo de desarrollo. Los clientes aportan conocimientos profundos en el lenguaje del dominio, mientras que los equipos de desarrollo utilizan términos más informáticos. A pesar de esto, la comprensión mutua es esencial. Uno de los artefactos más utilizados para este propósito son los escenarios. En entornos donde múltiples actores escriben escenarios, es común la duplicación. Es necesario contar con algún mecanismo que posibilite la detección de escenarios similares para evitar tal duplicación. En este trabajo se evalúan empíricamente varios modelos pre-entrenados de Procesamiento de Lenguaje Natural para analizar la similitud semántica entre escenarios en español, identificando palabras o expresiones con significados similares. Es importante destacar que el análisis se realiza en este lenguaje para brindar una contribución a la región. Finalmente, se presenta una herramienta que simplifica la creación de nuevos escenarios, mostrando la eventual existencia de similares. Permite operar con varios modelos y ofrece la posibilidad de seleccionar entre ellos para determinar de forma más precisa si existen escenarios similares al que se está definiendo.
Materia
Ciencias de la Computación e Información
Ingeniería de Requerimientos
Escenarios
BERT
Similaridad Semántica
NLP
Sentence BERT
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
CIC Digital (CICBA)
Institución
Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
OAI Identificador
oai:digital.cic.gba.gob.ar:11746/12397

id CICBA_b4763cb1524afa5e553ad44f9b917fb4
oai_identifier_str oai:digital.cic.gba.gob.ar:11746/12397
network_acronym_str CICBA
repository_id_str 9441
network_name_str CIC Digital (CICBA)
spelling Evaluación de modelos de procesamiento de lenguaje natural para medir similaridad entre escenarios escritos en españolPérez, Gabriela AlejandraMostaccio, Catalina AlbaAntonelli, LeandroCiencias de la Computación e InformaciónIngeniería de RequerimientosEscenariosBERTSimilaridad SemánticaNLPSentence BERTLa ingeniería de requerimientos es una fase crítica en el desarrollo de software; busca comprender y documentar los requisitos del sistema desde etapas tempranas. Con frecuencia, la especificación de requerimientos es realizada de forma conjunta entre clientes y el equipo de desarrollo. Los clientes aportan conocimientos profundos en el lenguaje del dominio, mientras que los equipos de desarrollo utilizan términos más informáticos. A pesar de esto, la comprensión mutua es esencial. Uno de los artefactos más utilizados para este propósito son los escenarios. En entornos donde múltiples actores escriben escenarios, es común la duplicación. Es necesario contar con algún mecanismo que posibilite la detección de escenarios similares para evitar tal duplicación. En este trabajo se evalúan empíricamente varios modelos pre-entrenados de Procesamiento de Lenguaje Natural para analizar la similitud semántica entre escenarios en español, identificando palabras o expresiones con significados similares. Es importante destacar que el análisis se realiza en este lenguaje para brindar una contribución a la región. Finalmente, se presenta una herramienta que simplifica la creación de nuevos escenarios, mostrando la eventual existencia de similares. Permite operar con varios modelos y ofrece la posibilidad de seleccionar entre ellos para determinar de forma más precisa si existen escenarios similares al que se está definiendo.2024-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttps://digital.cic.gba.gob.ar/handle/11746/12397spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/reponame:CIC Digital (CICBA)instname:Comisión de Investigaciones Científicas de la Provincia de Buenos Airesinstacron:CICBA2025-09-04T09:42:56Zoai:digital.cic.gba.gob.ar:11746/12397Institucionalhttp://digital.cic.gba.gob.arOrganismo científico-tecnológicoNo correspondehttp://digital.cic.gba.gob.ar/oai/snrdmarisa.degiusti@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:94412025-09-04 09:42:56.976CIC Digital (CICBA) - Comisión de Investigaciones Científicas de la Provincia de Buenos Airesfalse
dc.title.none.fl_str_mv Evaluación de modelos de procesamiento de lenguaje natural para medir similaridad entre escenarios escritos en español
title Evaluación de modelos de procesamiento de lenguaje natural para medir similaridad entre escenarios escritos en español
spellingShingle Evaluación de modelos de procesamiento de lenguaje natural para medir similaridad entre escenarios escritos en español
Pérez, Gabriela Alejandra
Ciencias de la Computación e Información
Ingeniería de Requerimientos
Escenarios
BERT
Similaridad Semántica
NLP
Sentence BERT
title_short Evaluación de modelos de procesamiento de lenguaje natural para medir similaridad entre escenarios escritos en español
title_full Evaluación de modelos de procesamiento de lenguaje natural para medir similaridad entre escenarios escritos en español
title_fullStr Evaluación de modelos de procesamiento de lenguaje natural para medir similaridad entre escenarios escritos en español
title_full_unstemmed Evaluación de modelos de procesamiento de lenguaje natural para medir similaridad entre escenarios escritos en español
title_sort Evaluación de modelos de procesamiento de lenguaje natural para medir similaridad entre escenarios escritos en español
dc.creator.none.fl_str_mv Pérez, Gabriela Alejandra
Mostaccio, Catalina Alba
Antonelli, Leandro
author Pérez, Gabriela Alejandra
author_facet Pérez, Gabriela Alejandra
Mostaccio, Catalina Alba
Antonelli, Leandro
author_role author
author2 Mostaccio, Catalina Alba
Antonelli, Leandro
author2_role author
author
dc.subject.none.fl_str_mv Ciencias de la Computación e Información
Ingeniería de Requerimientos
Escenarios
BERT
Similaridad Semántica
NLP
Sentence BERT
topic Ciencias de la Computación e Información
Ingeniería de Requerimientos
Escenarios
BERT
Similaridad Semántica
NLP
Sentence BERT
dc.description.none.fl_txt_mv La ingeniería de requerimientos es una fase crítica en el desarrollo de software; busca comprender y documentar los requisitos del sistema desde etapas tempranas. Con frecuencia, la especificación de requerimientos es realizada de forma conjunta entre clientes y el equipo de desarrollo. Los clientes aportan conocimientos profundos en el lenguaje del dominio, mientras que los equipos de desarrollo utilizan términos más informáticos. A pesar de esto, la comprensión mutua es esencial. Uno de los artefactos más utilizados para este propósito son los escenarios. En entornos donde múltiples actores escriben escenarios, es común la duplicación. Es necesario contar con algún mecanismo que posibilite la detección de escenarios similares para evitar tal duplicación. En este trabajo se evalúan empíricamente varios modelos pre-entrenados de Procesamiento de Lenguaje Natural para analizar la similitud semántica entre escenarios en español, identificando palabras o expresiones con significados similares. Es importante destacar que el análisis se realiza en este lenguaje para brindar una contribución a la región. Finalmente, se presenta una herramienta que simplifica la creación de nuevos escenarios, mostrando la eventual existencia de similares. Permite operar con varios modelos y ofrece la posibilidad de seleccionar entre ellos para determinar de forma más precisa si existen escenarios similares al que se está definiendo.
description La ingeniería de requerimientos es una fase crítica en el desarrollo de software; busca comprender y documentar los requisitos del sistema desde etapas tempranas. Con frecuencia, la especificación de requerimientos es realizada de forma conjunta entre clientes y el equipo de desarrollo. Los clientes aportan conocimientos profundos en el lenguaje del dominio, mientras que los equipos de desarrollo utilizan términos más informáticos. A pesar de esto, la comprensión mutua es esencial. Uno de los artefactos más utilizados para este propósito son los escenarios. En entornos donde múltiples actores escriben escenarios, es común la duplicación. Es necesario contar con algún mecanismo que posibilite la detección de escenarios similares para evitar tal duplicación. En este trabajo se evalúan empíricamente varios modelos pre-entrenados de Procesamiento de Lenguaje Natural para analizar la similitud semántica entre escenarios en español, identificando palabras o expresiones con significados similares. Es importante destacar que el análisis se realiza en este lenguaje para brindar una contribución a la región. Finalmente, se presenta una herramienta que simplifica la creación de nuevos escenarios, mostrando la eventual existencia de similares. Permite operar con varios modelos y ofrece la posibilidad de seleccionar entre ellos para determinar de forma más precisa si existen escenarios similares al que se está definiendo.
publishDate 2024
dc.date.none.fl_str_mv 2024-08
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv https://digital.cic.gba.gob.ar/handle/11746/12397
url https://digital.cic.gba.gob.ar/handle/11746/12397
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:CIC Digital (CICBA)
instname:Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
instacron:CICBA
reponame_str CIC Digital (CICBA)
collection CIC Digital (CICBA)
instname_str Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
instacron_str CICBA
institution CICBA
repository.name.fl_str_mv CIC Digital (CICBA) - Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
repository.mail.fl_str_mv marisa.degiusti@sedici.unlp.edu.ar
_version_ 1842340397604405248
score 12.623145