Aumentación de datos mediante grandes modelos de lenguaje para la clasificación de preguntas contables

Autores
Quiroga, William; Ferretti, Edgardo; Thompson, Horacio
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Este trabajo presenta el marco inicial de una Tesina de Grado en curso. La misma, está orientada a explorar el potencial de los Grandes Modelos de Lenguajes (LLMs) para generar muestras etiquetadas a partir de ejemplos preexistentes, con el fin de mejorar el desempeño de modelos de Aprendizaje Automático (AA) en la tarea de clasificación de preguntas en español dentro del dominio contable. Se propone aplicar técnicas de generación de contenido utilizando LLMs y evaluar la consistencia del contenido generado mediante clasificadores basados arquitecturas transformers. El estudio permitirá la creación de recursos valiosos para el Procesamiento de Lenguaje Natural en un idioma y dominio poco explorado, como así también contribuiría en líneas de investigación vinculadas a métodos avanzados de AA y su aplicación para el diseño y desarrollo de agentes conversacionales.
Red de Universidades con Carreras en Informática
Materia
Ciencias Informáticas
Grandes modelos de lenguaje
Aumentación de datos
Agentes conversacionales
Clasificación de preguntas
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/191397

id SEDICI_82bd84d56e773626864c563c85a91d1e
oai_identifier_str oai:sedici.unlp.edu.ar:10915/191397
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Aumentación de datos mediante grandes modelos de lenguaje para la clasificación de preguntas contablesQuiroga, WilliamFerretti, EdgardoThompson, HoracioCiencias InformáticasGrandes modelos de lenguajeAumentación de datosAgentes conversacionalesClasificación de preguntasEste trabajo presenta el marco inicial de una Tesina de Grado en curso. La misma, está orientada a explorar el potencial de los Grandes Modelos de Lenguajes (LLMs) para generar muestras etiquetadas a partir de ejemplos preexistentes, con el fin de mejorar el desempeño de modelos de Aprendizaje Automático (AA) en la tarea de clasificación de preguntas en español dentro del dominio contable. Se propone aplicar técnicas de generación de contenido utilizando LLMs y evaluar la consistencia del contenido generado mediante clasificadores basados arquitecturas transformers. El estudio permitirá la creación de recursos valiosos para el Procesamiento de Lenguaje Natural en un idioma y dominio poco explorado, como así también contribuiría en líneas de investigación vinculadas a métodos avanzados de AA y su aplicación para el diseño y desarrollo de agentes conversacionales.Red de Universidades con Carreras en Informática2025-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf1032-1036http://sedici.unlp.edu.ar/handle/10915/191397spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-8258-99-7info:eu-repo/semantics/reference/hdl/10915/189846info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-05-27T11:46:58Zoai:sedici.unlp.edu.ar:10915/191397Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-05-27 11:46:58.63SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Aumentación de datos mediante grandes modelos de lenguaje para la clasificación de preguntas contables
title Aumentación de datos mediante grandes modelos de lenguaje para la clasificación de preguntas contables
spellingShingle Aumentación de datos mediante grandes modelos de lenguaje para la clasificación de preguntas contables
Quiroga, William
Ciencias Informáticas
Grandes modelos de lenguaje
Aumentación de datos
Agentes conversacionales
Clasificación de preguntas
title_short Aumentación de datos mediante grandes modelos de lenguaje para la clasificación de preguntas contables
title_full Aumentación de datos mediante grandes modelos de lenguaje para la clasificación de preguntas contables
title_fullStr Aumentación de datos mediante grandes modelos de lenguaje para la clasificación de preguntas contables
title_full_unstemmed Aumentación de datos mediante grandes modelos de lenguaje para la clasificación de preguntas contables
title_sort Aumentación de datos mediante grandes modelos de lenguaje para la clasificación de preguntas contables
dc.creator.none.fl_str_mv Quiroga, William
Ferretti, Edgardo
Thompson, Horacio
author Quiroga, William
author_facet Quiroga, William
Ferretti, Edgardo
Thompson, Horacio
author_role author
author2 Ferretti, Edgardo
Thompson, Horacio
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Grandes modelos de lenguaje
Aumentación de datos
Agentes conversacionales
Clasificación de preguntas
topic Ciencias Informáticas
Grandes modelos de lenguaje
Aumentación de datos
Agentes conversacionales
Clasificación de preguntas
dc.description.none.fl_txt_mv Este trabajo presenta el marco inicial de una Tesina de Grado en curso. La misma, está orientada a explorar el potencial de los Grandes Modelos de Lenguajes (LLMs) para generar muestras etiquetadas a partir de ejemplos preexistentes, con el fin de mejorar el desempeño de modelos de Aprendizaje Automático (AA) en la tarea de clasificación de preguntas en español dentro del dominio contable. Se propone aplicar técnicas de generación de contenido utilizando LLMs y evaluar la consistencia del contenido generado mediante clasificadores basados arquitecturas transformers. El estudio permitirá la creación de recursos valiosos para el Procesamiento de Lenguaje Natural en un idioma y dominio poco explorado, como así también contribuiría en líneas de investigación vinculadas a métodos avanzados de AA y su aplicación para el diseño y desarrollo de agentes conversacionales.
Red de Universidades con Carreras en Informática
description Este trabajo presenta el marco inicial de una Tesina de Grado en curso. La misma, está orientada a explorar el potencial de los Grandes Modelos de Lenguajes (LLMs) para generar muestras etiquetadas a partir de ejemplos preexistentes, con el fin de mejorar el desempeño de modelos de Aprendizaje Automático (AA) en la tarea de clasificación de preguntas en español dentro del dominio contable. Se propone aplicar técnicas de generación de contenido utilizando LLMs y evaluar la consistencia del contenido generado mediante clasificadores basados arquitecturas transformers. El estudio permitirá la creación de recursos valiosos para el Procesamiento de Lenguaje Natural en un idioma y dominio poco explorado, como así también contribuiría en líneas de investigación vinculadas a métodos avanzados de AA y su aplicación para el diseño y desarrollo de agentes conversacionales.
publishDate 2025
dc.date.none.fl_str_mv 2025-10
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/191397
url http://sedici.unlp.edu.ar/handle/10915/191397
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/isbn/978-987-8258-99-7
info:eu-repo/semantics/reference/hdl/10915/189846
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
1032-1036
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1866372196738269184
score 13.468372