Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación

Autores
Martinelli, Sofía
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Ivetta, Guido
Descripción
Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Las tecnologías del lenguaje se utilizan cada vez más en ámbitos como la salud, la justicia y la educación, lo que hace necesario analizar sus posibles errores. Los modelos de lenguaje pueden reproducir y amplificar estereotipos o generar representaciones inexactas de distintos grupos sociales, fenómeno conocido como sesgo social. Una estrategia habitual para estudiarlo consiste en emplear benchmarks de evaluación. Sin embargo, muchos de estos recursos han sido desarrollados en inglés y dentro de marcos culturales limitados, lo que restringe su alcance. En este trabajo exploramos metodologías participativas para la construcción de benchmarks culturalmente situados, involucrando a comunidades subrepresentadas. Los resultados muestran que estos recursos revelan limitaciones de los modelos actuales frente a contenidos culturalmente diversos, y subrayan la necesidad de herramientas de evaluación más contextualizadas.
Language technologies are increasingly used in areas such as healthcare, justice, and education, making it essential to examine their potential errors. Language models can reproduce and amplify stereotypes or misrepresent social groups, a phenomenon known as social bias. Benchmarks are commonly used to diagnose these issues; however, many existing resources have been developed primarily in English and within limited cultural contexts. In this work, we explore participatory methodologies for constructing culturally situated benchmarks involving underrepresented communities. Our findings show that these resources expose limitations of current models when processing culturally diverse content, highlighting the need for more context-aware evaluation tools.
Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia
Natural language processing
Artificial intelligence
Modelos de lenguaje a gran escala
Recolección de datos
Evaluación de modelos de lenguaje
Benchmarks
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/560716

id RDUUNC_40e9df703dca3d3fa42a4bd7d210d494
oai_identifier_str oai:rdu.unc.edu.ar:11086/560716
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluaciónMartinelli, SofíaNatural language processingArtificial intelligenceModelos de lenguaje a gran escalaRecolección de datosEvaluación de modelos de lenguajeBenchmarksTesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.Las tecnologías del lenguaje se utilizan cada vez más en ámbitos como la salud, la justicia y la educación, lo que hace necesario analizar sus posibles errores. Los modelos de lenguaje pueden reproducir y amplificar estereotipos o generar representaciones inexactas de distintos grupos sociales, fenómeno conocido como sesgo social. Una estrategia habitual para estudiarlo consiste en emplear benchmarks de evaluación. Sin embargo, muchos de estos recursos han sido desarrollados en inglés y dentro de marcos culturales limitados, lo que restringe su alcance. En este trabajo exploramos metodologías participativas para la construcción de benchmarks culturalmente situados, involucrando a comunidades subrepresentadas. Los resultados muestran que estos recursos revelan limitaciones de los modelos actuales frente a contenidos culturalmente diversos, y subrayan la necesidad de herramientas de evaluación más contextualizadas.Language technologies are increasingly used in areas such as healthcare, justice, and education, making it essential to examine their potential errors. Language models can reproduce and amplify stereotypes or misrepresent social groups, a phenomenon known as social bias. Benchmarks are commonly used to diagnose these issues; however, many existing resources have been developed primarily in English and within limited cultural contexts. In this work, we explore participatory methodologies for constructing culturally situated benchmarks involving underrepresented communities. Our findings show that these resources expose limitations of current models when processing culturally diverse content, highlighting the need for more context-aware evaluation tools.Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.Ivetta, Guido2025-12info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/560716spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2026-04-29T11:43:20Zoai:rdu.unc.edu.ar:11086/560716Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722026-04-29 11:43:20.853Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
title Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
spellingShingle Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
Martinelli, Sofía
Natural language processing
Artificial intelligence
Modelos de lenguaje a gran escala
Recolección de datos
Evaluación de modelos de lenguaje
Benchmarks
title_short Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
title_full Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
title_fullStr Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
title_full_unstemmed Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
title_sort Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
dc.creator.none.fl_str_mv Martinelli, Sofía
author Martinelli, Sofía
author_facet Martinelli, Sofía
author_role author
dc.contributor.none.fl_str_mv Ivetta, Guido
dc.subject.none.fl_str_mv Natural language processing
Artificial intelligence
Modelos de lenguaje a gran escala
Recolección de datos
Evaluación de modelos de lenguaje
Benchmarks
topic Natural language processing
Artificial intelligence
Modelos de lenguaje a gran escala
Recolección de datos
Evaluación de modelos de lenguaje
Benchmarks
dc.description.none.fl_txt_mv Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Las tecnologías del lenguaje se utilizan cada vez más en ámbitos como la salud, la justicia y la educación, lo que hace necesario analizar sus posibles errores. Los modelos de lenguaje pueden reproducir y amplificar estereotipos o generar representaciones inexactas de distintos grupos sociales, fenómeno conocido como sesgo social. Una estrategia habitual para estudiarlo consiste en emplear benchmarks de evaluación. Sin embargo, muchos de estos recursos han sido desarrollados en inglés y dentro de marcos culturales limitados, lo que restringe su alcance. En este trabajo exploramos metodologías participativas para la construcción de benchmarks culturalmente situados, involucrando a comunidades subrepresentadas. Los resultados muestran que estos recursos revelan limitaciones de los modelos actuales frente a contenidos culturalmente diversos, y subrayan la necesidad de herramientas de evaluación más contextualizadas.
Language technologies are increasingly used in areas such as healthcare, justice, and education, making it essential to examine their potential errors. Language models can reproduce and amplify stereotypes or misrepresent social groups, a phenomenon known as social bias. Benchmarks are commonly used to diagnose these issues; however, many existing resources have been developed primarily in English and within limited cultural contexts. In this work, we explore participatory methodologies for constructing culturally situated benchmarks involving underrepresented communities. Our findings show that these resources expose limitations of current models when processing culturally diverse content, highlighting the need for more context-aware evaluation tools.
Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
publishDate 2025
dc.date.none.fl_str_mv 2025-12
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/560716
url http://hdl.handle.net/11086/560716
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1863820310076194816
score 13.039539