Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
- Autores
- Martinelli, Sofía
- Año de publicación
- 2025
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Ivetta, Guido
- Descripción
- Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Las tecnologías del lenguaje se utilizan cada vez más en ámbitos como la salud, la justicia y la educación, lo que hace necesario analizar sus posibles errores. Los modelos de lenguaje pueden reproducir y amplificar estereotipos o generar representaciones inexactas de distintos grupos sociales, fenómeno conocido como sesgo social. Una estrategia habitual para estudiarlo consiste en emplear benchmarks de evaluación. Sin embargo, muchos de estos recursos han sido desarrollados en inglés y dentro de marcos culturales limitados, lo que restringe su alcance. En este trabajo exploramos metodologías participativas para la construcción de benchmarks culturalmente situados, involucrando a comunidades subrepresentadas. Los resultados muestran que estos recursos revelan limitaciones de los modelos actuales frente a contenidos culturalmente diversos, y subrayan la necesidad de herramientas de evaluación más contextualizadas.
Language technologies are increasingly used in areas such as healthcare, justice, and education, making it essential to examine their potential errors. Language models can reproduce and amplify stereotypes or misrepresent social groups, a phenomenon known as social bias. Benchmarks are commonly used to diagnose these issues; however, many existing resources have been developed primarily in English and within limited cultural contexts. In this work, we explore participatory methodologies for constructing culturally situated benchmarks involving underrepresented communities. Our findings show that these resources expose limitations of current models when processing culturally diverse content, highlighting the need for more context-aware evaluation tools.
Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina. - Materia
-
Natural language processing
Artificial intelligence
Modelos de lenguaje a gran escala
Recolección de datos
Evaluación de modelos de lenguaje
Benchmarks - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- Repositorio
.jpg)
- Institución
- Universidad Nacional de Córdoba
- OAI Identificador
- oai:rdu.unc.edu.ar:11086/560716
Ver los metadatos del registro completo
| id |
RDUUNC_40e9df703dca3d3fa42a4bd7d210d494 |
|---|---|
| oai_identifier_str |
oai:rdu.unc.edu.ar:11086/560716 |
| network_acronym_str |
RDUUNC |
| repository_id_str |
2572 |
| network_name_str |
Repositorio Digital Universitario (UNC) |
| spelling |
Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluaciónMartinelli, SofíaNatural language processingArtificial intelligenceModelos de lenguaje a gran escalaRecolección de datosEvaluación de modelos de lenguajeBenchmarksTesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.Las tecnologías del lenguaje se utilizan cada vez más en ámbitos como la salud, la justicia y la educación, lo que hace necesario analizar sus posibles errores. Los modelos de lenguaje pueden reproducir y amplificar estereotipos o generar representaciones inexactas de distintos grupos sociales, fenómeno conocido como sesgo social. Una estrategia habitual para estudiarlo consiste en emplear benchmarks de evaluación. Sin embargo, muchos de estos recursos han sido desarrollados en inglés y dentro de marcos culturales limitados, lo que restringe su alcance. En este trabajo exploramos metodologías participativas para la construcción de benchmarks culturalmente situados, involucrando a comunidades subrepresentadas. Los resultados muestran que estos recursos revelan limitaciones de los modelos actuales frente a contenidos culturalmente diversos, y subrayan la necesidad de herramientas de evaluación más contextualizadas.Language technologies are increasingly used in areas such as healthcare, justice, and education, making it essential to examine their potential errors. Language models can reproduce and amplify stereotypes or misrepresent social groups, a phenomenon known as social bias. Benchmarks are commonly used to diagnose these issues; however, many existing resources have been developed primarily in English and within limited cultural contexts. In this work, we explore participatory methodologies for constructing culturally situated benchmarks involving underrepresented communities. Our findings show that these resources expose limitations of current models when processing culturally diverse content, highlighting the need for more context-aware evaluation tools.Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.Ivetta, Guido2025-12info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/560716spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2026-04-29T11:43:20Zoai:rdu.unc.edu.ar:11086/560716Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722026-04-29 11:43:20.853Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse |
| dc.title.none.fl_str_mv |
Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación |
| title |
Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación |
| spellingShingle |
Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación Martinelli, Sofía Natural language processing Artificial intelligence Modelos de lenguaje a gran escala Recolección de datos Evaluación de modelos de lenguaje Benchmarks |
| title_short |
Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación |
| title_full |
Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación |
| title_fullStr |
Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación |
| title_full_unstemmed |
Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación |
| title_sort |
Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación |
| dc.creator.none.fl_str_mv |
Martinelli, Sofía |
| author |
Martinelli, Sofía |
| author_facet |
Martinelli, Sofía |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Ivetta, Guido |
| dc.subject.none.fl_str_mv |
Natural language processing Artificial intelligence Modelos de lenguaje a gran escala Recolección de datos Evaluación de modelos de lenguaje Benchmarks |
| topic |
Natural language processing Artificial intelligence Modelos de lenguaje a gran escala Recolección de datos Evaluación de modelos de lenguaje Benchmarks |
| dc.description.none.fl_txt_mv |
Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025. Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina. Las tecnologías del lenguaje se utilizan cada vez más en ámbitos como la salud, la justicia y la educación, lo que hace necesario analizar sus posibles errores. Los modelos de lenguaje pueden reproducir y amplificar estereotipos o generar representaciones inexactas de distintos grupos sociales, fenómeno conocido como sesgo social. Una estrategia habitual para estudiarlo consiste en emplear benchmarks de evaluación. Sin embargo, muchos de estos recursos han sido desarrollados en inglés y dentro de marcos culturales limitados, lo que restringe su alcance. En este trabajo exploramos metodologías participativas para la construcción de benchmarks culturalmente situados, involucrando a comunidades subrepresentadas. Los resultados muestran que estos recursos revelan limitaciones de los modelos actuales frente a contenidos culturalmente diversos, y subrayan la necesidad de herramientas de evaluación más contextualizadas. Language technologies are increasingly used in areas such as healthcare, justice, and education, making it essential to examine their potential errors. Language models can reproduce and amplify stereotypes or misrepresent social groups, a phenomenon known as social bias. Benchmarks are commonly used to diagnose these issues; however, many existing resources have been developed primarily in English and within limited cultural contexts. In this work, we explore participatory methodologies for constructing culturally situated benchmarks involving underrepresented communities. Our findings show that these resources expose limitations of current models when processing culturally diverse content, highlighting the need for more context-aware evaluation tools. Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina. |
| description |
Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-12 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11086/560716 |
| url |
http://hdl.handle.net/11086/560716 |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC |
| reponame_str |
Repositorio Digital Universitario (UNC) |
| collection |
Repositorio Digital Universitario (UNC) |
| instname_str |
Universidad Nacional de Córdoba |
| instacron_str |
UNC |
| institution |
UNC |
| repository.name.fl_str_mv |
Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba |
| repository.mail.fl_str_mv |
oca.unc@gmail.com |
| _version_ |
1863820310076194816 |
| score |
13.039539 |