Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación

Autores: Martinelli, Sofía
Año de publicación: 2025
Idioma: español castellano
Tipo de recurso: tesis de grado
Estado: versión publicada
Colaborador/a o director/a de tesis: Ivetta, Guido
Descripción: Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Las tecnologías del lenguaje se utilizan cada vez más en ámbitos como la salud, la justicia y la educación, lo que hace necesario analizar sus posibles errores. Los modelos de lenguaje pueden reproducir y amplificar estereotipos o generar representaciones inexactas de distintos grupos sociales, fenómeno conocido como sesgo social. Una estrategia habitual para estudiarlo consiste en emplear benchmarks de evaluación. Sin embargo, muchos de estos recursos han sido desarrollados en inglés y dentro de marcos culturales limitados, lo que restringe su alcance. En este trabajo exploramos metodologías participativas para la construcción de benchmarks culturalmente situados, involucrando a comunidades subrepresentadas. Los resultados muestran que estos recursos revelan limitaciones de los modelos actuales frente a contenidos culturalmente diversos, y subrayan la necesidad de herramientas de evaluación más contextualizadas.
Language technologies are increasingly used in areas such as healthcare, justice, and education, making it essential to examine their potential errors. Language models can reproduce and amplify stereotypes or misrepresent social groups, a phenomenon known as social bias. Benchmarks are commonly used to diagnose these issues; however, many existing resources have been developed primarily in English and within limited cultural contexts. In this work, we explore participatory methodologies for constructing culturally situated benchmarks involving underrepresented communities. Our findings show that these resources expose limitations of current models when processing culturally diverse content, highlighting the need for more context-aware evaluation tools.
Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia: Natural language processing
Artificial intelligence
Modelos de lenguaje a gran escala
Recolección de datos
Evaluación de modelos de lenguaje
Benchmarks
Nivel de accesibilidad: acceso abierto
Condiciones de uso
Repositorio
Institución: Universidad Nacional de Córdoba
OAI Identificador: oai:rdu.unc.edu.ar:11086/560716

Acceder

id	RDUUNC_40e9df703dca3d3fa42a4bd7d210d494
oai_identifier_str	oai:rdu.unc.edu.ar:11086/560716
network_acronym_str	RDUUNC
repository_id_str	2572
network_name_str	Repositorio Digital Universitario (UNC)
spelling	Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluaciónMartinelli, SofíaNatural language processingArtificial intelligenceModelos de lenguaje a gran escalaRecolección de datosEvaluación de modelos de lenguajeBenchmarksTesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.Las tecnologías del lenguaje se utilizan cada vez más en ámbitos como la salud, la justicia y la educación, lo que hace necesario analizar sus posibles errores. Los modelos de lenguaje pueden reproducir y amplificar estereotipos o generar representaciones inexactas de distintos grupos sociales, fenómeno conocido como sesgo social. Una estrategia habitual para estudiarlo consiste en emplear benchmarks de evaluación. Sin embargo, muchos de estos recursos han sido desarrollados en inglés y dentro de marcos culturales limitados, lo que restringe su alcance. En este trabajo exploramos metodologías participativas para la construcción de benchmarks culturalmente situados, involucrando a comunidades subrepresentadas. Los resultados muestran que estos recursos revelan limitaciones de los modelos actuales frente a contenidos culturalmente diversos, y subrayan la necesidad de herramientas de evaluación más contextualizadas.Language technologies are increasingly used in areas such as healthcare, justice, and education, making it essential to examine their potential errors. Language models can reproduce and amplify stereotypes or misrepresent social groups, a phenomenon known as social bias. Benchmarks are commonly used to diagnose these issues; however, many existing resources have been developed primarily in English and within limited cultural contexts. In this work, we explore participatory methodologies for constructing culturally situated benchmarks involving underrepresented communities. Our findings show that these resources expose limitations of current models when processing culturally diverse content, highlighting the need for more context-aware evaluation tools.Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.Ivetta, Guido2025-12info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/560716spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2026-06-11T09:53:01Zoai:rdu.unc.edu.ar:11086/560716Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722026-06-11 09:53:01.296Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv	Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
title	Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
spellingShingle	Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación Martinelli, Sofía Natural language processing Artificial intelligence Modelos de lenguaje a gran escala Recolección de datos Evaluación de modelos de lenguaje Benchmarks
title_short	Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
title_full	Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
title_fullStr	Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
title_full_unstemmed	Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
title_sort	Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación
dc.creator.none.fl_str_mv	Martinelli, Sofía
author	Martinelli, Sofía
author_facet	Martinelli, Sofía
author_role	author
dc.contributor.none.fl_str_mv	Ivetta, Guido
dc.subject.none.fl_str_mv	Natural language processing Artificial intelligence Modelos de lenguaje a gran escala Recolección de datos Evaluación de modelos de lenguaje Benchmarks
topic	Natural language processing Artificial intelligence Modelos de lenguaje a gran escala Recolección de datos Evaluación de modelos de lenguaje Benchmarks
dc.description.none.fl_txt_mv	Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025. Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina. Las tecnologías del lenguaje se utilizan cada vez más en ámbitos como la salud, la justicia y la educación, lo que hace necesario analizar sus posibles errores. Los modelos de lenguaje pueden reproducir y amplificar estereotipos o generar representaciones inexactas de distintos grupos sociales, fenómeno conocido como sesgo social. Una estrategia habitual para estudiarlo consiste en emplear benchmarks de evaluación. Sin embargo, muchos de estos recursos han sido desarrollados en inglés y dentro de marcos culturales limitados, lo que restringe su alcance. En este trabajo exploramos metodologías participativas para la construcción de benchmarks culturalmente situados, involucrando a comunidades subrepresentadas. Los resultados muestran que estos recursos revelan limitaciones de los modelos actuales frente a contenidos culturalmente diversos, y subrayan la necesidad de herramientas de evaluación más contextualizadas. Language technologies are increasingly used in areas such as healthcare, justice, and education, making it essential to examine their potential errors. Language models can reproduce and amplify stereotypes or misrepresent social groups, a phenomenon known as social bias. Benchmarks are commonly used to diagnose these issues; however, many existing resources have been developed primarily in English and within limited cultural contexts. In this work, we explore participatory methodologies for constructing culturally situated benchmarks involving underrepresented communities. Our findings show that these resources expose limitations of current models when processing culturally diverse content, highlighting the need for more context-aware evaluation tools. Fil: Martinelli, Sofía. Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description	Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2025.
publishDate	2025
dc.date.none.fl_str_mv	2025-12
dc.type.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado
format	bachelorThesis
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://hdl.handle.net/11086/560716
url	http://hdl.handle.net/11086/560716
dc.language.none.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC
reponame_str	Repositorio Digital Universitario (UNC)
collection	Repositorio Digital Universitario (UNC)
instname_str	Universidad Nacional de Córdoba
instacron_str	UNC
institution	UNC
repository.name.fl_str_mv	Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv	oca.unc@gmail.com
_version_	1867707178397204480
score	12.98848

Sesgos en modelos de lenguaje y construcción participativa de benchmarks de evaluación

Publicaciones similares