Study on the fairness of speaker verification systems across accent and gender groups

Autores: Estevez, Mariel; Ferrer, Luciana
Año de publicación: 2025
Idioma: inglés
Tipo de recurso: documento de conferencia
Estado: versión publicada
Descripción: Los sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios.
Speaker verification (SV) systems are currently used for consequential tasks like giving access to bank accounts or making forensic decisions. Ensuring that these systems are fair and do not disfavor any particular group is crucial. In this work, we analyze the performance of two X-vector-based SV systems across groups defined by gender and accent of the speakers when speaking English. To this end, we created a new dataset based on the VoxCeleb corpus by selecting samples from speakers with accents from different countries. We used this dataset to evaluate system performance of SV systems trained with VoxCeleb data. We show that performance, measured with a calibration-sensitive metric, is markedly degraded on groups that are underrepresented in training: females and speakers with non-native accents in English. Finally, we show that a simple data balancing approach mitigates this undesirable bias on the minority groups without degrading performance on the majority groups.
Link al trabajo completo en documentos relacionados.
Sociedad Argentina de Informática e Investigación Operativa
Materia: Ciencias Informáticas
Verificación del hablante
Justicia
Tendencia
Calibración
Speaker verification
Fairness
Bias
Calibration
Nivel de accesibilidad: acceso abierto
Condiciones de uso: http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
Institución: Universidad Nacional de La Plata
OAI Identificador: oai:sedici.unlp.edu.ar:10915/190549

Acceder

id	SEDICI_71af3f68daabaa16b4045d1480586e9f
oai_identifier_str	oai:sedici.unlp.edu.ar:10915/190549
network_acronym_str	SEDICI
repository_id_str	1329
network_name_str	SEDICI (UNLP)
spelling	Study on the fairness of speaker verification systems across accent and gender groupsEstudio de la justicia en sistemas de Verificación del Hablante a través de grupos de acento y géneroEstevez, MarielFerrer, LucianaCiencias InformáticasVerificación del hablanteJusticiaTendenciaCalibraciónSpeaker verificationFairnessBiasCalibrationLos sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios.Speaker verification (SV) systems are currently used for consequential tasks like giving access to bank accounts or making forensic decisions. Ensuring that these systems are fair and do not disfavor any particular group is crucial. In this work, we analyze the performance of two X-vector-based SV systems across groups defined by gender and accent of the speakers when speaking English. To this end, we created a new dataset based on the VoxCeleb corpus by selecting samples from speakers with accents from different countries. We used this dataset to evaluate system performance of SV systems trained with VoxCeleb data. We show that performance, measured with a calibration-sensitive metric, is markedly degraded on groups that are underrepresented in training: females and speakers with non-native accents in English. Finally, we show that a simple data balancing approach mitigates this undesirable bias on the minority groups without degrading performance on the majority groups.Link al trabajo completo en documentos relacionados.Sociedad Argentina de Informática e Investigación Operativa2025-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf249-250http://sedici.unlp.edu.ar/handle/10915/190549enginfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19821info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/reference/doi/10.48550/arXiv.2204.12649 Focus to learn moreinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-05-27T11:46:30Zoai:sedici.unlp.edu.ar:10915/190549Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-05-27 11:46:31.156SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv	Study on the fairness of speaker verification systems across accent and gender groups Estudio de la justicia en sistemas de Verificación del Hablante a través de grupos de acento y género
title	Study on the fairness of speaker verification systems across accent and gender groups
spellingShingle	Study on the fairness of speaker verification systems across accent and gender groups Estevez, Mariel Ciencias Informáticas Verificación del hablante Justicia Tendencia Calibración Speaker verification Fairness Bias Calibration
title_short	Study on the fairness of speaker verification systems across accent and gender groups
title_full	Study on the fairness of speaker verification systems across accent and gender groups
title_fullStr	Study on the fairness of speaker verification systems across accent and gender groups
title_full_unstemmed	Study on the fairness of speaker verification systems across accent and gender groups
title_sort	Study on the fairness of speaker verification systems across accent and gender groups
dc.creator.none.fl_str_mv	Estevez, Mariel Ferrer, Luciana
author	Estevez, Mariel
author_facet	Estevez, Mariel Ferrer, Luciana
author_role	author
author2	Ferrer, Luciana
author2_role	author
dc.subject.none.fl_str_mv	Ciencias Informáticas Verificación del hablante Justicia Tendencia Calibración Speaker verification Fairness Bias Calibration
topic	Ciencias Informáticas Verificación del hablante Justicia Tendencia Calibración Speaker verification Fairness Bias Calibration
dc.description.none.fl_txt_mv	Los sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios. Speaker verification (SV) systems are currently used for consequential tasks like giving access to bank accounts or making forensic decisions. Ensuring that these systems are fair and do not disfavor any particular group is crucial. In this work, we analyze the performance of two X-vector-based SV systems across groups defined by gender and accent of the speakers when speaking English. To this end, we created a new dataset based on the VoxCeleb corpus by selecting samples from speakers with accents from different countries. We used this dataset to evaluate system performance of SV systems trained with VoxCeleb data. We show that performance, measured with a calibration-sensitive metric, is markedly degraded on groups that are underrepresented in training: females and speakers with non-native accents in English. Finally, we show that a simple data balancing approach mitigates this undesirable bias on the minority groups without degrading performance on the majority groups. Link al trabajo completo en documentos relacionados. Sociedad Argentina de Informática e Investigación Operativa
description	Los sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios.
publishDate	2025
dc.date.none.fl_str_mv	2025-08
dc.type.none.fl_str_mv	info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia
format	conferenceObject
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://sedici.unlp.edu.ar/handle/10915/190549
url	http://sedici.unlp.edu.ar/handle/10915/190549
dc.language.none.fl_str_mv	eng
language	eng
dc.relation.none.fl_str_mv	info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19821 info:eu-repo/semantics/altIdentifier/issn/2451-7496 info:eu-repo/semantics/reference/doi/10.48550/arXiv.2204.12649 Focus to learn more
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv	openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv	application/pdf 249-250
dc.source.none.fl_str_mv	reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP
reponame_str	SEDICI (UNLP)
collection	SEDICI (UNLP)
instname_str	Universidad Nacional de La Plata
instacron_str	UNLP
institution	UNLP
repository.name.fl_str_mv	SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv	alira@sedici.unlp.edu.ar
_version_	1866372189634166784
score	13.343132

Study on the fairness of speaker verification systems across accent and gender groups

Publicaciones similares