Study on the fairness of speaker verification systems across accent and gender groups

Autores
Estevez, Mariel; Ferrer, Luciana
Año de publicación
2025
Idioma
inglés
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Los sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios.
Speaker verification (SV) systems are currently used for consequential tasks like giving access to bank accounts or making forensic decisions. Ensuring that these systems are fair and do not disfavor any particular group is crucial. In this work, we analyze the performance of two X-vector-based SV systems across groups defined by gender and accent of the speakers when speaking English. To this end, we created a new dataset based on the VoxCeleb corpus by selecting samples from speakers with accents from different countries. We used this dataset to evaluate system performance of SV systems trained with VoxCeleb data. We show that performance, measured with a calibration-sensitive metric, is markedly degraded on groups that are underrepresented in training: females and speakers with non-native accents in English. Finally, we show that a simple data balancing approach mitigates this undesirable bias on the minority groups without degrading performance on the majority groups.
Link al trabajo completo en documentos relacionados.
Sociedad Argentina de Informática e Investigación Operativa
Materia
Ciencias Informáticas
Verificación del hablante
Justicia
Tendencia
Calibración
Speaker verification
Fairness
Bias
Calibration
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/190549

id SEDICI_71af3f68daabaa16b4045d1480586e9f
oai_identifier_str oai:sedici.unlp.edu.ar:10915/190549
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Study on the fairness of speaker verification systems across accent and gender groupsEstudio de la justicia en sistemas de Verificación del Hablante a través de grupos de acento y géneroEstevez, MarielFerrer, LucianaCiencias InformáticasVerificación del hablanteJusticiaTendenciaCalibraciónSpeaker verificationFairnessBiasCalibrationLos sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios.Speaker verification (SV) systems are currently used for consequential tasks like giving access to bank accounts or making forensic decisions. Ensuring that these systems are fair and do not disfavor any particular group is crucial. In this work, we analyze the performance of two X-vector-based SV systems across groups defined by gender and accent of the speakers when speaking English. To this end, we created a new dataset based on the VoxCeleb corpus by selecting samples from speakers with accents from different countries. We used this dataset to evaluate system performance of SV systems trained with VoxCeleb data. We show that performance, measured with a calibration-sensitive metric, is markedly degraded on groups that are underrepresented in training: females and speakers with non-native accents in English. Finally, we show that a simple data balancing approach mitigates this undesirable bias on the minority groups without degrading performance on the majority groups.Link al trabajo completo en documentos relacionados.Sociedad Argentina de Informática e Investigación Operativa2025-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf249-250http://sedici.unlp.edu.ar/handle/10915/190549enginfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19821info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/reference/doi/10.48550/arXiv.2204.12649 Focus to learn moreinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-02-26T11:39:42Zoai:sedici.unlp.edu.ar:10915/190549Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-02-26 11:39:42.693SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Study on the fairness of speaker verification systems across accent and gender groups
Estudio de la justicia en sistemas de Verificación del Hablante a través de grupos de acento y género
title Study on the fairness of speaker verification systems across accent and gender groups
spellingShingle Study on the fairness of speaker verification systems across accent and gender groups
Estevez, Mariel
Ciencias Informáticas
Verificación del hablante
Justicia
Tendencia
Calibración
Speaker verification
Fairness
Bias
Calibration
title_short Study on the fairness of speaker verification systems across accent and gender groups
title_full Study on the fairness of speaker verification systems across accent and gender groups
title_fullStr Study on the fairness of speaker verification systems across accent and gender groups
title_full_unstemmed Study on the fairness of speaker verification systems across accent and gender groups
title_sort Study on the fairness of speaker verification systems across accent and gender groups
dc.creator.none.fl_str_mv Estevez, Mariel
Ferrer, Luciana
author Estevez, Mariel
author_facet Estevez, Mariel
Ferrer, Luciana
author_role author
author2 Ferrer, Luciana
author2_role author
dc.subject.none.fl_str_mv Ciencias Informáticas
Verificación del hablante
Justicia
Tendencia
Calibración
Speaker verification
Fairness
Bias
Calibration
topic Ciencias Informáticas
Verificación del hablante
Justicia
Tendencia
Calibración
Speaker verification
Fairness
Bias
Calibration
dc.description.none.fl_txt_mv Los sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios.
Speaker verification (SV) systems are currently used for consequential tasks like giving access to bank accounts or making forensic decisions. Ensuring that these systems are fair and do not disfavor any particular group is crucial. In this work, we analyze the performance of two X-vector-based SV systems across groups defined by gender and accent of the speakers when speaking English. To this end, we created a new dataset based on the VoxCeleb corpus by selecting samples from speakers with accents from different countries. We used this dataset to evaluate system performance of SV systems trained with VoxCeleb data. We show that performance, measured with a calibration-sensitive metric, is markedly degraded on groups that are underrepresented in training: females and speakers with non-native accents in English. Finally, we show that a simple data balancing approach mitigates this undesirable bias on the minority groups without degrading performance on the majority groups.
Link al trabajo completo en documentos relacionados.
Sociedad Argentina de Informática e Investigación Operativa
description Los sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios.
publishDate 2025
dc.date.none.fl_str_mv 2025-08
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/190549
url http://sedici.unlp.edu.ar/handle/10915/190549
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19821
info:eu-repo/semantics/altIdentifier/issn/2451-7496
info:eu-repo/semantics/reference/doi/10.48550/arXiv.2204.12649 Focus to learn more
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
249-250
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1858282592011288576
score 12.665996