Study on the fairness of speaker verification systems across accent and gender groups
- Autores
- Estevez, Mariel; Ferrer, Luciana
- Año de publicación
- 2025
- Idioma
- inglés
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- Los sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios.
Speaker verification (SV) systems are currently used for consequential tasks like giving access to bank accounts or making forensic decisions. Ensuring that these systems are fair and do not disfavor any particular group is crucial. In this work, we analyze the performance of two X-vector-based SV systems across groups defined by gender and accent of the speakers when speaking English. To this end, we created a new dataset based on the VoxCeleb corpus by selecting samples from speakers with accents from different countries. We used this dataset to evaluate system performance of SV systems trained with VoxCeleb data. We show that performance, measured with a calibration-sensitive metric, is markedly degraded on groups that are underrepresented in training: females and speakers with non-native accents in English. Finally, we show that a simple data balancing approach mitigates this undesirable bias on the minority groups without degrading performance on the majority groups.
Link al trabajo completo en documentos relacionados.
Sociedad Argentina de Informática e Investigación Operativa - Materia
-
Ciencias Informáticas
Verificación del hablante
Justicia
Tendencia
Calibración
Speaker verification
Fairness
Bias
Calibration - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/190549
Ver los metadatos del registro completo
| id |
SEDICI_71af3f68daabaa16b4045d1480586e9f |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/190549 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
Study on the fairness of speaker verification systems across accent and gender groupsEstudio de la justicia en sistemas de Verificación del Hablante a través de grupos de acento y géneroEstevez, MarielFerrer, LucianaCiencias InformáticasVerificación del hablanteJusticiaTendenciaCalibraciónSpeaker verificationFairnessBiasCalibrationLos sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios.Speaker verification (SV) systems are currently used for consequential tasks like giving access to bank accounts or making forensic decisions. Ensuring that these systems are fair and do not disfavor any particular group is crucial. In this work, we analyze the performance of two X-vector-based SV systems across groups defined by gender and accent of the speakers when speaking English. To this end, we created a new dataset based on the VoxCeleb corpus by selecting samples from speakers with accents from different countries. We used this dataset to evaluate system performance of SV systems trained with VoxCeleb data. We show that performance, measured with a calibration-sensitive metric, is markedly degraded on groups that are underrepresented in training: females and speakers with non-native accents in English. Finally, we show that a simple data balancing approach mitigates this undesirable bias on the minority groups without degrading performance on the majority groups.Link al trabajo completo en documentos relacionados.Sociedad Argentina de Informática e Investigación Operativa2025-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf249-250http://sedici.unlp.edu.ar/handle/10915/190549enginfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19821info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/reference/doi/10.48550/arXiv.2204.12649 Focus to learn moreinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-02-26T11:39:42Zoai:sedici.unlp.edu.ar:10915/190549Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-02-26 11:39:42.693SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
Study on the fairness of speaker verification systems across accent and gender groups Estudio de la justicia en sistemas de Verificación del Hablante a través de grupos de acento y género |
| title |
Study on the fairness of speaker verification systems across accent and gender groups |
| spellingShingle |
Study on the fairness of speaker verification systems across accent and gender groups Estevez, Mariel Ciencias Informáticas Verificación del hablante Justicia Tendencia Calibración Speaker verification Fairness Bias Calibration |
| title_short |
Study on the fairness of speaker verification systems across accent and gender groups |
| title_full |
Study on the fairness of speaker verification systems across accent and gender groups |
| title_fullStr |
Study on the fairness of speaker verification systems across accent and gender groups |
| title_full_unstemmed |
Study on the fairness of speaker verification systems across accent and gender groups |
| title_sort |
Study on the fairness of speaker verification systems across accent and gender groups |
| dc.creator.none.fl_str_mv |
Estevez, Mariel Ferrer, Luciana |
| author |
Estevez, Mariel |
| author_facet |
Estevez, Mariel Ferrer, Luciana |
| author_role |
author |
| author2 |
Ferrer, Luciana |
| author2_role |
author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas Verificación del hablante Justicia Tendencia Calibración Speaker verification Fairness Bias Calibration |
| topic |
Ciencias Informáticas Verificación del hablante Justicia Tendencia Calibración Speaker verification Fairness Bias Calibration |
| dc.description.none.fl_txt_mv |
Los sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios. Speaker verification (SV) systems are currently used for consequential tasks like giving access to bank accounts or making forensic decisions. Ensuring that these systems are fair and do not disfavor any particular group is crucial. In this work, we analyze the performance of two X-vector-based SV systems across groups defined by gender and accent of the speakers when speaking English. To this end, we created a new dataset based on the VoxCeleb corpus by selecting samples from speakers with accents from different countries. We used this dataset to evaluate system performance of SV systems trained with VoxCeleb data. We show that performance, measured with a calibration-sensitive metric, is markedly degraded on groups that are underrepresented in training: females and speakers with non-native accents in English. Finally, we show that a simple data balancing approach mitigates this undesirable bias on the minority groups without degrading performance on the majority groups. Link al trabajo completo en documentos relacionados. Sociedad Argentina de Informática e Investigación Operativa |
| description |
Los sistemas de verificación de hablantes (SV) se utilizan actualmente para tareas importantes como el acceso a cuentas bancarias. Es crucial garantizar que estos sistemas sean justos y no perjudiquen a ningún grupo en particular. En este trabajo, analizamos el rendimiento de dos sistemas de SV usando X vectors en grupos definidos por el género y el acento de los hablantes al hablar inglés. Para ello, creamos un nuevo conjunto de datos basado en el corpus de VoxCeleb, seleccionando muestras de hablantes con acentos de diferentes países y lo utilizamos para evaluar el rendimiento de los sistemas de SV entrenados con datos de VoxCeleb. Demostramos que el rendimiento, medido con una métrica sensible a la calibración, se degrada notablemente en los grupos subrepresentados en el entrenamiento y que un enfoque simple de equilibrio de datos mitiga este sesgo indeseable en los grupos minoritarios sin degradar el rendimiento en los grupos mayoritarios. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-08 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
| format |
conferenceObject |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/190549 |
| url |
http://sedici.unlp.edu.ar/handle/10915/190549 |
| dc.language.none.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19821 info:eu-repo/semantics/altIdentifier/issn/2451-7496 info:eu-repo/semantics/reference/doi/10.48550/arXiv.2204.12649 Focus to learn more |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf 249-250 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1858282592011288576 |
| score |
12.665996 |