Automatic Pronunciation Assessment Systems for English Students from Argentina

Autores
Vidal, Jazmin; Bonomi, Cyntia; Riera, Pablo; Ferrer, Luciana
Año de publicación
2025
Idioma
inglés
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
English proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository.
El dominio del inglés es crucial para la educación, trabajo y participación  global. Pese a esfuerzos gubernamentales en América Latina, la escasez de profesores genera disparidades que afectan principalmente a estudiantes de bajos recursos y zonas rurales, quienes no pueden complementar su educación con clases particulares. Consecuentemente, muchos se gradúan sin habilidades conversacionales básicas La Asistencia Computarizada de Aprendizaje de Idiomas (ACAI) ha mejorado la educa-ción del lenguaje mediante soluciones remotas que reducen la carga docente y ofrecen práctica personalizada. Sin embargo, estos sistemas son subóptimos para la pronunciación en especial cuando se trata de detectar errores segmentales. Además, suelen estar centrados en la natividad y no en la inteligibilidad, es decir, en captar errores que puedan afectar la comunicación. Nuestro objetivo es desarrollar una aplicación gratuita para estudiantes argentinos de inglés, enfocándonos en la pronunciación a nivel segmental (fonos o sílabas), método más efectivo para principiantes que la evaluación por frases completas. Priorizamos los errores que más afectan la comunicación. Para esto, creamos EpaDB, una base de datos de habla inglesa de argentinos para desarrollar sistemas de calificación de pronunciación. Exploramos dos estrategias ante la escasez de datos: un enfoque de aprendizaje por transferencia que demostró mejoras significativas sobre métodos estándar, y la implementación comparativa de modelos de aprendizaje auto supervisado, con todo nuestro código disponible abiertamente.
Link al trabajo completo en otros documentos.
Sociedad Argentina de Informática e Investigación Operativa
Materia
Ciencias Informáticas
Automatic system
Pronunciation
Student
English
sistema automático
pronunciación
Estudiante
Inglés
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/190528

id SEDICI_247a5ebc0303a77dea4ab7ca79906699
oai_identifier_str oai:sedici.unlp.edu.ar:10915/190528
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Automatic Pronunciation Assessment Systems for English Students from ArgentinaSistemas automáticos de evaluación de la pronunciación para estudiantes de inglés de ArgentinaVidal, JazminBonomi, CyntiaRiera, PabloFerrer, LucianaCiencias InformáticasAutomatic systemPronunciationStudentEnglishsistema automáticopronunciaciónEstudianteInglésEnglish proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository.El dominio del inglés es crucial para la educación, trabajo y participación  global. Pese a esfuerzos gubernamentales en América Latina, la escasez de profesores genera disparidades que afectan principalmente a estudiantes de bajos recursos y zonas rurales, quienes no pueden complementar su educación con clases particulares. Consecuentemente, muchos se gradúan sin habilidades conversacionales básicas La Asistencia Computarizada de Aprendizaje de Idiomas (ACAI) ha mejorado la educa-ción del lenguaje mediante soluciones remotas que reducen la carga docente y ofrecen práctica personalizada. Sin embargo, estos sistemas son subóptimos para la pronunciación en especial cuando se trata de detectar errores segmentales. Además, suelen estar centrados en la natividad y no en la inteligibilidad, es decir, en captar errores que puedan afectar la comunicación. Nuestro objetivo es desarrollar una aplicación gratuita para estudiantes argentinos de inglés, enfocándonos en la pronunciación a nivel segmental (fonos o sílabas), método más efectivo para principiantes que la evaluación por frases completas. Priorizamos los errores que más afectan la comunicación. Para esto, creamos EpaDB, una base de datos de habla inglesa de argentinos para desarrollar sistemas de calificación de pronunciación. Exploramos dos estrategias ante la escasez de datos: un enfoque de aprendizaje por transferencia que demostró mejoras significativas sobre métodos estándar, y la implementación comparativa de modelos de aprendizaje auto supervisado, con todo nuestro código disponible abiertamente.Link al trabajo completo en otros documentos.Sociedad Argentina de Informática e Investigación Operativa2025-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf65-66http://sedici.unlp.edu.ar/handle/10915/190528enginfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19743info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/reference/doi/10.1145/3653326info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-02-26T11:39:42Zoai:sedici.unlp.edu.ar:10915/190528Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-02-26 11:39:42.621SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Automatic Pronunciation Assessment Systems for English Students from Argentina
Sistemas automáticos de evaluación de la pronunciación para estudiantes de inglés de Argentina
title Automatic Pronunciation Assessment Systems for English Students from Argentina
spellingShingle Automatic Pronunciation Assessment Systems for English Students from Argentina
Vidal, Jazmin
Ciencias Informáticas
Automatic system
Pronunciation
Student
English
sistema automático
pronunciación
Estudiante
Inglés
title_short Automatic Pronunciation Assessment Systems for English Students from Argentina
title_full Automatic Pronunciation Assessment Systems for English Students from Argentina
title_fullStr Automatic Pronunciation Assessment Systems for English Students from Argentina
title_full_unstemmed Automatic Pronunciation Assessment Systems for English Students from Argentina
title_sort Automatic Pronunciation Assessment Systems for English Students from Argentina
dc.creator.none.fl_str_mv Vidal, Jazmin
Bonomi, Cyntia
Riera, Pablo
Ferrer, Luciana
author Vidal, Jazmin
author_facet Vidal, Jazmin
Bonomi, Cyntia
Riera, Pablo
Ferrer, Luciana
author_role author
author2 Bonomi, Cyntia
Riera, Pablo
Ferrer, Luciana
author2_role author
author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Automatic system
Pronunciation
Student
English
sistema automático
pronunciación
Estudiante
Inglés
topic Ciencias Informáticas
Automatic system
Pronunciation
Student
English
sistema automático
pronunciación
Estudiante
Inglés
dc.description.none.fl_txt_mv English proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository.
El dominio del inglés es crucial para la educación, trabajo y participación  global. Pese a esfuerzos gubernamentales en América Latina, la escasez de profesores genera disparidades que afectan principalmente a estudiantes de bajos recursos y zonas rurales, quienes no pueden complementar su educación con clases particulares. Consecuentemente, muchos se gradúan sin habilidades conversacionales básicas La Asistencia Computarizada de Aprendizaje de Idiomas (ACAI) ha mejorado la educa-ción del lenguaje mediante soluciones remotas que reducen la carga docente y ofrecen práctica personalizada. Sin embargo, estos sistemas son subóptimos para la pronunciación en especial cuando se trata de detectar errores segmentales. Además, suelen estar centrados en la natividad y no en la inteligibilidad, es decir, en captar errores que puedan afectar la comunicación. Nuestro objetivo es desarrollar una aplicación gratuita para estudiantes argentinos de inglés, enfocándonos en la pronunciación a nivel segmental (fonos o sílabas), método más efectivo para principiantes que la evaluación por frases completas. Priorizamos los errores que más afectan la comunicación. Para esto, creamos EpaDB, una base de datos de habla inglesa de argentinos para desarrollar sistemas de calificación de pronunciación. Exploramos dos estrategias ante la escasez de datos: un enfoque de aprendizaje por transferencia que demostró mejoras significativas sobre métodos estándar, y la implementación comparativa de modelos de aprendizaje auto supervisado, con todo nuestro código disponible abiertamente.
Link al trabajo completo en otros documentos.
Sociedad Argentina de Informática e Investigación Operativa
description English proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository.
publishDate 2025
dc.date.none.fl_str_mv 2025-08
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/190528
url http://sedici.unlp.edu.ar/handle/10915/190528
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19743
info:eu-repo/semantics/altIdentifier/issn/2451-7496
info:eu-repo/semantics/reference/doi/10.1145/3653326
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
65-66
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1858282591291965440
score 12.665996