Automatic Pronunciation Assessment Systems for English Students from Argentina
- Autores
- Vidal, Jazmin; Bonomi, Cyntia; Riera, Pablo; Ferrer, Luciana
- Año de publicación
- 2025
- Idioma
- inglés
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- English proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository.
El dominio del inglés es crucial para la educación, trabajo y participación global. Pese a esfuerzos gubernamentales en América Latina, la escasez de profesores genera disparidades que afectan principalmente a estudiantes de bajos recursos y zonas rurales, quienes no pueden complementar su educación con clases particulares. Consecuentemente, muchos se gradúan sin habilidades conversacionales básicas La Asistencia Computarizada de Aprendizaje de Idiomas (ACAI) ha mejorado la educa-ción del lenguaje mediante soluciones remotas que reducen la carga docente y ofrecen práctica personalizada. Sin embargo, estos sistemas son subóptimos para la pronunciación en especial cuando se trata de detectar errores segmentales. Además, suelen estar centrados en la natividad y no en la inteligibilidad, es decir, en captar errores que puedan afectar la comunicación. Nuestro objetivo es desarrollar una aplicación gratuita para estudiantes argentinos de inglés, enfocándonos en la pronunciación a nivel segmental (fonos o sílabas), método más efectivo para principiantes que la evaluación por frases completas. Priorizamos los errores que más afectan la comunicación. Para esto, creamos EpaDB, una base de datos de habla inglesa de argentinos para desarrollar sistemas de calificación de pronunciación. Exploramos dos estrategias ante la escasez de datos: un enfoque de aprendizaje por transferencia que demostró mejoras significativas sobre métodos estándar, y la implementación comparativa de modelos de aprendizaje auto supervisado, con todo nuestro código disponible abiertamente.
Link al trabajo completo en otros documentos.
Sociedad Argentina de Informática e Investigación Operativa - Materia
-
Ciencias Informáticas
Automatic system
Pronunciation
Student
English
sistema automático
pronunciación
Estudiante
Inglés - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/190528
Ver los metadatos del registro completo
| id |
SEDICI_247a5ebc0303a77dea4ab7ca79906699 |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/190528 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
Automatic Pronunciation Assessment Systems for English Students from ArgentinaSistemas automáticos de evaluación de la pronunciación para estudiantes de inglés de ArgentinaVidal, JazminBonomi, CyntiaRiera, PabloFerrer, LucianaCiencias InformáticasAutomatic systemPronunciationStudentEnglishsistema automáticopronunciaciónEstudianteInglésEnglish proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository.El dominio del inglés es crucial para la educación, trabajo y participación global. Pese a esfuerzos gubernamentales en América Latina, la escasez de profesores genera disparidades que afectan principalmente a estudiantes de bajos recursos y zonas rurales, quienes no pueden complementar su educación con clases particulares. Consecuentemente, muchos se gradúan sin habilidades conversacionales básicas La Asistencia Computarizada de Aprendizaje de Idiomas (ACAI) ha mejorado la educa-ción del lenguaje mediante soluciones remotas que reducen la carga docente y ofrecen práctica personalizada. Sin embargo, estos sistemas son subóptimos para la pronunciación en especial cuando se trata de detectar errores segmentales. Además, suelen estar centrados en la natividad y no en la inteligibilidad, es decir, en captar errores que puedan afectar la comunicación. Nuestro objetivo es desarrollar una aplicación gratuita para estudiantes argentinos de inglés, enfocándonos en la pronunciación a nivel segmental (fonos o sílabas), método más efectivo para principiantes que la evaluación por frases completas. Priorizamos los errores que más afectan la comunicación. Para esto, creamos EpaDB, una base de datos de habla inglesa de argentinos para desarrollar sistemas de calificación de pronunciación. Exploramos dos estrategias ante la escasez de datos: un enfoque de aprendizaje por transferencia que demostró mejoras significativas sobre métodos estándar, y la implementación comparativa de modelos de aprendizaje auto supervisado, con todo nuestro código disponible abiertamente.Link al trabajo completo en otros documentos.Sociedad Argentina de Informática e Investigación Operativa2025-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf65-66http://sedici.unlp.edu.ar/handle/10915/190528enginfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19743info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/reference/doi/10.1145/3653326info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-02-26T11:39:42Zoai:sedici.unlp.edu.ar:10915/190528Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-02-26 11:39:42.621SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
Automatic Pronunciation Assessment Systems for English Students from Argentina Sistemas automáticos de evaluación de la pronunciación para estudiantes de inglés de Argentina |
| title |
Automatic Pronunciation Assessment Systems for English Students from Argentina |
| spellingShingle |
Automatic Pronunciation Assessment Systems for English Students from Argentina Vidal, Jazmin Ciencias Informáticas Automatic system Pronunciation Student English sistema automático pronunciación Estudiante Inglés |
| title_short |
Automatic Pronunciation Assessment Systems for English Students from Argentina |
| title_full |
Automatic Pronunciation Assessment Systems for English Students from Argentina |
| title_fullStr |
Automatic Pronunciation Assessment Systems for English Students from Argentina |
| title_full_unstemmed |
Automatic Pronunciation Assessment Systems for English Students from Argentina |
| title_sort |
Automatic Pronunciation Assessment Systems for English Students from Argentina |
| dc.creator.none.fl_str_mv |
Vidal, Jazmin Bonomi, Cyntia Riera, Pablo Ferrer, Luciana |
| author |
Vidal, Jazmin |
| author_facet |
Vidal, Jazmin Bonomi, Cyntia Riera, Pablo Ferrer, Luciana |
| author_role |
author |
| author2 |
Bonomi, Cyntia Riera, Pablo Ferrer, Luciana |
| author2_role |
author author author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas Automatic system Pronunciation Student English sistema automático pronunciación Estudiante Inglés |
| topic |
Ciencias Informáticas Automatic system Pronunciation Student English sistema automático pronunciación Estudiante Inglés |
| dc.description.none.fl_txt_mv |
English proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository. El dominio del inglés es crucial para la educación, trabajo y participación global. Pese a esfuerzos gubernamentales en América Latina, la escasez de profesores genera disparidades que afectan principalmente a estudiantes de bajos recursos y zonas rurales, quienes no pueden complementar su educación con clases particulares. Consecuentemente, muchos se gradúan sin habilidades conversacionales básicas La Asistencia Computarizada de Aprendizaje de Idiomas (ACAI) ha mejorado la educa-ción del lenguaje mediante soluciones remotas que reducen la carga docente y ofrecen práctica personalizada. Sin embargo, estos sistemas son subóptimos para la pronunciación en especial cuando se trata de detectar errores segmentales. Además, suelen estar centrados en la natividad y no en la inteligibilidad, es decir, en captar errores que puedan afectar la comunicación. Nuestro objetivo es desarrollar una aplicación gratuita para estudiantes argentinos de inglés, enfocándonos en la pronunciación a nivel segmental (fonos o sílabas), método más efectivo para principiantes que la evaluación por frases completas. Priorizamos los errores que más afectan la comunicación. Para esto, creamos EpaDB, una base de datos de habla inglesa de argentinos para desarrollar sistemas de calificación de pronunciación. Exploramos dos estrategias ante la escasez de datos: un enfoque de aprendizaje por transferencia que demostró mejoras significativas sobre métodos estándar, y la implementación comparativa de modelos de aprendizaje auto supervisado, con todo nuestro código disponible abiertamente. Link al trabajo completo en otros documentos. Sociedad Argentina de Informática e Investigación Operativa |
| description |
English proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-08 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
| format |
conferenceObject |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/190528 |
| url |
http://sedici.unlp.edu.ar/handle/10915/190528 |
| dc.language.none.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19743 info:eu-repo/semantics/altIdentifier/issn/2451-7496 info:eu-repo/semantics/reference/doi/10.1145/3653326 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf 65-66 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1858282591291965440 |
| score |
12.665996 |