Automatic Pronunciation Assessment Systems for English Students from Argentina

Autores: Vidal, Jazmin; Bonomi, Cyntia; Riera, Pablo; Ferrer, Luciana
Año de publicación: 2025
Idioma: inglés
Tipo de recurso: documento de conferencia
Estado: versión publicada
Descripción: English proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository.
El dominio del inglés es crucial para la educación, trabajo y participación global. Pese a esfuerzos gubernamentales en América Latina, la escasez de profesores genera disparidades que afectan principalmente a estudiantes de bajos recursos y zonas rurales, quienes no pueden complementar su educación con clases particulares. Consecuentemente, muchos se gradúan sin habilidades conversacionales básicas La Asistencia Computarizada de Aprendizaje de Idiomas (ACAI) ha mejorado la educa-ción del lenguaje mediante soluciones remotas que reducen la carga docente y ofrecen práctica personalizada. Sin embargo, estos sistemas son subóptimos para la pronunciación en especial cuando se trata de detectar errores segmentales. Además, suelen estar centrados en la natividad y no en la inteligibilidad, es decir, en captar errores que puedan afectar la comunicación. Nuestro objetivo es desarrollar una aplicación gratuita para estudiantes argentinos de inglés, enfocándonos en la pronunciación a nivel segmental (fonos o sílabas), método más efectivo para principiantes que la evaluación por frases completas. Priorizamos los errores que más afectan la comunicación. Para esto, creamos EpaDB, una base de datos de habla inglesa de argentinos para desarrollar sistemas de calificación de pronunciación. Exploramos dos estrategias ante la escasez de datos: un enfoque de aprendizaje por transferencia que demostró mejoras significativas sobre métodos estándar, y la implementación comparativa de modelos de aprendizaje auto supervisado, con todo nuestro código disponible abiertamente.
Link al trabajo completo en otros documentos.
Sociedad Argentina de Informática e Investigación Operativa
Materia: Ciencias Informáticas
Automatic system
Pronunciation
Student
English
sistema automático
pronunciación
Estudiante
Inglés
Nivel de accesibilidad: acceso abierto
Condiciones de uso: http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
Institución: Universidad Nacional de La Plata
OAI Identificador: oai:sedici.unlp.edu.ar:10915/190528

Acceder

id	SEDICI_247a5ebc0303a77dea4ab7ca79906699
oai_identifier_str	oai:sedici.unlp.edu.ar:10915/190528
network_acronym_str	SEDICI
repository_id_str	1329
network_name_str	SEDICI (UNLP)
spelling	Automatic Pronunciation Assessment Systems for English Students from ArgentinaSistemas automáticos de evaluación de la pronunciación para estudiantes de inglés de ArgentinaVidal, JazminBonomi, CyntiaRiera, PabloFerrer, LucianaCiencias InformáticasAutomatic systemPronunciationStudentEnglishsistema automáticopronunciaciónEstudianteInglésEnglish proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository.El dominio del inglés es crucial para la educación, trabajo y participación global. Pese a esfuerzos gubernamentales en América Latina, la escasez de profesores genera disparidades que afectan principalmente a estudiantes de bajos recursos y zonas rurales, quienes no pueden complementar su educación con clases particulares. Consecuentemente, muchos se gradúan sin habilidades conversacionales básicas La Asistencia Computarizada de Aprendizaje de Idiomas (ACAI) ha mejorado la educa-ción del lenguaje mediante soluciones remotas que reducen la carga docente y ofrecen práctica personalizada. Sin embargo, estos sistemas son subóptimos para la pronunciación en especial cuando se trata de detectar errores segmentales. Además, suelen estar centrados en la natividad y no en la inteligibilidad, es decir, en captar errores que puedan afectar la comunicación. Nuestro objetivo es desarrollar una aplicación gratuita para estudiantes argentinos de inglés, enfocándonos en la pronunciación a nivel segmental (fonos o sílabas), método más efectivo para principiantes que la evaluación por frases completas. Priorizamos los errores que más afectan la comunicación. Para esto, creamos EpaDB, una base de datos de habla inglesa de argentinos para desarrollar sistemas de calificación de pronunciación. Exploramos dos estrategias ante la escasez de datos: un enfoque de aprendizaje por transferencia que demostró mejoras significativas sobre métodos estándar, y la implementación comparativa de modelos de aprendizaje auto supervisado, con todo nuestro código disponible abiertamente.Link al trabajo completo en otros documentos.Sociedad Argentina de Informática e Investigación Operativa2025-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf65-66http://sedici.unlp.edu.ar/handle/10915/190528enginfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19743info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/reference/doi/10.1145/3653326info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-05-27T11:46:30Zoai:sedici.unlp.edu.ar:10915/190528Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-05-27 11:46:31.078SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv	Automatic Pronunciation Assessment Systems for English Students from Argentina Sistemas automáticos de evaluación de la pronunciación para estudiantes de inglés de Argentina
title	Automatic Pronunciation Assessment Systems for English Students from Argentina
spellingShingle	Automatic Pronunciation Assessment Systems for English Students from Argentina Vidal, Jazmin Ciencias Informáticas Automatic system Pronunciation Student English sistema automático pronunciación Estudiante Inglés
title_short	Automatic Pronunciation Assessment Systems for English Students from Argentina
title_full	Automatic Pronunciation Assessment Systems for English Students from Argentina
title_fullStr	Automatic Pronunciation Assessment Systems for English Students from Argentina
title_full_unstemmed	Automatic Pronunciation Assessment Systems for English Students from Argentina
title_sort	Automatic Pronunciation Assessment Systems for English Students from Argentina
dc.creator.none.fl_str_mv	Vidal, Jazmin Bonomi, Cyntia Riera, Pablo Ferrer, Luciana
author	Vidal, Jazmin
author_facet	Vidal, Jazmin Bonomi, Cyntia Riera, Pablo Ferrer, Luciana
author_role	author
author2	Bonomi, Cyntia Riera, Pablo Ferrer, Luciana
author2_role	author author author
dc.subject.none.fl_str_mv	Ciencias Informáticas Automatic system Pronunciation Student English sistema automático pronunciación Estudiante Inglés
topic	Ciencias Informáticas Automatic system Pronunciation Student English sistema automático pronunciación Estudiante Inglés
dc.description.none.fl_txt_mv	English proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository. El dominio del inglés es crucial para la educación, trabajo y participación global. Pese a esfuerzos gubernamentales en América Latina, la escasez de profesores genera disparidades que afectan principalmente a estudiantes de bajos recursos y zonas rurales, quienes no pueden complementar su educación con clases particulares. Consecuentemente, muchos se gradúan sin habilidades conversacionales básicas La Asistencia Computarizada de Aprendizaje de Idiomas (ACAI) ha mejorado la educa-ción del lenguaje mediante soluciones remotas que reducen la carga docente y ofrecen práctica personalizada. Sin embargo, estos sistemas son subóptimos para la pronunciación en especial cuando se trata de detectar errores segmentales. Además, suelen estar centrados en la natividad y no en la inteligibilidad, es decir, en captar errores que puedan afectar la comunicación. Nuestro objetivo es desarrollar una aplicación gratuita para estudiantes argentinos de inglés, enfocándonos en la pronunciación a nivel segmental (fonos o sílabas), método más efectivo para principiantes que la evaluación por frases completas. Priorizamos los errores que más afectan la comunicación. Para esto, creamos EpaDB, una base de datos de habla inglesa de argentinos para desarrollar sistemas de calificación de pronunciación. Exploramos dos estrategias ante la escasez de datos: un enfoque de aprendizaje por transferencia que demostró mejoras significativas sobre métodos estándar, y la implementación comparativa de modelos de aprendizaje auto supervisado, con todo nuestro código disponible abiertamente. Link al trabajo completo en otros documentos. Sociedad Argentina de Informática e Investigación Operativa
description	English proficiency is crucial for education, work, social mobility, and global engagement. Despite government efforts across Latin America to expand language learning opportunities, teacher shortages create persistent disparities, particularly affecting low-income and rural students who cannot supplement public educa-tion with private lessons. Consequently, many graduate without basic English conver-sational skills. Computer-Assisted Language Learning (CALL) has improved lan-guage education by offering remote learning solutions, reducing teacher workloads, and providing stress-free practice opportunities. However, these systems remain suboptimal for pronunciation learning due to poor performance in detecting errors in short speech segments. Additionally, they historically emphasized native-like pronunciation rather than intelligibility understood as those mispronunciations that cause communication breakdowns. Our long-term goal is to develop a free mobile and web application tailored to the needs of Argentinian English learners. We focus on segmental-level pronunciation (phones or syllables), which research shows is more effec-tive for novice learners than phrase-level evaluation. We prioritize errors that are most impacting intelligibility. To address these challenges, we created EpaDB, a database of non-native English speech by Argentinian speakers for developing phone-level pronunciation scoring systems. We then explored two strategies for handling extreme data scarcity: first, a transfer learning approach that demonstrated significant im-provements over standard methods. Second, we compared different self-supervised learning speech models for the task. All our code is available for research purposes in an opensource repository.
publishDate	2025
dc.date.none.fl_str_mv	2025-08
dc.type.none.fl_str_mv	info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia
format	conferenceObject
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://sedici.unlp.edu.ar/handle/10915/190528
url	http://sedici.unlp.edu.ar/handle/10915/190528
dc.language.none.fl_str_mv	eng
language	eng
dc.relation.none.fl_str_mv	info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/19743 info:eu-repo/semantics/altIdentifier/issn/2451-7496 info:eu-repo/semantics/reference/doi/10.1145/3653326
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv	openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv	application/pdf 65-66
dc.source.none.fl_str_mv	reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP
reponame_str	SEDICI (UNLP)
collection	SEDICI (UNLP)
instname_str	Universidad Nacional de La Plata
instacron_str	UNLP
institution	UNLP
repository.name.fl_str_mv	SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv	alira@sedici.unlp.edu.ar
_version_	1866372189097295872
score	13.343132

Automatic Pronunciation Assessment Systems for English Students from Argentina

Publicaciones similares