Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla

Autores: Kemmerer, Iara; Gerard, Matías F.; Vignolo, Leandro D.
Año de publicación: 2024
Idioma: español castellano
Tipo de recurso: documento de conferencia
Estado: versión publicada
Descripción: Los trastornos del neurodesarrollo afectan las habilidades de percepción y procesamiento del lenguaje en niños de diferentes edades. Las herramientas de diagnóstico asistido por computadora son de vital importancia para la detección temprana de trastornos del habla y el lenguaje en niños. En este trabajo se explora el uso de modelos de aprendizaje profundo para la detección del Trastorno Específico del Lenguaje a partir de la voz. Para esto se comparan dos enfoques que se emplean para alimentar los modelos neuronales: uno en el que se emplean las señales de audio sin procesar, y otro que se alimenta con espectrogramas derivados de esas señales. Se proponen tres modelos neuronales para realizar la clasificación, dos para el primer enfoque de preprocesamiento de datos y uno para el segundo. Los tres modelos emplean un bloque basado en redes neuronales convolucionales para extraer características. El primero usa una capa completamente conectada como clasificador, mientras que los otros dos procesan la información secuencial mediante redes recurrentes y luego clasifican con una red completamente conectada. A su vez, se exploran estrategias de aumentación de datos, como la adición de ruido, estiramiento temporal, corrimiento temporal y cambio de tono, para analizar su impacto en el desempeño de estas propuestas. Los resultados muestran que los modelos que utilizan las señales sin procesar alcanzan las mejores métricas. Además, el uso de las estrategias de aumentación mejora el desempeño de los modelos propuestos.
Sociedad Argentina de Informática e Investigación Operativa
Materia: Ciencias Informáticas
Modelos neuronales profundos
Trastorno del habla
Aumentación de datos
Nivel de accesibilidad: acceso abierto
Condiciones de uso: http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
Institución: Universidad Nacional de La Plata
OAI Identificador: oai:sedici.unlp.edu.ar:10915/177182

Acceder

id	SEDICI_8c3d361b8767574a211732a6cc288166
oai_identifier_str	oai:sedici.unlp.edu.ar:10915/177182
network_acronym_str	SEDICI
repository_id_str	1329
network_name_str	SEDICI (UNLP)
spelling	Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del hablaKemmerer, IaraGerard, Matías F.Vignolo, Leandro D.Ciencias InformáticasModelos neuronales profundosTrastorno del hablaAumentación de datosLos trastornos del neurodesarrollo afectan las habilidades de percepción y procesamiento del lenguaje en niños de diferentes edades. Las herramientas de diagnóstico asistido por computadora son de vital importancia para la detección temprana de trastornos del habla y el lenguaje en niños. En este trabajo se explora el uso de modelos de aprendizaje profundo para la detección del Trastorno Específico del Lenguaje a partir de la voz. Para esto se comparan dos enfoques que se emplean para alimentar los modelos neuronales: uno en el que se emplean las señales de audio sin procesar, y otro que se alimenta con espectrogramas derivados de esas señales. Se proponen tres modelos neuronales para realizar la clasificación, dos para el primer enfoque de preprocesamiento de datos y uno para el segundo. Los tres modelos emplean un bloque basado en redes neuronales convolucionales para extraer características. El primero usa una capa completamente conectada como clasificador, mientras que los otros dos procesan la información secuencial mediante redes recurrentes y luego clasifican con una red completamente conectada. A su vez, se exploran estrategias de aumentación de datos, como la adición de ruido, estiramiento temporal, corrimiento temporal y cambio de tono, para analizar su impacto en el desempeño de estas propuestas. Los resultados muestran que los modelos que utilizan las señales sin procesar alcanzan las mejores métricas. Además, el uso de las estrategias de aumentación mejora el desempeño de los modelos propuestos.Sociedad Argentina de Informática e Investigación Operativa2024-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf119-132http://sedici.unlp.edu.ar/handle/10915/177182spainfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/17916info:eu-repo/semantics/altIdentifier/issn/2451-7496info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-12-23T11:49:52Zoai:sedici.unlp.edu.ar:10915/177182Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-12-23 11:49:52.526SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv	Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla
title	Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla
spellingShingle	Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla Kemmerer, Iara Ciencias Informáticas Modelos neuronales profundos Trastorno del habla Aumentación de datos
title_short	Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla
title_full	Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla
title_fullStr	Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla
title_full_unstemmed	Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla
title_sort	Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla
dc.creator.none.fl_str_mv	Kemmerer, Iara Gerard, Matías F. Vignolo, Leandro D.
author	Kemmerer, Iara
author_facet	Kemmerer, Iara Gerard, Matías F. Vignolo, Leandro D.
author_role	author
author2	Gerard, Matías F. Vignolo, Leandro D.
author2_role	author author
dc.subject.none.fl_str_mv	Ciencias Informáticas Modelos neuronales profundos Trastorno del habla Aumentación de datos
topic	Ciencias Informáticas Modelos neuronales profundos Trastorno del habla Aumentación de datos
dc.description.none.fl_txt_mv	Los trastornos del neurodesarrollo afectan las habilidades de percepción y procesamiento del lenguaje en niños de diferentes edades. Las herramientas de diagnóstico asistido por computadora son de vital importancia para la detección temprana de trastornos del habla y el lenguaje en niños. En este trabajo se explora el uso de modelos de aprendizaje profundo para la detección del Trastorno Específico del Lenguaje a partir de la voz. Para esto se comparan dos enfoques que se emplean para alimentar los modelos neuronales: uno en el que se emplean las señales de audio sin procesar, y otro que se alimenta con espectrogramas derivados de esas señales. Se proponen tres modelos neuronales para realizar la clasificación, dos para el primer enfoque de preprocesamiento de datos y uno para el segundo. Los tres modelos emplean un bloque basado en redes neuronales convolucionales para extraer características. El primero usa una capa completamente conectada como clasificador, mientras que los otros dos procesan la información secuencial mediante redes recurrentes y luego clasifican con una red completamente conectada. A su vez, se exploran estrategias de aumentación de datos, como la adición de ruido, estiramiento temporal, corrimiento temporal y cambio de tono, para analizar su impacto en el desempeño de estas propuestas. Los resultados muestran que los modelos que utilizan las señales sin procesar alcanzan las mejores métricas. Además, el uso de las estrategias de aumentación mejora el desempeño de los modelos propuestos. Sociedad Argentina de Informática e Investigación Operativa
description	Los trastornos del neurodesarrollo afectan las habilidades de percepción y procesamiento del lenguaje en niños de diferentes edades. Las herramientas de diagnóstico asistido por computadora son de vital importancia para la detección temprana de trastornos del habla y el lenguaje en niños. En este trabajo se explora el uso de modelos de aprendizaje profundo para la detección del Trastorno Específico del Lenguaje a partir de la voz. Para esto se comparan dos enfoques que se emplean para alimentar los modelos neuronales: uno en el que se emplean las señales de audio sin procesar, y otro que se alimenta con espectrogramas derivados de esas señales. Se proponen tres modelos neuronales para realizar la clasificación, dos para el primer enfoque de preprocesamiento de datos y uno para el segundo. Los tres modelos emplean un bloque basado en redes neuronales convolucionales para extraer características. El primero usa una capa completamente conectada como clasificador, mientras que los otros dos procesan la información secuencial mediante redes recurrentes y luego clasifican con una red completamente conectada. A su vez, se exploran estrategias de aumentación de datos, como la adición de ruido, estiramiento temporal, corrimiento temporal y cambio de tono, para analizar su impacto en el desempeño de estas propuestas. Los resultados muestran que los modelos que utilizan las señales sin procesar alcanzan las mejores métricas. Además, el uso de las estrategias de aumentación mejora el desempeño de los modelos propuestos.
publishDate	2024
dc.date.none.fl_str_mv	2024-08
dc.type.none.fl_str_mv	info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia
format	conferenceObject
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://sedici.unlp.edu.ar/handle/10915/177182
url	http://sedici.unlp.edu.ar/handle/10915/177182
dc.language.none.fl_str_mv	spa
language	spa
dc.relation.none.fl_str_mv	info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/JAIIO/article/view/17916 info:eu-repo/semantics/altIdentifier/issn/2451-7496
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv	openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv	application/pdf 119-132
dc.source.none.fl_str_mv	reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP
reponame_str	SEDICI (UNLP)
collection	SEDICI (UNLP)
instname_str	Universidad Nacional de La Plata
instacron_str	UNLP
institution	UNLP
repository.name.fl_str_mv	SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv	alira@sedici.unlp.edu.ar
_version_	1852334774088105984
score	12.952241

Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla

Publicaciones similares