Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas

Autores
López Pérez, Jorge I.; Taire, Damián Leonardo; Delrieux, Claudio
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
En este trabajo se investiga la implementación de redes neuronales profundas en la clasificación de sonidos respiratorios, una tarea determinante para el diagnóstico de enfermedades pulmonares. Para esta labor, se emplea la arquitectura VGG-16, reconocida por su eficacia en la clasificación de imágenes, la cual ha sido adaptada para procesar datos de audio. Se realizaron la recopilación y preprocesamiento del conjunto de datos de sonidos respiratorios, utilizando coeficientes cepstrales de frecuencia de Mel (MFCC´s) como entrada de la red. Los resultados obtenidos revelan un rendimiento significativo, con una precisión del 79% en la clasificación de sonidos respiratorios. Este resultado resalta el potencial de las redes neuronales convolucionales pre entrenadas en el campo médico. Sin embargo, persisten desafíos por superar, como la necesidad de conjuntos de datos más amplios y una comprensión más profunda de los resultados para su implementación clínica efectiva.
This study investigates the implementation of deep neural networks in the classification of respiratory sounds, a crucial task for diagnosing pulmonary diseases. For this purpose, the VGG-16 architecture, renowned for its effectiveness in image classification, was adapted to process audio data. The respiratory sound dataset was collected and preprocessed using Mel-frequency cepstral coefficients (MFCCs) as input to the network. The results reveal significant performance, achieving 79% accuracy in classifying respiratory sounds. This outcome highlights the potential of pre-trained convolutional neural networks in the medical field. However, challenges remain, such as the need for larger datasets and a deeper understanding of the results for effective clinical implementation.
Sociedad Argentina de Informática e Investigación Operativa
Materia
Ciencias Informáticas
Redes neuronales profundas
Sonidos respiratorios
Arquitectura VGG-16
Diagnóstico de patologías respiratorias
Coeficientes cepstrales en frecuencia de Mel (MFCC´s)
Deep neural networks
Respiratory sounds
VGG-16 architecture
Diagnosis of respiratory diseases
Mel-frequency cepstral coefficients (MFCCs)
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/178018

id SEDICI_95031a69b40c580dd0bb0624fa1d5d75
oai_identifier_str oai:sedici.unlp.edu.ar:10915/178018
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundasAutomated diagnosis of pediatric pulmonary auscultation using deep neural networksLópez Pérez, Jorge I.Taire, Damián LeonardoDelrieux, ClaudioCiencias InformáticasRedes neuronales profundasSonidos respiratoriosArquitectura VGG-16Diagnóstico de patologías respiratoriasCoeficientes cepstrales en frecuencia de Mel (MFCC´s)Deep neural networksRespiratory soundsVGG-16 architectureDiagnosis of respiratory diseasesMel-frequency cepstral coefficients (MFCCs)En este trabajo se investiga la implementación de redes neuronales profundas en la clasificación de sonidos respiratorios, una tarea determinante para el diagnóstico de enfermedades pulmonares. Para esta labor, se emplea la arquitectura VGG-16, reconocida por su eficacia en la clasificación de imágenes, la cual ha sido adaptada para procesar datos de audio. Se realizaron la recopilación y preprocesamiento del conjunto de datos de sonidos respiratorios, utilizando coeficientes cepstrales de frecuencia de Mel (MFCC´s) como entrada de la red. Los resultados obtenidos revelan un rendimiento significativo, con una precisión del 79% en la clasificación de sonidos respiratorios. Este resultado resalta el potencial de las redes neuronales convolucionales pre entrenadas en el campo médico. Sin embargo, persisten desafíos por superar, como la necesidad de conjuntos de datos más amplios y una comprensión más profunda de los resultados para su implementación clínica efectiva.This study investigates the implementation of deep neural networks in the classification of respiratory sounds, a crucial task for diagnosing pulmonary diseases. For this purpose, the VGG-16 architecture, renowned for its effectiveness in image classification, was adapted to process audio data. The respiratory sound dataset was collected and preprocessed using Mel-frequency cepstral coefficients (MFCCs) as input to the network. The results reveal significant performance, achieving 79% accuracy in classifying respiratory sounds. This outcome highlights the potential of pre-trained convolutional neural networks in the medical field. However, challenges remain, such as the need for larger datasets and a deeper understanding of the results for effective clinical implementation.Sociedad Argentina de Informática e Investigación Operativa2025-04info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulohttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/178018spainfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/ejs/article/view/18848info:eu-repo/semantics/altIdentifier/issn/1514-6774info:eu-repo/semantics/altIdentifier/doi/10.24215/15146774e072info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:48:09Zoai:sedici.unlp.edu.ar:10915/178018Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:48:09.241SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas
Automated diagnosis of pediatric pulmonary auscultation using deep neural networks
title Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas
spellingShingle Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas
López Pérez, Jorge I.
Ciencias Informáticas
Redes neuronales profundas
Sonidos respiratorios
Arquitectura VGG-16
Diagnóstico de patologías respiratorias
Coeficientes cepstrales en frecuencia de Mel (MFCC´s)
Deep neural networks
Respiratory sounds
VGG-16 architecture
Diagnosis of respiratory diseases
Mel-frequency cepstral coefficients (MFCCs)
title_short Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas
title_full Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas
title_fullStr Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas
title_full_unstemmed Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas
title_sort Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas
dc.creator.none.fl_str_mv López Pérez, Jorge I.
Taire, Damián Leonardo
Delrieux, Claudio
author López Pérez, Jorge I.
author_facet López Pérez, Jorge I.
Taire, Damián Leonardo
Delrieux, Claudio
author_role author
author2 Taire, Damián Leonardo
Delrieux, Claudio
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Redes neuronales profundas
Sonidos respiratorios
Arquitectura VGG-16
Diagnóstico de patologías respiratorias
Coeficientes cepstrales en frecuencia de Mel (MFCC´s)
Deep neural networks
Respiratory sounds
VGG-16 architecture
Diagnosis of respiratory diseases
Mel-frequency cepstral coefficients (MFCCs)
topic Ciencias Informáticas
Redes neuronales profundas
Sonidos respiratorios
Arquitectura VGG-16
Diagnóstico de patologías respiratorias
Coeficientes cepstrales en frecuencia de Mel (MFCC´s)
Deep neural networks
Respiratory sounds
VGG-16 architecture
Diagnosis of respiratory diseases
Mel-frequency cepstral coefficients (MFCCs)
dc.description.none.fl_txt_mv En este trabajo se investiga la implementación de redes neuronales profundas en la clasificación de sonidos respiratorios, una tarea determinante para el diagnóstico de enfermedades pulmonares. Para esta labor, se emplea la arquitectura VGG-16, reconocida por su eficacia en la clasificación de imágenes, la cual ha sido adaptada para procesar datos de audio. Se realizaron la recopilación y preprocesamiento del conjunto de datos de sonidos respiratorios, utilizando coeficientes cepstrales de frecuencia de Mel (MFCC´s) como entrada de la red. Los resultados obtenidos revelan un rendimiento significativo, con una precisión del 79% en la clasificación de sonidos respiratorios. Este resultado resalta el potencial de las redes neuronales convolucionales pre entrenadas en el campo médico. Sin embargo, persisten desafíos por superar, como la necesidad de conjuntos de datos más amplios y una comprensión más profunda de los resultados para su implementación clínica efectiva.
This study investigates the implementation of deep neural networks in the classification of respiratory sounds, a crucial task for diagnosing pulmonary diseases. For this purpose, the VGG-16 architecture, renowned for its effectiveness in image classification, was adapted to process audio data. The respiratory sound dataset was collected and preprocessed using Mel-frequency cepstral coefficients (MFCCs) as input to the network. The results reveal significant performance, achieving 79% accuracy in classifying respiratory sounds. This outcome highlights the potential of pre-trained convolutional neural networks in the medical field. However, challenges remain, such as the need for larger datasets and a deeper understanding of the results for effective clinical implementation.
Sociedad Argentina de Informática e Investigación Operativa
description En este trabajo se investiga la implementación de redes neuronales profundas en la clasificación de sonidos respiratorios, una tarea determinante para el diagnóstico de enfermedades pulmonares. Para esta labor, se emplea la arquitectura VGG-16, reconocida por su eficacia en la clasificación de imágenes, la cual ha sido adaptada para procesar datos de audio. Se realizaron la recopilación y preprocesamiento del conjunto de datos de sonidos respiratorios, utilizando coeficientes cepstrales de frecuencia de Mel (MFCC´s) como entrada de la red. Los resultados obtenidos revelan un rendimiento significativo, con una precisión del 79% en la clasificación de sonidos respiratorios. Este resultado resalta el potencial de las redes neuronales convolucionales pre entrenadas en el campo médico. Sin embargo, persisten desafíos por superar, como la necesidad de conjuntos de datos más amplios y una comprensión más profunda de los resultados para su implementación clínica efectiva.
publishDate 2025
dc.date.none.fl_str_mv 2025-04
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Articulo
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/178018
url http://sedici.unlp.edu.ar/handle/10915/178018
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/ejs/article/view/18848
info:eu-repo/semantics/altIdentifier/issn/1514-6774
info:eu-repo/semantics/altIdentifier/doi/10.24215/15146774e072
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844616344394268672
score 13.070432