Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas
- Autores
- López Pérez, Jorge I.; Taire, Damián Leonardo; Delrieux, Claudio
- Año de publicación
- 2025
- Idioma
- español castellano
- Tipo de recurso
- artículo
- Estado
- versión publicada
- Descripción
- En este trabajo se investiga la implementación de redes neuronales profundas en la clasificación de sonidos respiratorios, una tarea determinante para el diagnóstico de enfermedades pulmonares. Para esta labor, se emplea la arquitectura VGG-16, reconocida por su eficacia en la clasificación de imágenes, la cual ha sido adaptada para procesar datos de audio. Se realizaron la recopilación y preprocesamiento del conjunto de datos de sonidos respiratorios, utilizando coeficientes cepstrales de frecuencia de Mel (MFCC´s) como entrada de la red. Los resultados obtenidos revelan un rendimiento significativo, con una precisión del 79% en la clasificación de sonidos respiratorios. Este resultado resalta el potencial de las redes neuronales convolucionales pre entrenadas en el campo médico. Sin embargo, persisten desafíos por superar, como la necesidad de conjuntos de datos más amplios y una comprensión más profunda de los resultados para su implementación clínica efectiva.
This study investigates the implementation of deep neural networks in the classification of respiratory sounds, a crucial task for diagnosing pulmonary diseases. For this purpose, the VGG-16 architecture, renowned for its effectiveness in image classification, was adapted to process audio data. The respiratory sound dataset was collected and preprocessed using Mel-frequency cepstral coefficients (MFCCs) as input to the network. The results reveal significant performance, achieving 79% accuracy in classifying respiratory sounds. This outcome highlights the potential of pre-trained convolutional neural networks in the medical field. However, challenges remain, such as the need for larger datasets and a deeper understanding of the results for effective clinical implementation.
Sociedad Argentina de Informática e Investigación Operativa - Materia
-
Ciencias Informáticas
Redes neuronales profundas
Sonidos respiratorios
Arquitectura VGG-16
Diagnóstico de patologías respiratorias
Coeficientes cepstrales en frecuencia de Mel (MFCC´s)
Deep neural networks
Respiratory sounds
VGG-16 architecture
Diagnosis of respiratory diseases
Mel-frequency cepstral coefficients (MFCCs) - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/178018
Ver los metadatos del registro completo
id |
SEDICI_95031a69b40c580dd0bb0624fa1d5d75 |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/178018 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundasAutomated diagnosis of pediatric pulmonary auscultation using deep neural networksLópez Pérez, Jorge I.Taire, Damián LeonardoDelrieux, ClaudioCiencias InformáticasRedes neuronales profundasSonidos respiratoriosArquitectura VGG-16Diagnóstico de patologías respiratoriasCoeficientes cepstrales en frecuencia de Mel (MFCC´s)Deep neural networksRespiratory soundsVGG-16 architectureDiagnosis of respiratory diseasesMel-frequency cepstral coefficients (MFCCs)En este trabajo se investiga la implementación de redes neuronales profundas en la clasificación de sonidos respiratorios, una tarea determinante para el diagnóstico de enfermedades pulmonares. Para esta labor, se emplea la arquitectura VGG-16, reconocida por su eficacia en la clasificación de imágenes, la cual ha sido adaptada para procesar datos de audio. Se realizaron la recopilación y preprocesamiento del conjunto de datos de sonidos respiratorios, utilizando coeficientes cepstrales de frecuencia de Mel (MFCC´s) como entrada de la red. Los resultados obtenidos revelan un rendimiento significativo, con una precisión del 79% en la clasificación de sonidos respiratorios. Este resultado resalta el potencial de las redes neuronales convolucionales pre entrenadas en el campo médico. Sin embargo, persisten desafíos por superar, como la necesidad de conjuntos de datos más amplios y una comprensión más profunda de los resultados para su implementación clínica efectiva.This study investigates the implementation of deep neural networks in the classification of respiratory sounds, a crucial task for diagnosing pulmonary diseases. For this purpose, the VGG-16 architecture, renowned for its effectiveness in image classification, was adapted to process audio data. The respiratory sound dataset was collected and preprocessed using Mel-frequency cepstral coefficients (MFCCs) as input to the network. The results reveal significant performance, achieving 79% accuracy in classifying respiratory sounds. This outcome highlights the potential of pre-trained convolutional neural networks in the medical field. However, challenges remain, such as the need for larger datasets and a deeper understanding of the results for effective clinical implementation.Sociedad Argentina de Informática e Investigación Operativa2025-04info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulohttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/178018spainfo:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/ejs/article/view/18848info:eu-repo/semantics/altIdentifier/issn/1514-6774info:eu-repo/semantics/altIdentifier/doi/10.24215/15146774e072info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:48:09Zoai:sedici.unlp.edu.ar:10915/178018Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:48:09.241SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas Automated diagnosis of pediatric pulmonary auscultation using deep neural networks |
title |
Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas |
spellingShingle |
Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas López Pérez, Jorge I. Ciencias Informáticas Redes neuronales profundas Sonidos respiratorios Arquitectura VGG-16 Diagnóstico de patologías respiratorias Coeficientes cepstrales en frecuencia de Mel (MFCC´s) Deep neural networks Respiratory sounds VGG-16 architecture Diagnosis of respiratory diseases Mel-frequency cepstral coefficients (MFCCs) |
title_short |
Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas |
title_full |
Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas |
title_fullStr |
Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas |
title_full_unstemmed |
Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas |
title_sort |
Diagnóstico automatizado de auscultación pulmonar pediátrica usando redes neuronales profundas |
dc.creator.none.fl_str_mv |
López Pérez, Jorge I. Taire, Damián Leonardo Delrieux, Claudio |
author |
López Pérez, Jorge I. |
author_facet |
López Pérez, Jorge I. Taire, Damián Leonardo Delrieux, Claudio |
author_role |
author |
author2 |
Taire, Damián Leonardo Delrieux, Claudio |
author2_role |
author author |
dc.subject.none.fl_str_mv |
Ciencias Informáticas Redes neuronales profundas Sonidos respiratorios Arquitectura VGG-16 Diagnóstico de patologías respiratorias Coeficientes cepstrales en frecuencia de Mel (MFCC´s) Deep neural networks Respiratory sounds VGG-16 architecture Diagnosis of respiratory diseases Mel-frequency cepstral coefficients (MFCCs) |
topic |
Ciencias Informáticas Redes neuronales profundas Sonidos respiratorios Arquitectura VGG-16 Diagnóstico de patologías respiratorias Coeficientes cepstrales en frecuencia de Mel (MFCC´s) Deep neural networks Respiratory sounds VGG-16 architecture Diagnosis of respiratory diseases Mel-frequency cepstral coefficients (MFCCs) |
dc.description.none.fl_txt_mv |
En este trabajo se investiga la implementación de redes neuronales profundas en la clasificación de sonidos respiratorios, una tarea determinante para el diagnóstico de enfermedades pulmonares. Para esta labor, se emplea la arquitectura VGG-16, reconocida por su eficacia en la clasificación de imágenes, la cual ha sido adaptada para procesar datos de audio. Se realizaron la recopilación y preprocesamiento del conjunto de datos de sonidos respiratorios, utilizando coeficientes cepstrales de frecuencia de Mel (MFCC´s) como entrada de la red. Los resultados obtenidos revelan un rendimiento significativo, con una precisión del 79% en la clasificación de sonidos respiratorios. Este resultado resalta el potencial de las redes neuronales convolucionales pre entrenadas en el campo médico. Sin embargo, persisten desafíos por superar, como la necesidad de conjuntos de datos más amplios y una comprensión más profunda de los resultados para su implementación clínica efectiva. This study investigates the implementation of deep neural networks in the classification of respiratory sounds, a crucial task for diagnosing pulmonary diseases. For this purpose, the VGG-16 architecture, renowned for its effectiveness in image classification, was adapted to process audio data. The respiratory sound dataset was collected and preprocessed using Mel-frequency cepstral coefficients (MFCCs) as input to the network. The results reveal significant performance, achieving 79% accuracy in classifying respiratory sounds. This outcome highlights the potential of pre-trained convolutional neural networks in the medical field. However, challenges remain, such as the need for larger datasets and a deeper understanding of the results for effective clinical implementation. Sociedad Argentina de Informática e Investigación Operativa |
description |
En este trabajo se investiga la implementación de redes neuronales profundas en la clasificación de sonidos respiratorios, una tarea determinante para el diagnóstico de enfermedades pulmonares. Para esta labor, se emplea la arquitectura VGG-16, reconocida por su eficacia en la clasificación de imágenes, la cual ha sido adaptada para procesar datos de audio. Se realizaron la recopilación y preprocesamiento del conjunto de datos de sonidos respiratorios, utilizando coeficientes cepstrales de frecuencia de Mel (MFCC´s) como entrada de la red. Los resultados obtenidos revelan un rendimiento significativo, con una precisión del 79% en la clasificación de sonidos respiratorios. Este resultado resalta el potencial de las redes neuronales convolucionales pre entrenadas en el campo médico. Sin embargo, persisten desafíos por superar, como la necesidad de conjuntos de datos más amplios y una comprensión más profunda de los resultados para su implementación clínica efectiva. |
publishDate |
2025 |
dc.date.none.fl_str_mv |
2025-04 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion Articulo http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo |
format |
article |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/178018 |
url |
http://sedici.unlp.edu.ar/handle/10915/178018 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/url/https://revistas.unlp.edu.ar/ejs/article/view/18848 info:eu-repo/semantics/altIdentifier/issn/1514-6774 info:eu-repo/semantics/altIdentifier/doi/10.24215/15146774e072 |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1844616344394268672 |
score |
13.070432 |