Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest

Autores
Cuadrado Estrebou, María Fernanda; Foglino, Alejandro Luis; Peña, María Teresa
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
La detección de outliers en datos clínicos es esencial para garantizar la calidad de la información y reducir riesgos en los procesos analíticos. En este contexto, a partir de abril de 2025, se inició la presente investigación con el objetivo de evaluar el desempeño de dos algoritmos no supervisados: Local Outlier Factor (LOF)[1] e Isolation Forest (IF)[2], aplicados sobre 16.005 registros clínicos que incluyen variables antropométricas y metabólicas. Se realizaron dos iteraciones con diferentes niveles de contaminación (10 % y 5 %), complementadas con visualizaciones multidimensionales mediante t-SNE y UMAP. Los resultados evidencian una coincidencia del 54,6 % entre ambos algoritmos, destacando su complementariedad: LOF identifica anomalías locales dependientes de la densidad, mientras que IF detecta patrones globales. El uso combinado de ambos métodos demuestra ser una herramienta robusta para la identificación temprana de casos atípicos y posibles errores de registro. Esta investigación aporta evidencia empírica sobre la importancia de integrar diferentes enfoques de detección de anomalías en entornos clínicos, reforzando la necesidad de validación clínica de los casos detectados y proponiendo continuar con la investigación orientada a la integración de modelos híbridos y análisis longitudinales.
Red de Universidades con Carreras en Informática
Materia
Ciencias Informáticas
Outliers
Local Outlier Factor
Isolation Forest
t‑SNE
UMAP
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/191270

id SEDICI_d7c44df2655de68d8433c5a24c45aabb
oai_identifier_str oai:sedici.unlp.edu.ar:10915/191270
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation ForestCuadrado Estrebou, María FernandaFoglino, Alejandro LuisPeña, María TeresaCiencias InformáticasOutliersLocal Outlier FactorIsolation Forestt‑SNEUMAPLa detección de outliers en datos clínicos es esencial para garantizar la calidad de la información y reducir riesgos en los procesos analíticos. En este contexto, a partir de abril de 2025, se inició la presente investigación con el objetivo de evaluar el desempeño de dos algoritmos no supervisados: Local Outlier Factor (LOF)[1] e Isolation Forest (IF)[2], aplicados sobre 16.005 registros clínicos que incluyen variables antropométricas y metabólicas. Se realizaron dos iteraciones con diferentes niveles de contaminación (10 % y 5 %), complementadas con visualizaciones multidimensionales mediante t-SNE y UMAP. Los resultados evidencian una coincidencia del 54,6 % entre ambos algoritmos, destacando su complementariedad: LOF identifica anomalías locales dependientes de la densidad, mientras que IF detecta patrones globales. El uso combinado de ambos métodos demuestra ser una herramienta robusta para la identificación temprana de casos atípicos y posibles errores de registro. Esta investigación aporta evidencia empírica sobre la importancia de integrar diferentes enfoques de detección de anomalías en entornos clínicos, reforzando la necesidad de validación clínica de los casos detectados y proponiendo continuar con la investigación orientada a la integración de modelos híbridos y análisis longitudinales.Red de Universidades con Carreras en Informática2025-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf550-554http://sedici.unlp.edu.ar/handle/10915/191270spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-8258-99-7info:eu-repo/semantics/reference/hdl/10915/189846info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-03-26T09:21:32Zoai:sedici.unlp.edu.ar:10915/191270Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-03-26 09:21:33.197SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest
title Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest
spellingShingle Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest
Cuadrado Estrebou, María Fernanda
Ciencias Informáticas
Outliers
Local Outlier Factor
Isolation Forest
t‑SNE
UMAP
title_short Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest
title_full Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest
title_fullStr Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest
title_full_unstemmed Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest
title_sort Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest
dc.creator.none.fl_str_mv Cuadrado Estrebou, María Fernanda
Foglino, Alejandro Luis
Peña, María Teresa
author Cuadrado Estrebou, María Fernanda
author_facet Cuadrado Estrebou, María Fernanda
Foglino, Alejandro Luis
Peña, María Teresa
author_role author
author2 Foglino, Alejandro Luis
Peña, María Teresa
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Outliers
Local Outlier Factor
Isolation Forest
t‑SNE
UMAP
topic Ciencias Informáticas
Outliers
Local Outlier Factor
Isolation Forest
t‑SNE
UMAP
dc.description.none.fl_txt_mv La detección de outliers en datos clínicos es esencial para garantizar la calidad de la información y reducir riesgos en los procesos analíticos. En este contexto, a partir de abril de 2025, se inició la presente investigación con el objetivo de evaluar el desempeño de dos algoritmos no supervisados: Local Outlier Factor (LOF)[1] e Isolation Forest (IF)[2], aplicados sobre 16.005 registros clínicos que incluyen variables antropométricas y metabólicas. Se realizaron dos iteraciones con diferentes niveles de contaminación (10 % y 5 %), complementadas con visualizaciones multidimensionales mediante t-SNE y UMAP. Los resultados evidencian una coincidencia del 54,6 % entre ambos algoritmos, destacando su complementariedad: LOF identifica anomalías locales dependientes de la densidad, mientras que IF detecta patrones globales. El uso combinado de ambos métodos demuestra ser una herramienta robusta para la identificación temprana de casos atípicos y posibles errores de registro. Esta investigación aporta evidencia empírica sobre la importancia de integrar diferentes enfoques de detección de anomalías en entornos clínicos, reforzando la necesidad de validación clínica de los casos detectados y proponiendo continuar con la investigación orientada a la integración de modelos híbridos y análisis longitudinales.
Red de Universidades con Carreras en Informática
description La detección de outliers en datos clínicos es esencial para garantizar la calidad de la información y reducir riesgos en los procesos analíticos. En este contexto, a partir de abril de 2025, se inició la presente investigación con el objetivo de evaluar el desempeño de dos algoritmos no supervisados: Local Outlier Factor (LOF)[1] e Isolation Forest (IF)[2], aplicados sobre 16.005 registros clínicos que incluyen variables antropométricas y metabólicas. Se realizaron dos iteraciones con diferentes niveles de contaminación (10 % y 5 %), complementadas con visualizaciones multidimensionales mediante t-SNE y UMAP. Los resultados evidencian una coincidencia del 54,6 % entre ambos algoritmos, destacando su complementariedad: LOF identifica anomalías locales dependientes de la densidad, mientras que IF detecta patrones globales. El uso combinado de ambos métodos demuestra ser una herramienta robusta para la identificación temprana de casos atípicos y posibles errores de registro. Esta investigación aporta evidencia empírica sobre la importancia de integrar diferentes enfoques de detección de anomalías en entornos clínicos, reforzando la necesidad de validación clínica de los casos detectados y proponiendo continuar con la investigación orientada a la integración de modelos híbridos y análisis longitudinales.
publishDate 2025
dc.date.none.fl_str_mv 2025-10
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/191270
url http://sedici.unlp.edu.ar/handle/10915/191270
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/isbn/978-987-8258-99-7
info:eu-repo/semantics/reference/hdl/10915/189846
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
550-554
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1860736630981132288
score 12.977003