Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest
- Autores
- Cuadrado Estrebou, María Fernanda; Foglino, Alejandro Luis; Peña, María Teresa
- Año de publicación
- 2025
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- La detección de outliers en datos clínicos es esencial para garantizar la calidad de la información y reducir riesgos en los procesos analíticos. En este contexto, a partir de abril de 2025, se inició la presente investigación con el objetivo de evaluar el desempeño de dos algoritmos no supervisados: Local Outlier Factor (LOF)[1] e Isolation Forest (IF)[2], aplicados sobre 16.005 registros clínicos que incluyen variables antropométricas y metabólicas. Se realizaron dos iteraciones con diferentes niveles de contaminación (10 % y 5 %), complementadas con visualizaciones multidimensionales mediante t-SNE y UMAP. Los resultados evidencian una coincidencia del 54,6 % entre ambos algoritmos, destacando su complementariedad: LOF identifica anomalías locales dependientes de la densidad, mientras que IF detecta patrones globales. El uso combinado de ambos métodos demuestra ser una herramienta robusta para la identificación temprana de casos atípicos y posibles errores de registro. Esta investigación aporta evidencia empírica sobre la importancia de integrar diferentes enfoques de detección de anomalías en entornos clínicos, reforzando la necesidad de validación clínica de los casos detectados y proponiendo continuar con la investigación orientada a la integración de modelos híbridos y análisis longitudinales.
Red de Universidades con Carreras en Informática - Materia
-
Ciencias Informáticas
Outliers
Local Outlier Factor
Isolation Forest
t‑SNE
UMAP - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/191270
Ver los metadatos del registro completo
| id |
SEDICI_d7c44df2655de68d8433c5a24c45aabb |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/191270 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation ForestCuadrado Estrebou, María FernandaFoglino, Alejandro LuisPeña, María TeresaCiencias InformáticasOutliersLocal Outlier FactorIsolation Forestt‑SNEUMAPLa detección de outliers en datos clínicos es esencial para garantizar la calidad de la información y reducir riesgos en los procesos analíticos. En este contexto, a partir de abril de 2025, se inició la presente investigación con el objetivo de evaluar el desempeño de dos algoritmos no supervisados: Local Outlier Factor (LOF)[1] e Isolation Forest (IF)[2], aplicados sobre 16.005 registros clínicos que incluyen variables antropométricas y metabólicas. Se realizaron dos iteraciones con diferentes niveles de contaminación (10 % y 5 %), complementadas con visualizaciones multidimensionales mediante t-SNE y UMAP. Los resultados evidencian una coincidencia del 54,6 % entre ambos algoritmos, destacando su complementariedad: LOF identifica anomalías locales dependientes de la densidad, mientras que IF detecta patrones globales. El uso combinado de ambos métodos demuestra ser una herramienta robusta para la identificación temprana de casos atípicos y posibles errores de registro. Esta investigación aporta evidencia empírica sobre la importancia de integrar diferentes enfoques de detección de anomalías en entornos clínicos, reforzando la necesidad de validación clínica de los casos detectados y proponiendo continuar con la investigación orientada a la integración de modelos híbridos y análisis longitudinales.Red de Universidades con Carreras en Informática2025-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf550-554http://sedici.unlp.edu.ar/handle/10915/191270spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-8258-99-7info:eu-repo/semantics/reference/hdl/10915/189846info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-03-26T09:21:32Zoai:sedici.unlp.edu.ar:10915/191270Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-03-26 09:21:33.197SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest |
| title |
Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest |
| spellingShingle |
Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest Cuadrado Estrebou, María Fernanda Ciencias Informáticas Outliers Local Outlier Factor Isolation Forest t‑SNE UMAP |
| title_short |
Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest |
| title_full |
Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest |
| title_fullStr |
Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest |
| title_full_unstemmed |
Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest |
| title_sort |
Análisis de la detección de outliers en datos clínicos mediante Local Outlier Factor e Isolation Forest |
| dc.creator.none.fl_str_mv |
Cuadrado Estrebou, María Fernanda Foglino, Alejandro Luis Peña, María Teresa |
| author |
Cuadrado Estrebou, María Fernanda |
| author_facet |
Cuadrado Estrebou, María Fernanda Foglino, Alejandro Luis Peña, María Teresa |
| author_role |
author |
| author2 |
Foglino, Alejandro Luis Peña, María Teresa |
| author2_role |
author author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas Outliers Local Outlier Factor Isolation Forest t‑SNE UMAP |
| topic |
Ciencias Informáticas Outliers Local Outlier Factor Isolation Forest t‑SNE UMAP |
| dc.description.none.fl_txt_mv |
La detección de outliers en datos clínicos es esencial para garantizar la calidad de la información y reducir riesgos en los procesos analíticos. En este contexto, a partir de abril de 2025, se inició la presente investigación con el objetivo de evaluar el desempeño de dos algoritmos no supervisados: Local Outlier Factor (LOF)[1] e Isolation Forest (IF)[2], aplicados sobre 16.005 registros clínicos que incluyen variables antropométricas y metabólicas. Se realizaron dos iteraciones con diferentes niveles de contaminación (10 % y 5 %), complementadas con visualizaciones multidimensionales mediante t-SNE y UMAP. Los resultados evidencian una coincidencia del 54,6 % entre ambos algoritmos, destacando su complementariedad: LOF identifica anomalías locales dependientes de la densidad, mientras que IF detecta patrones globales. El uso combinado de ambos métodos demuestra ser una herramienta robusta para la identificación temprana de casos atípicos y posibles errores de registro. Esta investigación aporta evidencia empírica sobre la importancia de integrar diferentes enfoques de detección de anomalías en entornos clínicos, reforzando la necesidad de validación clínica de los casos detectados y proponiendo continuar con la investigación orientada a la integración de modelos híbridos y análisis longitudinales. Red de Universidades con Carreras en Informática |
| description |
La detección de outliers en datos clínicos es esencial para garantizar la calidad de la información y reducir riesgos en los procesos analíticos. En este contexto, a partir de abril de 2025, se inició la presente investigación con el objetivo de evaluar el desempeño de dos algoritmos no supervisados: Local Outlier Factor (LOF)[1] e Isolation Forest (IF)[2], aplicados sobre 16.005 registros clínicos que incluyen variables antropométricas y metabólicas. Se realizaron dos iteraciones con diferentes niveles de contaminación (10 % y 5 %), complementadas con visualizaciones multidimensionales mediante t-SNE y UMAP. Los resultados evidencian una coincidencia del 54,6 % entre ambos algoritmos, destacando su complementariedad: LOF identifica anomalías locales dependientes de la densidad, mientras que IF detecta patrones globales. El uso combinado de ambos métodos demuestra ser una herramienta robusta para la identificación temprana de casos atípicos y posibles errores de registro. Esta investigación aporta evidencia empírica sobre la importancia de integrar diferentes enfoques de detección de anomalías en entornos clínicos, reforzando la necesidad de validación clínica de los casos detectados y proponiendo continuar con la investigación orientada a la integración de modelos híbridos y análisis longitudinales. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-10 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
| format |
conferenceObject |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/191270 |
| url |
http://sedici.unlp.edu.ar/handle/10915/191270 |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/isbn/978-987-8258-99-7 info:eu-repo/semantics/reference/hdl/10915/189846 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf 550-554 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1860736630981132288 |
| score |
12.977003 |