Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes

Autores
Murrone, Nicolás; Martínez, Alejandra M.
Año de publicación
2018
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
El análisis de componentes principales es una poderosa herramienta exploratoria, utilizada en diversas disciplinas tales como la biología, arqueología, entre otras, que tiene como principal objetivo reducir la dimensionalidad del conjunto de datos perdiendo la menor cantidad de información posible, lo cual facilita la interpretación y puede utilizarse como paso intermedio en un análisis de datos más complejo. Las matrices provenientes de análisis de muestras ambientales suelen contener un importante número de datos faltantes lo cual es un problema para la aplicación clásica de análisis de componentes principales. La mayoría de los procedimientos clásicos consisten en imputar los datos con técnicas que se basan en la distribución o naturaleza de las variables y luego calcular las componentes principales. El algoritmo NIPALS (Non-linear Iterative Partial Least Squares) es un procedimiento iterativo que en cada iteración calcula una componente principal resolviendo un problema de regresión de mínimos cuadrados parciales (PLS, por sus siglas en inglés) y que, en caso de haber presencia de datos faltantes, no requiere de imputación de datos para su cómputo. En esta presentación se realiza un estudio de simulación en R para comparar el algoritmo NIPALS con otros procedimientos clásicos de imputación de datos y, de esta manera, elegir la técnica a utilizar sobre un conjunto de datos reales de particulado atmosférico.
Sociedad Argentina de Informática e Investigación Operativa
Materia
Ciencias Informáticas
análisis de componentes principales
datos faltantes
lenguaje R
algoritmo NIPALS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-sa/3.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/72785

id SEDICI_92c3f9552d6ff691fa77bdebac941764
oai_identifier_str oai:sedici.unlp.edu.ar:10915/72785
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantesMurrone, NicolásMartínez, Alejandra M.Ciencias Informáticasanálisis de componentes principalesdatos faltanteslenguaje Ralgoritmo NIPALSEl análisis de componentes principales es una poderosa herramienta exploratoria, utilizada en diversas disciplinas tales como la biología, arqueología, entre otras, que tiene como principal objetivo reducir la dimensionalidad del conjunto de datos perdiendo la menor cantidad de información posible, lo cual facilita la interpretación y puede utilizarse como paso intermedio en un análisis de datos más complejo. Las matrices provenientes de análisis de muestras ambientales suelen contener un importante número de datos faltantes lo cual es un problema para la aplicación clásica de análisis de componentes principales. La mayoría de los procedimientos clásicos consisten en imputar los datos con técnicas que se basan en la distribución o naturaleza de las variables y luego calcular las componentes principales. El algoritmo NIPALS (Non-linear Iterative Partial Least Squares) es un procedimiento iterativo que en cada iteración calcula una componente principal resolviendo un problema de regresión de mínimos cuadrados parciales (PLS, por sus siglas en inglés) y que, en caso de haber presencia de datos faltantes, no requiere de imputación de datos para su cómputo. En esta presentación se realiza un estudio de simulación en R para comparar el algoritmo NIPALS con otros procedimientos clásicos de imputación de datos y, de esta manera, elegir la técnica a utilizar sobre un conjunto de datos reales de particulado atmosférico.Sociedad Argentina de Informática e Investigación Operativa2018-09info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionResumenhttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/72785spainfo:eu-repo/semantics/altIdentifier/url/http://47jaiio.sadio.org.ar/sites/default/files/LatinR_50.pdfinfo:eu-repo/semantics/altIdentifier/issn/2618-3196info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-sa/3.0/Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:12:04Zoai:sedici.unlp.edu.ar:10915/72785Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:12:04.578SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes
title Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes
spellingShingle Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes
Murrone, Nicolás
Ciencias Informáticas
análisis de componentes principales
datos faltantes
lenguaje R
algoritmo NIPALS
title_short Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes
title_full Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes
title_fullStr Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes
title_full_unstemmed Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes
title_sort Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes
dc.creator.none.fl_str_mv Murrone, Nicolás
Martínez, Alejandra M.
author Murrone, Nicolás
author_facet Murrone, Nicolás
Martínez, Alejandra M.
author_role author
author2 Martínez, Alejandra M.
author2_role author
dc.subject.none.fl_str_mv Ciencias Informáticas
análisis de componentes principales
datos faltantes
lenguaje R
algoritmo NIPALS
topic Ciencias Informáticas
análisis de componentes principales
datos faltantes
lenguaje R
algoritmo NIPALS
dc.description.none.fl_txt_mv El análisis de componentes principales es una poderosa herramienta exploratoria, utilizada en diversas disciplinas tales como la biología, arqueología, entre otras, que tiene como principal objetivo reducir la dimensionalidad del conjunto de datos perdiendo la menor cantidad de información posible, lo cual facilita la interpretación y puede utilizarse como paso intermedio en un análisis de datos más complejo. Las matrices provenientes de análisis de muestras ambientales suelen contener un importante número de datos faltantes lo cual es un problema para la aplicación clásica de análisis de componentes principales. La mayoría de los procedimientos clásicos consisten en imputar los datos con técnicas que se basan en la distribución o naturaleza de las variables y luego calcular las componentes principales. El algoritmo NIPALS (Non-linear Iterative Partial Least Squares) es un procedimiento iterativo que en cada iteración calcula una componente principal resolviendo un problema de regresión de mínimos cuadrados parciales (PLS, por sus siglas en inglés) y que, en caso de haber presencia de datos faltantes, no requiere de imputación de datos para su cómputo. En esta presentación se realiza un estudio de simulación en R para comparar el algoritmo NIPALS con otros procedimientos clásicos de imputación de datos y, de esta manera, elegir la técnica a utilizar sobre un conjunto de datos reales de particulado atmosférico.
Sociedad Argentina de Informática e Investigación Operativa
description El análisis de componentes principales es una poderosa herramienta exploratoria, utilizada en diversas disciplinas tales como la biología, arqueología, entre otras, que tiene como principal objetivo reducir la dimensionalidad del conjunto de datos perdiendo la menor cantidad de información posible, lo cual facilita la interpretación y puede utilizarse como paso intermedio en un análisis de datos más complejo. Las matrices provenientes de análisis de muestras ambientales suelen contener un importante número de datos faltantes lo cual es un problema para la aplicación clásica de análisis de componentes principales. La mayoría de los procedimientos clásicos consisten en imputar los datos con técnicas que se basan en la distribución o naturaleza de las variables y luego calcular las componentes principales. El algoritmo NIPALS (Non-linear Iterative Partial Least Squares) es un procedimiento iterativo que en cada iteración calcula una componente principal resolviendo un problema de regresión de mínimos cuadrados parciales (PLS, por sus siglas en inglés) y que, en caso de haber presencia de datos faltantes, no requiere de imputación de datos para su cómputo. En esta presentación se realiza un estudio de simulación en R para comparar el algoritmo NIPALS con otros procedimientos clásicos de imputación de datos y, de esta manera, elegir la técnica a utilizar sobre un conjunto de datos reales de particulado atmosférico.
publishDate 2018
dc.date.none.fl_str_mv 2018-09
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Resumen
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/72785
url http://sedici.unlp.edu.ar/handle/10915/72785
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/http://47jaiio.sadio.org.ar/sites/default/files/LatinR_50.pdf
info:eu-repo/semantics/altIdentifier/issn/2618-3196
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-sa/3.0/
Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-sa/3.0/
Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844615991145791488
score 13.070432