Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes
- Autores
- Murrone, Nicolás; Martínez, Alejandra M.
- Año de publicación
- 2018
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- El análisis de componentes principales es una poderosa herramienta exploratoria, utilizada en diversas disciplinas tales como la biología, arqueología, entre otras, que tiene como principal objetivo reducir la dimensionalidad del conjunto de datos perdiendo la menor cantidad de información posible, lo cual facilita la interpretación y puede utilizarse como paso intermedio en un análisis de datos más complejo. Las matrices provenientes de análisis de muestras ambientales suelen contener un importante número de datos faltantes lo cual es un problema para la aplicación clásica de análisis de componentes principales. La mayoría de los procedimientos clásicos consisten en imputar los datos con técnicas que se basan en la distribución o naturaleza de las variables y luego calcular las componentes principales. El algoritmo NIPALS (Non-linear Iterative Partial Least Squares) es un procedimiento iterativo que en cada iteración calcula una componente principal resolviendo un problema de regresión de mínimos cuadrados parciales (PLS, por sus siglas en inglés) y que, en caso de haber presencia de datos faltantes, no requiere de imputación de datos para su cómputo. En esta presentación se realiza un estudio de simulación en R para comparar el algoritmo NIPALS con otros procedimientos clásicos de imputación de datos y, de esta manera, elegir la técnica a utilizar sobre un conjunto de datos reales de particulado atmosférico.
Sociedad Argentina de Informática e Investigación Operativa - Materia
-
Ciencias Informáticas
análisis de componentes principales
datos faltantes
lenguaje R
algoritmo NIPALS - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-sa/3.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/72785
Ver los metadatos del registro completo
id |
SEDICI_92c3f9552d6ff691fa77bdebac941764 |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/72785 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantesMurrone, NicolásMartínez, Alejandra M.Ciencias Informáticasanálisis de componentes principalesdatos faltanteslenguaje Ralgoritmo NIPALSEl análisis de componentes principales es una poderosa herramienta exploratoria, utilizada en diversas disciplinas tales como la biología, arqueología, entre otras, que tiene como principal objetivo reducir la dimensionalidad del conjunto de datos perdiendo la menor cantidad de información posible, lo cual facilita la interpretación y puede utilizarse como paso intermedio en un análisis de datos más complejo. Las matrices provenientes de análisis de muestras ambientales suelen contener un importante número de datos faltantes lo cual es un problema para la aplicación clásica de análisis de componentes principales. La mayoría de los procedimientos clásicos consisten en imputar los datos con técnicas que se basan en la distribución o naturaleza de las variables y luego calcular las componentes principales. El algoritmo NIPALS (Non-linear Iterative Partial Least Squares) es un procedimiento iterativo que en cada iteración calcula una componente principal resolviendo un problema de regresión de mínimos cuadrados parciales (PLS, por sus siglas en inglés) y que, en caso de haber presencia de datos faltantes, no requiere de imputación de datos para su cómputo. En esta presentación se realiza un estudio de simulación en R para comparar el algoritmo NIPALS con otros procedimientos clásicos de imputación de datos y, de esta manera, elegir la técnica a utilizar sobre un conjunto de datos reales de particulado atmosférico.Sociedad Argentina de Informática e Investigación Operativa2018-09info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionResumenhttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/72785spainfo:eu-repo/semantics/altIdentifier/url/http://47jaiio.sadio.org.ar/sites/default/files/LatinR_50.pdfinfo:eu-repo/semantics/altIdentifier/issn/2618-3196info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-sa/3.0/Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:12:04Zoai:sedici.unlp.edu.ar:10915/72785Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:12:04.578SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes |
title |
Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes |
spellingShingle |
Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes Murrone, Nicolás Ciencias Informáticas análisis de componentes principales datos faltantes lenguaje R algoritmo NIPALS |
title_short |
Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes |
title_full |
Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes |
title_fullStr |
Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes |
title_full_unstemmed |
Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes |
title_sort |
Comparación de propuestas para el análisis de componentes principales en matrices con datos faltantes |
dc.creator.none.fl_str_mv |
Murrone, Nicolás Martínez, Alejandra M. |
author |
Murrone, Nicolás |
author_facet |
Murrone, Nicolás Martínez, Alejandra M. |
author_role |
author |
author2 |
Martínez, Alejandra M. |
author2_role |
author |
dc.subject.none.fl_str_mv |
Ciencias Informáticas análisis de componentes principales datos faltantes lenguaje R algoritmo NIPALS |
topic |
Ciencias Informáticas análisis de componentes principales datos faltantes lenguaje R algoritmo NIPALS |
dc.description.none.fl_txt_mv |
El análisis de componentes principales es una poderosa herramienta exploratoria, utilizada en diversas disciplinas tales como la biología, arqueología, entre otras, que tiene como principal objetivo reducir la dimensionalidad del conjunto de datos perdiendo la menor cantidad de información posible, lo cual facilita la interpretación y puede utilizarse como paso intermedio en un análisis de datos más complejo. Las matrices provenientes de análisis de muestras ambientales suelen contener un importante número de datos faltantes lo cual es un problema para la aplicación clásica de análisis de componentes principales. La mayoría de los procedimientos clásicos consisten en imputar los datos con técnicas que se basan en la distribución o naturaleza de las variables y luego calcular las componentes principales. El algoritmo NIPALS (Non-linear Iterative Partial Least Squares) es un procedimiento iterativo que en cada iteración calcula una componente principal resolviendo un problema de regresión de mínimos cuadrados parciales (PLS, por sus siglas en inglés) y que, en caso de haber presencia de datos faltantes, no requiere de imputación de datos para su cómputo. En esta presentación se realiza un estudio de simulación en R para comparar el algoritmo NIPALS con otros procedimientos clásicos de imputación de datos y, de esta manera, elegir la técnica a utilizar sobre un conjunto de datos reales de particulado atmosférico. Sociedad Argentina de Informática e Investigación Operativa |
description |
El análisis de componentes principales es una poderosa herramienta exploratoria, utilizada en diversas disciplinas tales como la biología, arqueología, entre otras, que tiene como principal objetivo reducir la dimensionalidad del conjunto de datos perdiendo la menor cantidad de información posible, lo cual facilita la interpretación y puede utilizarse como paso intermedio en un análisis de datos más complejo. Las matrices provenientes de análisis de muestras ambientales suelen contener un importante número de datos faltantes lo cual es un problema para la aplicación clásica de análisis de componentes principales. La mayoría de los procedimientos clásicos consisten en imputar los datos con técnicas que se basan en la distribución o naturaleza de las variables y luego calcular las componentes principales. El algoritmo NIPALS (Non-linear Iterative Partial Least Squares) es un procedimiento iterativo que en cada iteración calcula una componente principal resolviendo un problema de regresión de mínimos cuadrados parciales (PLS, por sus siglas en inglés) y que, en caso de haber presencia de datos faltantes, no requiere de imputación de datos para su cómputo. En esta presentación se realiza un estudio de simulación en R para comparar el algoritmo NIPALS con otros procedimientos clásicos de imputación de datos y, de esta manera, elegir la técnica a utilizar sobre un conjunto de datos reales de particulado atmosférico. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-09 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Resumen http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/72785 |
url |
http://sedici.unlp.edu.ar/handle/10915/72785 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/url/http://47jaiio.sadio.org.ar/sites/default/files/LatinR_50.pdf info:eu-repo/semantics/altIdentifier/issn/2618-3196 |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-sa/3.0/ Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-sa/3.0/ Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1844615991145791488 |
score |
13.070432 |