Retaining principal components for discrete variables

Autores
Solanas, Antonio; Manolov, Rumen; Leiva, David; Richard's, Maria Marta
Año de publicación
2012
Idioma
inglés
Tipo de recurso
artículo
Estado
versión publicada
Descripción
El presente estudio trata sobre diferentes criterios para la retención de componentes en el análisis de componentes principales (PCA) aplicado a escalas tipo Likert, que son comunes en los cuestionarios psicológicos. El principal objetivo del estudio es recomendar a los investigadores no confiar en el criterio de extracción fundamentado en criterio del autovalor mayor que uno, sugiriendo procedimientos alternativos que se ajusten al error muestral. Un objetivo adicional consiste en añadir evidencia sobre las consecuencias de utilizar el criterio antes mencionado cuando el PCA se usa con variables discretas. Las condiciones experimentales se estudiaron por medio de remuestreo Monte Carlo, incluyendo distintos tamaños de muestra, diversas cantidades de reactivos y alternativas de respuesta y, finalmente, diferentes distribuciones de probabilidad para las opciones de respuesta. Los resultados sugieren que, incluso cuando todos los ítems y las dimensiones subyacentes son independientes, los autovalores mayores que uno son frecuentes y pueden dar cuenta de hasta el 80% de la varianza de los datos, alcanzándose el criterio empírico. Las consecuencias de utilizar el criterio de Kaiser se ilustran con un ejemplo propio de la Psicología clínica. Se halló que el tamaño de los autovalores es una función del tamaño de la muestra y del número de variables, que se corresponde con lo encontrado previamente para el parallel analysis. Para potenciar la aplicación de criterios alternativos, un paquete en R fue desarrollado para decidir el número de componentes principales que deben retenerse y recurriendo a intervalos de confianza fundamentados en los autovalores asociados a la inexistencia de asociación entre las variables discretas.
The present study discusses retention criteria for principal components analysis (PCA) applied to Likert scale items typical in psychological questionnaires. The main aim is to recommend applied researchers to restrain from relying only on the eigenvalue-than-one criterion; alternative procedures are suggested for adjusting for sampling error. An additional objective is to add evidence on the consequences of applying this rule when PCA is used with discrete variables. The experimental conditions were studied by means of Monte Carlo sampling including several sample sizes, different number of variables and answer alternatives, and four non-normal distributions. The results suggest that even when all the items and thus the underlying dimensions are independent, eigenvalues greater than one are frequent and they can explain up to 80% of the variance in data, meeting the empirical criterion. The consequences of using Kaiser’s rule are illustrated with a clinical psychology example. The size of the eigenvalues resulted to be a function of the sample size and the number of variables, which is also the case for parallel analysis as previous research shows. To enhance the application of alternative criteria, an R package was developed for deciding the number of principal components to retain by means of confidence intervals constructed about the eigenvalues corresponding to lack of relationship between discrete variables.
Fil: Solanas, Antonio. Universidad de Barcelona; España
Fil: Manolov, Rumen. Universidad de Barcelona; España
Fil: Leiva, David. Universidad de Barcelona; España
Fil: Richard's, Maria Marta. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Mar del Plata. Facultad de Psicología. Centro de Investigación en Procesos Básicos, Metodologías y Educación; Argentina
Materia
PRINCIPAL COMPONENTS ANALYSIS (PCA)
RETAINING COMPONENTS CRITERIA
DISCRETE VARIABLES
EINGENVALUES
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/99234

id CONICETDig_71e9e1f1f60122d0abfa68f835c9ac78
oai_identifier_str oai:ri.conicet.gov.ar:11336/99234
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Retaining principal components for discrete variablesRetención de componentes principales para variables discretasSolanas, AntonioManolov, RumenLeiva, DavidRichard's, Maria MartaPRINCIPAL COMPONENTS ANALYSIS (PCA)RETAINING COMPONENTS CRITERIADISCRETE VARIABLESEINGENVALUEShttps://purl.org/becyt/ford/5.1https://purl.org/becyt/ford/5El presente estudio trata sobre diferentes criterios para la retención de componentes en el análisis de componentes principales (PCA) aplicado a escalas tipo Likert, que son comunes en los cuestionarios psicológicos. El principal objetivo del estudio es recomendar a los investigadores no confiar en el criterio de extracción fundamentado en criterio del autovalor mayor que uno, sugiriendo procedimientos alternativos que se ajusten al error muestral. Un objetivo adicional consiste en añadir evidencia sobre las consecuencias de utilizar el criterio antes mencionado cuando el PCA se usa con variables discretas. Las condiciones experimentales se estudiaron por medio de remuestreo Monte Carlo, incluyendo distintos tamaños de muestra, diversas cantidades de reactivos y alternativas de respuesta y, finalmente, diferentes distribuciones de probabilidad para las opciones de respuesta. Los resultados sugieren que, incluso cuando todos los ítems y las dimensiones subyacentes son independientes, los autovalores mayores que uno son frecuentes y pueden dar cuenta de hasta el 80% de la varianza de los datos, alcanzándose el criterio empírico. Las consecuencias de utilizar el criterio de Kaiser se ilustran con un ejemplo propio de la Psicología clínica. Se halló que el tamaño de los autovalores es una función del tamaño de la muestra y del número de variables, que se corresponde con lo encontrado previamente para el parallel analysis. Para potenciar la aplicación de criterios alternativos, un paquete en R fue desarrollado para decidir el número de componentes principales que deben retenerse y recurriendo a intervalos de confianza fundamentados en los autovalores asociados a la inexistencia de asociación entre las variables discretas.The present study discusses retention criteria for principal components analysis (PCA) applied to Likert scale items typical in psychological questionnaires. The main aim is to recommend applied researchers to restrain from relying only on the eigenvalue-than-one criterion; alternative procedures are suggested for adjusting for sampling error. An additional objective is to add evidence on the consequences of applying this rule when PCA is used with discrete variables. The experimental conditions were studied by means of Monte Carlo sampling including several sample sizes, different number of variables and answer alternatives, and four non-normal distributions. The results suggest that even when all the items and thus the underlying dimensions are independent, eigenvalues greater than one are frequent and they can explain up to 80% of the variance in data, meeting the empirical criterion. The consequences of using Kaiser’s rule are illustrated with a clinical psychology example. The size of the eigenvalues resulted to be a function of the sample size and the number of variables, which is also the case for parallel analysis as previous research shows. To enhance the application of alternative criteria, an R package was developed for deciding the number of principal components to retain by means of confidence intervals constructed about the eigenvalues corresponding to lack of relationship between discrete variables.Fil: Solanas, Antonio. Universidad de Barcelona; EspañaFil: Manolov, Rumen. Universidad de Barcelona; EspañaFil: Leiva, David. Universidad de Barcelona; EspañaFil: Richard's, Maria Marta. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Mar del Plata. Facultad de Psicología. Centro de Investigación en Procesos Básicos, Metodologías y Educación; ArgentinaUniversidad de Barcelona2012-01info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/99234Solanas, Antonio; Manolov, Rumen; Leiva, David; Richard's, Maria Marta; Retaining principal components for discrete variables; Universidad de Barcelona; Anuario de Psicología; 41; 1-3; 1-2012; 33-500066-5126CONICET DigitalCONICETenginfo:eu-repo/semantics/altIdentifier/url/https://www.raco.cat/index.php/AnuarioPsicologia/article/view/249847info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-10-15T14:47:01Zoai:ri.conicet.gov.ar:11336/99234instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-10-15 14:47:01.872CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Retaining principal components for discrete variables
Retención de componentes principales para variables discretas
title Retaining principal components for discrete variables
spellingShingle Retaining principal components for discrete variables
Solanas, Antonio
PRINCIPAL COMPONENTS ANALYSIS (PCA)
RETAINING COMPONENTS CRITERIA
DISCRETE VARIABLES
EINGENVALUES
title_short Retaining principal components for discrete variables
title_full Retaining principal components for discrete variables
title_fullStr Retaining principal components for discrete variables
title_full_unstemmed Retaining principal components for discrete variables
title_sort Retaining principal components for discrete variables
dc.creator.none.fl_str_mv Solanas, Antonio
Manolov, Rumen
Leiva, David
Richard's, Maria Marta
author Solanas, Antonio
author_facet Solanas, Antonio
Manolov, Rumen
Leiva, David
Richard's, Maria Marta
author_role author
author2 Manolov, Rumen
Leiva, David
Richard's, Maria Marta
author2_role author
author
author
dc.subject.none.fl_str_mv PRINCIPAL COMPONENTS ANALYSIS (PCA)
RETAINING COMPONENTS CRITERIA
DISCRETE VARIABLES
EINGENVALUES
topic PRINCIPAL COMPONENTS ANALYSIS (PCA)
RETAINING COMPONENTS CRITERIA
DISCRETE VARIABLES
EINGENVALUES
purl_subject.fl_str_mv https://purl.org/becyt/ford/5.1
https://purl.org/becyt/ford/5
dc.description.none.fl_txt_mv El presente estudio trata sobre diferentes criterios para la retención de componentes en el análisis de componentes principales (PCA) aplicado a escalas tipo Likert, que son comunes en los cuestionarios psicológicos. El principal objetivo del estudio es recomendar a los investigadores no confiar en el criterio de extracción fundamentado en criterio del autovalor mayor que uno, sugiriendo procedimientos alternativos que se ajusten al error muestral. Un objetivo adicional consiste en añadir evidencia sobre las consecuencias de utilizar el criterio antes mencionado cuando el PCA se usa con variables discretas. Las condiciones experimentales se estudiaron por medio de remuestreo Monte Carlo, incluyendo distintos tamaños de muestra, diversas cantidades de reactivos y alternativas de respuesta y, finalmente, diferentes distribuciones de probabilidad para las opciones de respuesta. Los resultados sugieren que, incluso cuando todos los ítems y las dimensiones subyacentes son independientes, los autovalores mayores que uno son frecuentes y pueden dar cuenta de hasta el 80% de la varianza de los datos, alcanzándose el criterio empírico. Las consecuencias de utilizar el criterio de Kaiser se ilustran con un ejemplo propio de la Psicología clínica. Se halló que el tamaño de los autovalores es una función del tamaño de la muestra y del número de variables, que se corresponde con lo encontrado previamente para el parallel analysis. Para potenciar la aplicación de criterios alternativos, un paquete en R fue desarrollado para decidir el número de componentes principales que deben retenerse y recurriendo a intervalos de confianza fundamentados en los autovalores asociados a la inexistencia de asociación entre las variables discretas.
The present study discusses retention criteria for principal components analysis (PCA) applied to Likert scale items typical in psychological questionnaires. The main aim is to recommend applied researchers to restrain from relying only on the eigenvalue-than-one criterion; alternative procedures are suggested for adjusting for sampling error. An additional objective is to add evidence on the consequences of applying this rule when PCA is used with discrete variables. The experimental conditions were studied by means of Monte Carlo sampling including several sample sizes, different number of variables and answer alternatives, and four non-normal distributions. The results suggest that even when all the items and thus the underlying dimensions are independent, eigenvalues greater than one are frequent and they can explain up to 80% of the variance in data, meeting the empirical criterion. The consequences of using Kaiser’s rule are illustrated with a clinical psychology example. The size of the eigenvalues resulted to be a function of the sample size and the number of variables, which is also the case for parallel analysis as previous research shows. To enhance the application of alternative criteria, an R package was developed for deciding the number of principal components to retain by means of confidence intervals constructed about the eigenvalues corresponding to lack of relationship between discrete variables.
Fil: Solanas, Antonio. Universidad de Barcelona; España
Fil: Manolov, Rumen. Universidad de Barcelona; España
Fil: Leiva, David. Universidad de Barcelona; España
Fil: Richard's, Maria Marta. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Mar del Plata. Facultad de Psicología. Centro de Investigación en Procesos Básicos, Metodologías y Educación; Argentina
description El presente estudio trata sobre diferentes criterios para la retención de componentes en el análisis de componentes principales (PCA) aplicado a escalas tipo Likert, que son comunes en los cuestionarios psicológicos. El principal objetivo del estudio es recomendar a los investigadores no confiar en el criterio de extracción fundamentado en criterio del autovalor mayor que uno, sugiriendo procedimientos alternativos que se ajusten al error muestral. Un objetivo adicional consiste en añadir evidencia sobre las consecuencias de utilizar el criterio antes mencionado cuando el PCA se usa con variables discretas. Las condiciones experimentales se estudiaron por medio de remuestreo Monte Carlo, incluyendo distintos tamaños de muestra, diversas cantidades de reactivos y alternativas de respuesta y, finalmente, diferentes distribuciones de probabilidad para las opciones de respuesta. Los resultados sugieren que, incluso cuando todos los ítems y las dimensiones subyacentes son independientes, los autovalores mayores que uno son frecuentes y pueden dar cuenta de hasta el 80% de la varianza de los datos, alcanzándose el criterio empírico. Las consecuencias de utilizar el criterio de Kaiser se ilustran con un ejemplo propio de la Psicología clínica. Se halló que el tamaño de los autovalores es una función del tamaño de la muestra y del número de variables, que se corresponde con lo encontrado previamente para el parallel analysis. Para potenciar la aplicación de criterios alternativos, un paquete en R fue desarrollado para decidir el número de componentes principales que deben retenerse y recurriendo a intervalos de confianza fundamentados en los autovalores asociados a la inexistencia de asociación entre las variables discretas.
publishDate 2012
dc.date.none.fl_str_mv 2012-01
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/99234
Solanas, Antonio; Manolov, Rumen; Leiva, David; Richard's, Maria Marta; Retaining principal components for discrete variables; Universidad de Barcelona; Anuario de Psicología; 41; 1-3; 1-2012; 33-50
0066-5126
CONICET Digital
CONICET
url http://hdl.handle.net/11336/99234
identifier_str_mv Solanas, Antonio; Manolov, Rumen; Leiva, David; Richard's, Maria Marta; Retaining principal components for discrete variables; Universidad de Barcelona; Anuario de Psicología; 41; 1-3; 1-2012; 33-50
0066-5126
CONICET Digital
CONICET
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://www.raco.cat/index.php/AnuarioPsicologia/article/view/249847
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad de Barcelona
publisher.none.fl_str_mv Universidad de Barcelona
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1846082985149857792
score 13.22299