Componentes principales en mapeo asociativo

Autores
Peña Malavera, Andrea Natalia; Gutierrez, Luciana; Balzarini, Monica Graciela
Año de publicación
2014
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
El mapeo asociativo (o mapeo por desequilibrio de ligamiento) permite encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento de especies vegetales ya que no necesita la utilización de poblaciones provenientes de cruzamientos controlados. Sin embargo, se ha detectado que en poblaciones estructuradas genéticamente, el número de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. El análisis de componentes principales constituye una herramienta para identificar la estructura y expresar la misma en un número reducido de componentes principales (CPs). Entonces, estos CPs se pueden incorporar como covariables en el modelo de asociación. Diferentes estrategias de modelado se pueden utilizar para tener en cuenta la estructura genética en el mapeo de asociación. El objetivo de este trabajo fue estimar las tasas de falsos positivos derivados de la aplicación de tres modelos estadísticos diferentes de mapeo bajo poblaciones estructuradas. Los modelos comparados fueron M1: sin corrección por estructura, M2: con las CPs como covariables de efectos fijos y M3: incluyendo las mismas CPs como covariables de efectos aleatorios en el marco de un modelo lineal mixto. La comparación se realizó usando datos reales y simulados de una especie autógama. Los resultados sugieren que la corrección con las CPs como covariables aleatorias disminuye la tasa de falsos positivos en la inferencia de asociaciones marcador-carácter.
Association mapping (or linkage disequilibrium mapping) is used to find specific parts of the genome associated with phenotypic trait variation. It is a widely used in plant breeding because it allows the use of populations that do not come from specific experimental designs. If the population of individuals used in association mapping is genetically structured, the number of false positives, in the marker-trait association, increases. Several strategies can be used to model associations taken into account the underlying genetic structure. The principal components analysis can be used to identify the structure and express it in a reduced number of principal components (PCs). Then, these PCs can be incorporated as covariates in the association model. Different models strategies can be used to account for genetic structure in association mapping. The aim of this paper is to estimate expected false positive rates in association mapping performed by three different statistical models, under genetically structured populations. Compared models were M1: without correction for structure, M2: including PCs, as covariates of fixed effects, and M3: including PCs as random effects within a linear mixed model. Model comparison was performed using both, real and simulated data, for self-pollinated specie. The results suggested that the use of PCs as random covariates decreases the false positive rate in the inference of marker-trait associations.
Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Gutierrez, Luciana. Universidad de la República; Uruguay
Fil: Balzarini, Monica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Materia
Modelos lineales mixtos
Análisis de componentes principales
Estructura genética
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/34527

id CONICETDig_b32d202c5da8849a1511a27629ccb097
oai_identifier_str oai:ri.conicet.gov.ar:11336/34527
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Componentes principales en mapeo asociativoPrincipal components in associative mappingPeña Malavera, Andrea NataliaGutierrez, LucianaBalzarini, Monica GracielaModelos lineales mixtosAnálisis de componentes principalesEstructura genéticahttps://purl.org/becyt/ford/1.6https://purl.org/becyt/ford/1El mapeo asociativo (o mapeo por desequilibrio de ligamiento) permite encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento de especies vegetales ya que no necesita la utilización de poblaciones provenientes de cruzamientos controlados. Sin embargo, se ha detectado que en poblaciones estructuradas genéticamente, el número de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. El análisis de componentes principales constituye una herramienta para identificar la estructura y expresar la misma en un número reducido de componentes principales (CPs). Entonces, estos CPs se pueden incorporar como covariables en el modelo de asociación. Diferentes estrategias de modelado se pueden utilizar para tener en cuenta la estructura genética en el mapeo de asociación. El objetivo de este trabajo fue estimar las tasas de falsos positivos derivados de la aplicación de tres modelos estadísticos diferentes de mapeo bajo poblaciones estructuradas. Los modelos comparados fueron M1: sin corrección por estructura, M2: con las CPs como covariables de efectos fijos y M3: incluyendo las mismas CPs como covariables de efectos aleatorios en el marco de un modelo lineal mixto. La comparación se realizó usando datos reales y simulados de una especie autógama. Los resultados sugieren que la corrección con las CPs como covariables aleatorias disminuye la tasa de falsos positivos en la inferencia de asociaciones marcador-carácter.Association mapping (or linkage disequilibrium mapping) is used to find specific parts of the genome associated with phenotypic trait variation. It is a widely used in plant breeding because it allows the use of populations that do not come from specific experimental designs. If the population of individuals used in association mapping is genetically structured, the number of false positives, in the marker-trait association, increases. Several strategies can be used to model associations taken into account the underlying genetic structure. The principal components analysis can be used to identify the structure and express it in a reduced number of principal components (PCs). Then, these PCs can be incorporated as covariates in the association model. Different models strategies can be used to account for genetic structure in association mapping. The aim of this paper is to estimate expected false positive rates in association mapping performed by three different statistical models, under genetically structured populations. Compared models were M1: without correction for structure, M2: including PCs, as covariates of fixed effects, and M3: including PCs as random effects within a linear mixed model. Model comparison was performed using both, real and simulated data, for self-pollinated specie. The results suggested that the use of PCs as random covariates decreases the false positive rate in the inference of marker-trait associations.Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Gutierrez, Luciana. Universidad de la República; UruguayFil: Balzarini, Monica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaSociedad Argentina de Genética2014-12info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/34527Peña Malavera, Andrea Natalia; Gutierrez, Luciana; Balzarini, Monica Graciela; Componentes principales en mapeo asociativo; Sociedad Argentina de Genética; Journal of Basic and Applied Genetics; 25; 2; 12-2014; 32-411852-6233CONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/http://ref.scielo.org/bpp2w5info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-29T10:15:05Zoai:ri.conicet.gov.ar:11336/34527instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-29 10:15:05.441CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Componentes principales en mapeo asociativo
Principal components in associative mapping
title Componentes principales en mapeo asociativo
spellingShingle Componentes principales en mapeo asociativo
Peña Malavera, Andrea Natalia
Modelos lineales mixtos
Análisis de componentes principales
Estructura genética
title_short Componentes principales en mapeo asociativo
title_full Componentes principales en mapeo asociativo
title_fullStr Componentes principales en mapeo asociativo
title_full_unstemmed Componentes principales en mapeo asociativo
title_sort Componentes principales en mapeo asociativo
dc.creator.none.fl_str_mv Peña Malavera, Andrea Natalia
Gutierrez, Luciana
Balzarini, Monica Graciela
author Peña Malavera, Andrea Natalia
author_facet Peña Malavera, Andrea Natalia
Gutierrez, Luciana
Balzarini, Monica Graciela
author_role author
author2 Gutierrez, Luciana
Balzarini, Monica Graciela
author2_role author
author
dc.subject.none.fl_str_mv Modelos lineales mixtos
Análisis de componentes principales
Estructura genética
topic Modelos lineales mixtos
Análisis de componentes principales
Estructura genética
purl_subject.fl_str_mv https://purl.org/becyt/ford/1.6
https://purl.org/becyt/ford/1
dc.description.none.fl_txt_mv El mapeo asociativo (o mapeo por desequilibrio de ligamiento) permite encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento de especies vegetales ya que no necesita la utilización de poblaciones provenientes de cruzamientos controlados. Sin embargo, se ha detectado que en poblaciones estructuradas genéticamente, el número de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. El análisis de componentes principales constituye una herramienta para identificar la estructura y expresar la misma en un número reducido de componentes principales (CPs). Entonces, estos CPs se pueden incorporar como covariables en el modelo de asociación. Diferentes estrategias de modelado se pueden utilizar para tener en cuenta la estructura genética en el mapeo de asociación. El objetivo de este trabajo fue estimar las tasas de falsos positivos derivados de la aplicación de tres modelos estadísticos diferentes de mapeo bajo poblaciones estructuradas. Los modelos comparados fueron M1: sin corrección por estructura, M2: con las CPs como covariables de efectos fijos y M3: incluyendo las mismas CPs como covariables de efectos aleatorios en el marco de un modelo lineal mixto. La comparación se realizó usando datos reales y simulados de una especie autógama. Los resultados sugieren que la corrección con las CPs como covariables aleatorias disminuye la tasa de falsos positivos en la inferencia de asociaciones marcador-carácter.
Association mapping (or linkage disequilibrium mapping) is used to find specific parts of the genome associated with phenotypic trait variation. It is a widely used in plant breeding because it allows the use of populations that do not come from specific experimental designs. If the population of individuals used in association mapping is genetically structured, the number of false positives, in the marker-trait association, increases. Several strategies can be used to model associations taken into account the underlying genetic structure. The principal components analysis can be used to identify the structure and express it in a reduced number of principal components (PCs). Then, these PCs can be incorporated as covariates in the association model. Different models strategies can be used to account for genetic structure in association mapping. The aim of this paper is to estimate expected false positive rates in association mapping performed by three different statistical models, under genetically structured populations. Compared models were M1: without correction for structure, M2: including PCs, as covariates of fixed effects, and M3: including PCs as random effects within a linear mixed model. Model comparison was performed using both, real and simulated data, for self-pollinated specie. The results suggested that the use of PCs as random covariates decreases the false positive rate in the inference of marker-trait associations.
Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Gutierrez, Luciana. Universidad de la República; Uruguay
Fil: Balzarini, Monica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
description El mapeo asociativo (o mapeo por desequilibrio de ligamiento) permite encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento de especies vegetales ya que no necesita la utilización de poblaciones provenientes de cruzamientos controlados. Sin embargo, se ha detectado que en poblaciones estructuradas genéticamente, el número de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. El análisis de componentes principales constituye una herramienta para identificar la estructura y expresar la misma en un número reducido de componentes principales (CPs). Entonces, estos CPs se pueden incorporar como covariables en el modelo de asociación. Diferentes estrategias de modelado se pueden utilizar para tener en cuenta la estructura genética en el mapeo de asociación. El objetivo de este trabajo fue estimar las tasas de falsos positivos derivados de la aplicación de tres modelos estadísticos diferentes de mapeo bajo poblaciones estructuradas. Los modelos comparados fueron M1: sin corrección por estructura, M2: con las CPs como covariables de efectos fijos y M3: incluyendo las mismas CPs como covariables de efectos aleatorios en el marco de un modelo lineal mixto. La comparación se realizó usando datos reales y simulados de una especie autógama. Los resultados sugieren que la corrección con las CPs como covariables aleatorias disminuye la tasa de falsos positivos en la inferencia de asociaciones marcador-carácter.
publishDate 2014
dc.date.none.fl_str_mv 2014-12
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/34527
Peña Malavera, Andrea Natalia; Gutierrez, Luciana; Balzarini, Monica Graciela; Componentes principales en mapeo asociativo; Sociedad Argentina de Genética; Journal of Basic and Applied Genetics; 25; 2; 12-2014; 32-41
1852-6233
CONICET Digital
CONICET
url http://hdl.handle.net/11336/34527
identifier_str_mv Peña Malavera, Andrea Natalia; Gutierrez, Luciana; Balzarini, Monica Graciela; Componentes principales en mapeo asociativo; Sociedad Argentina de Genética; Journal of Basic and Applied Genetics; 25; 2; 12-2014; 32-41
1852-6233
CONICET Digital
CONICET
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/http://ref.scielo.org/bpp2w5
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
application/pdf
dc.publisher.none.fl_str_mv Sociedad Argentina de Genética
publisher.none.fl_str_mv Sociedad Argentina de Genética
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1844614084217012224
score 13.070432