Componentes principales en mapeo asociativo
- Autores
- Peña Malavera, Andrea Natalia; Gutierrez, Luciana; Balzarini, Monica Graciela
- Año de publicación
- 2014
- Idioma
- español castellano
- Tipo de recurso
- artículo
- Estado
- versión publicada
- Descripción
- El mapeo asociativo (o mapeo por desequilibrio de ligamiento) permite encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento de especies vegetales ya que no necesita la utilización de poblaciones provenientes de cruzamientos controlados. Sin embargo, se ha detectado que en poblaciones estructuradas genéticamente, el número de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. El análisis de componentes principales constituye una herramienta para identificar la estructura y expresar la misma en un número reducido de componentes principales (CPs). Entonces, estos CPs se pueden incorporar como covariables en el modelo de asociación. Diferentes estrategias de modelado se pueden utilizar para tener en cuenta la estructura genética en el mapeo de asociación. El objetivo de este trabajo fue estimar las tasas de falsos positivos derivados de la aplicación de tres modelos estadísticos diferentes de mapeo bajo poblaciones estructuradas. Los modelos comparados fueron M1: sin corrección por estructura, M2: con las CPs como covariables de efectos fijos y M3: incluyendo las mismas CPs como covariables de efectos aleatorios en el marco de un modelo lineal mixto. La comparación se realizó usando datos reales y simulados de una especie autógama. Los resultados sugieren que la corrección con las CPs como covariables aleatorias disminuye la tasa de falsos positivos en la inferencia de asociaciones marcador-carácter.
Association mapping (or linkage disequilibrium mapping) is used to find specific parts of the genome associated with phenotypic trait variation. It is a widely used in plant breeding because it allows the use of populations that do not come from specific experimental designs. If the population of individuals used in association mapping is genetically structured, the number of false positives, in the marker-trait association, increases. Several strategies can be used to model associations taken into account the underlying genetic structure. The principal components analysis can be used to identify the structure and express it in a reduced number of principal components (PCs). Then, these PCs can be incorporated as covariates in the association model. Different models strategies can be used to account for genetic structure in association mapping. The aim of this paper is to estimate expected false positive rates in association mapping performed by three different statistical models, under genetically structured populations. Compared models were M1: without correction for structure, M2: including PCs, as covariates of fixed effects, and M3: including PCs as random effects within a linear mixed model. Model comparison was performed using both, real and simulated data, for self-pollinated specie. The results suggested that the use of PCs as random covariates decreases the false positive rate in the inference of marker-trait associations.
Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Fil: Gutierrez, Luciana. Universidad de la República; Uruguay
Fil: Balzarini, Monica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina - Materia
-
Modelos lineales mixtos
Análisis de componentes principales
Estructura genética - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
- Repositorio
- Institución
- Consejo Nacional de Investigaciones Científicas y Técnicas
- OAI Identificador
- oai:ri.conicet.gov.ar:11336/34527
Ver los metadatos del registro completo
id |
CONICETDig_b32d202c5da8849a1511a27629ccb097 |
---|---|
oai_identifier_str |
oai:ri.conicet.gov.ar:11336/34527 |
network_acronym_str |
CONICETDig |
repository_id_str |
3498 |
network_name_str |
CONICET Digital (CONICET) |
spelling |
Componentes principales en mapeo asociativoPrincipal components in associative mappingPeña Malavera, Andrea NataliaGutierrez, LucianaBalzarini, Monica GracielaModelos lineales mixtosAnálisis de componentes principalesEstructura genéticahttps://purl.org/becyt/ford/1.6https://purl.org/becyt/ford/1El mapeo asociativo (o mapeo por desequilibrio de ligamiento) permite encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento de especies vegetales ya que no necesita la utilización de poblaciones provenientes de cruzamientos controlados. Sin embargo, se ha detectado que en poblaciones estructuradas genéticamente, el número de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. El análisis de componentes principales constituye una herramienta para identificar la estructura y expresar la misma en un número reducido de componentes principales (CPs). Entonces, estos CPs se pueden incorporar como covariables en el modelo de asociación. Diferentes estrategias de modelado se pueden utilizar para tener en cuenta la estructura genética en el mapeo de asociación. El objetivo de este trabajo fue estimar las tasas de falsos positivos derivados de la aplicación de tres modelos estadísticos diferentes de mapeo bajo poblaciones estructuradas. Los modelos comparados fueron M1: sin corrección por estructura, M2: con las CPs como covariables de efectos fijos y M3: incluyendo las mismas CPs como covariables de efectos aleatorios en el marco de un modelo lineal mixto. La comparación se realizó usando datos reales y simulados de una especie autógama. Los resultados sugieren que la corrección con las CPs como covariables aleatorias disminuye la tasa de falsos positivos en la inferencia de asociaciones marcador-carácter.Association mapping (or linkage disequilibrium mapping) is used to find specific parts of the genome associated with phenotypic trait variation. It is a widely used in plant breeding because it allows the use of populations that do not come from specific experimental designs. If the population of individuals used in association mapping is genetically structured, the number of false positives, in the marker-trait association, increases. Several strategies can be used to model associations taken into account the underlying genetic structure. The principal components analysis can be used to identify the structure and express it in a reduced number of principal components (PCs). Then, these PCs can be incorporated as covariates in the association model. Different models strategies can be used to account for genetic structure in association mapping. The aim of this paper is to estimate expected false positive rates in association mapping performed by three different statistical models, under genetically structured populations. Compared models were M1: without correction for structure, M2: including PCs, as covariates of fixed effects, and M3: including PCs as random effects within a linear mixed model. Model comparison was performed using both, real and simulated data, for self-pollinated specie. The results suggested that the use of PCs as random covariates decreases the false positive rate in the inference of marker-trait associations.Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Gutierrez, Luciana. Universidad de la República; UruguayFil: Balzarini, Monica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaSociedad Argentina de Genética2014-12info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/34527Peña Malavera, Andrea Natalia; Gutierrez, Luciana; Balzarini, Monica Graciela; Componentes principales en mapeo asociativo; Sociedad Argentina de Genética; Journal of Basic and Applied Genetics; 25; 2; 12-2014; 32-411852-6233CONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/http://ref.scielo.org/bpp2w5info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-29T10:15:05Zoai:ri.conicet.gov.ar:11336/34527instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-29 10:15:05.441CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse |
dc.title.none.fl_str_mv |
Componentes principales en mapeo asociativo Principal components in associative mapping |
title |
Componentes principales en mapeo asociativo |
spellingShingle |
Componentes principales en mapeo asociativo Peña Malavera, Andrea Natalia Modelos lineales mixtos Análisis de componentes principales Estructura genética |
title_short |
Componentes principales en mapeo asociativo |
title_full |
Componentes principales en mapeo asociativo |
title_fullStr |
Componentes principales en mapeo asociativo |
title_full_unstemmed |
Componentes principales en mapeo asociativo |
title_sort |
Componentes principales en mapeo asociativo |
dc.creator.none.fl_str_mv |
Peña Malavera, Andrea Natalia Gutierrez, Luciana Balzarini, Monica Graciela |
author |
Peña Malavera, Andrea Natalia |
author_facet |
Peña Malavera, Andrea Natalia Gutierrez, Luciana Balzarini, Monica Graciela |
author_role |
author |
author2 |
Gutierrez, Luciana Balzarini, Monica Graciela |
author2_role |
author author |
dc.subject.none.fl_str_mv |
Modelos lineales mixtos Análisis de componentes principales Estructura genética |
topic |
Modelos lineales mixtos Análisis de componentes principales Estructura genética |
purl_subject.fl_str_mv |
https://purl.org/becyt/ford/1.6 https://purl.org/becyt/ford/1 |
dc.description.none.fl_txt_mv |
El mapeo asociativo (o mapeo por desequilibrio de ligamiento) permite encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento de especies vegetales ya que no necesita la utilización de poblaciones provenientes de cruzamientos controlados. Sin embargo, se ha detectado que en poblaciones estructuradas genéticamente, el número de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. El análisis de componentes principales constituye una herramienta para identificar la estructura y expresar la misma en un número reducido de componentes principales (CPs). Entonces, estos CPs se pueden incorporar como covariables en el modelo de asociación. Diferentes estrategias de modelado se pueden utilizar para tener en cuenta la estructura genética en el mapeo de asociación. El objetivo de este trabajo fue estimar las tasas de falsos positivos derivados de la aplicación de tres modelos estadísticos diferentes de mapeo bajo poblaciones estructuradas. Los modelos comparados fueron M1: sin corrección por estructura, M2: con las CPs como covariables de efectos fijos y M3: incluyendo las mismas CPs como covariables de efectos aleatorios en el marco de un modelo lineal mixto. La comparación se realizó usando datos reales y simulados de una especie autógama. Los resultados sugieren que la corrección con las CPs como covariables aleatorias disminuye la tasa de falsos positivos en la inferencia de asociaciones marcador-carácter. Association mapping (or linkage disequilibrium mapping) is used to find specific parts of the genome associated with phenotypic trait variation. It is a widely used in plant breeding because it allows the use of populations that do not come from specific experimental designs. If the population of individuals used in association mapping is genetically structured, the number of false positives, in the marker-trait association, increases. Several strategies can be used to model associations taken into account the underlying genetic structure. The principal components analysis can be used to identify the structure and express it in a reduced number of principal components (PCs). Then, these PCs can be incorporated as covariates in the association model. Different models strategies can be used to account for genetic structure in association mapping. The aim of this paper is to estimate expected false positive rates in association mapping performed by three different statistical models, under genetically structured populations. Compared models were M1: without correction for structure, M2: including PCs, as covariates of fixed effects, and M3: including PCs as random effects within a linear mixed model. Model comparison was performed using both, real and simulated data, for self-pollinated specie. The results suggested that the use of PCs as random covariates decreases the false positive rate in the inference of marker-trait associations. Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina Fil: Gutierrez, Luciana. Universidad de la República; Uruguay Fil: Balzarini, Monica Graciela. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina |
description |
El mapeo asociativo (o mapeo por desequilibrio de ligamiento) permite encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento de especies vegetales ya que no necesita la utilización de poblaciones provenientes de cruzamientos controlados. Sin embargo, se ha detectado que en poblaciones estructuradas genéticamente, el número de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. El análisis de componentes principales constituye una herramienta para identificar la estructura y expresar la misma en un número reducido de componentes principales (CPs). Entonces, estos CPs se pueden incorporar como covariables en el modelo de asociación. Diferentes estrategias de modelado se pueden utilizar para tener en cuenta la estructura genética en el mapeo de asociación. El objetivo de este trabajo fue estimar las tasas de falsos positivos derivados de la aplicación de tres modelos estadísticos diferentes de mapeo bajo poblaciones estructuradas. Los modelos comparados fueron M1: sin corrección por estructura, M2: con las CPs como covariables de efectos fijos y M3: incluyendo las mismas CPs como covariables de efectos aleatorios en el marco de un modelo lineal mixto. La comparación se realizó usando datos reales y simulados de una especie autógama. Los resultados sugieren que la corrección con las CPs como covariables aleatorias disminuye la tasa de falsos positivos en la inferencia de asociaciones marcador-carácter. |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014-12 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo |
format |
article |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11336/34527 Peña Malavera, Andrea Natalia; Gutierrez, Luciana; Balzarini, Monica Graciela; Componentes principales en mapeo asociativo; Sociedad Argentina de Genética; Journal of Basic and Applied Genetics; 25; 2; 12-2014; 32-41 1852-6233 CONICET Digital CONICET |
url |
http://hdl.handle.net/11336/34527 |
identifier_str_mv |
Peña Malavera, Andrea Natalia; Gutierrez, Luciana; Balzarini, Monica Graciela; Componentes principales en mapeo asociativo; Sociedad Argentina de Genética; Journal of Basic and Applied Genetics; 25; 2; 12-2014; 32-41 1852-6233 CONICET Digital CONICET |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/url/http://ref.scielo.org/bpp2w5 |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ |
dc.format.none.fl_str_mv |
application/pdf application/pdf application/pdf |
dc.publisher.none.fl_str_mv |
Sociedad Argentina de Genética |
publisher.none.fl_str_mv |
Sociedad Argentina de Genética |
dc.source.none.fl_str_mv |
reponame:CONICET Digital (CONICET) instname:Consejo Nacional de Investigaciones Científicas y Técnicas |
reponame_str |
CONICET Digital (CONICET) |
collection |
CONICET Digital (CONICET) |
instname_str |
Consejo Nacional de Investigaciones Científicas y Técnicas |
repository.name.fl_str_mv |
CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas |
repository.mail.fl_str_mv |
dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar |
_version_ |
1844614084217012224 |
score |
13.070432 |