Herramientas estadísticas para el análisis de datos en estudios de asociación genómica

Autores
Rueda Calderón, María Angélica
Año de publicación
2020
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Bruno, Cecilia Inés
Descripción
Tesis (Doctor en Ciencias Agropecuarias) -- UNC- Facultad de Ciencias Agropecuarias, 2020
Fil: Rueda Calderón, María Angélica. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.
Fil: Bruno, Cecilia Inés. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Bruno, Cecilia Inés. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.
El mapeo asociativo (MA) o GWAS (por sus siglas en inglés, Genome Wide Association Study) es usado para encontrar lugares específicos del genoma relacionados con la variación de un caracter fenotípico. En el mejoramiento vegetal posibilita el uso de poblaciones no diseñadas experimentalmente. Los marcadores significativos pueden ser usados en selección asistida por marcadores. Se supone que la modelación estadística que incorpora información sobre el parentesco y correlaciones ambientales hace más eficiente el MA. Un objetivo de esta tesis es comparar el desempeño, en términos de la estimación de las componentes de varianza, las puntuaciones de los marcadores y los BLUP (best linear unbiased predictor) de los efectos de genotipo, de los modelos por ambiente y multiambientales para GWAS que incluyen correlaciones genéticas a través de un pedigrí o una matriz de similitud de marcadores moleculares. Los modelos multiambientales produjeron estimaciones más precisas de la variabilidad genética y ofrecen una estimación de la varianza de la interacción genotipo-ambiente (G×E), razón por la cual son preferidos a la modelación por ambiente. Dada la abundancia de estudios de selección genómica (SG) en vegetales, otros objetivos de la tesis fueron, i) realizar una revisión sistemática de literatura científica publicada sobre SG en vegetales, ii) identificar las principales metodologías de estimación usadas en el contexto de SG, iii) aplicar técnicas propias del meta-análisis para obtener medidas globales de la eficiencia de los modelos SG usados con mayor frecuencia en vegetales y iv) desarrollar un protocolo para meta-análisis orientado a identificar loci de efecto mayor en estudios de asociación genómica. Los resultados del meta-análisis sugirieron que la eficiencia de la SG en promedio es del 60% tanto en cereales como en otras especies de importancia agrícola. Respecto al análisis de QTL tradicional donde existen numerosas publicaciones el protocolo propuesto para la identificación de loci de efecto mayor representa una herramienta potente para la síntesis de resultados. Implementado en la búsqueda de QTL para resistencia/tolerancia a enfermedades virales en maíz identificó consensos en las publicaciones que sugieren QTL posicionados en el cromosoma 1 con efecto aditivo relativamente importante, mientras que aquellos presentes en los cromosomas 3, 4 y 10 se corresponden con loci de efecto relativamente menor.
Association mapping (AM) or GWAS (Genome Wide Association Study), is used to find specific genomic regions related to phenotypic trait variation. In plant breeding it enables the use of populations not experimentally designed. Significant markers can be used in marker-assisted selection. It is assumed that statistical modeling that incorporates information about kinship and environmental correlations makes the AM more efficient. An objective of this thesis is to compare the performance, in terms of the estimation of the variance components, marker scores, and BLUP (Best Linear Unbiased Predictor) of the genotype effects, in single-environment and multienvironmental models for GWAS which including genetic correlations through a pedigree or a similarity matrix of molecular markers. Multienvironmental models produced more accurate estimates of genetic variability and offered an estimate of the variance of the genotype-environment interaction (G×E), which is why they are preferred to modeling by environment. Given the abundance of Genomic Selection studies (GS) in vegetables, other objectives of the thesis were, i) to conduct a systematic review of published scientific literature on GS in vegetables, ii) to identify the main estimation methodologies used in the context of GS, iii) to apply meta-analysis techniques to obtain global measures of the efficiency of the most frequently used GS models in vegetables, and iv) to develop a protocol for meta-analysis aimed at identifying major-effect loci in genomic association studies. Meta-analysis results suggested that on average of GS efficiency is 60% in both cereals and other species of agricultural importance. Regarding traditional QTL analysis where there are numerous publications, the proposed protocol for the identification of the major-effect loci represents a powerful tool for the synthesis of results. Implemented in the search for resistance/tolerance's QTL to viral diseases in maize, it identified consensus in the publications that suggest QTL positioned on chromosome 1 with a relatively important additive effect, while those present on chromosomes 3, 4, and 10 correspond to loci of relatively minor effect.
Fil: Rueda Calderón, María Angélica. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.
Fil: Bruno, Cecilia Inés. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Bruno, Cecilia Inés. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.
Materia
Fitomejoramiento
Marcadores genéticos
Selección
Interacción genotipo ambiente
Genotipos
Fenotipos
Estadística
Métodos estadísticos
Análisis estadístico
Análisis de datos
Modelos lineales
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/28166

id RDUUNC_176ba5a7d9186cd25f72f300b99b7b0b
oai_identifier_str oai:rdu.unc.edu.ar:11086/28166
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Herramientas estadísticas para el análisis de datos en estudios de asociación genómicaRueda Calderón, María AngélicaFitomejoramientoMarcadores genéticosSelecciónInteracción genotipo ambienteGenotiposFenotiposEstadísticaMétodos estadísticosAnálisis estadísticoAnálisis de datosModelos linealesTesis (Doctor en Ciencias Agropecuarias) -- UNC- Facultad de Ciencias Agropecuarias, 2020Fil: Rueda Calderón, María Angélica. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.Fil: Bruno, Cecilia Inés. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.Fil: Bruno, Cecilia Inés. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.El mapeo asociativo (MA) o GWAS (por sus siglas en inglés, Genome Wide Association Study) es usado para encontrar lugares específicos del genoma relacionados con la variación de un caracter fenotípico. En el mejoramiento vegetal posibilita el uso de poblaciones no diseñadas experimentalmente. Los marcadores significativos pueden ser usados en selección asistida por marcadores. Se supone que la modelación estadística que incorpora información sobre el parentesco y correlaciones ambientales hace más eficiente el MA. Un objetivo de esta tesis es comparar el desempeño, en términos de la estimación de las componentes de varianza, las puntuaciones de los marcadores y los BLUP (best linear unbiased predictor) de los efectos de genotipo, de los modelos por ambiente y multiambientales para GWAS que incluyen correlaciones genéticas a través de un pedigrí o una matriz de similitud de marcadores moleculares. Los modelos multiambientales produjeron estimaciones más precisas de la variabilidad genética y ofrecen una estimación de la varianza de la interacción genotipo-ambiente (G×E), razón por la cual son preferidos a la modelación por ambiente. Dada la abundancia de estudios de selección genómica (SG) en vegetales, otros objetivos de la tesis fueron, i) realizar una revisión sistemática de literatura científica publicada sobre SG en vegetales, ii) identificar las principales metodologías de estimación usadas en el contexto de SG, iii) aplicar técnicas propias del meta-análisis para obtener medidas globales de la eficiencia de los modelos SG usados con mayor frecuencia en vegetales y iv) desarrollar un protocolo para meta-análisis orientado a identificar loci de efecto mayor en estudios de asociación genómica. Los resultados del meta-análisis sugirieron que la eficiencia de la SG en promedio es del 60% tanto en cereales como en otras especies de importancia agrícola. Respecto al análisis de QTL tradicional donde existen numerosas publicaciones el protocolo propuesto para la identificación de loci de efecto mayor representa una herramienta potente para la síntesis de resultados. Implementado en la búsqueda de QTL para resistencia/tolerancia a enfermedades virales en maíz identificó consensos en las publicaciones que sugieren QTL posicionados en el cromosoma 1 con efecto aditivo relativamente importante, mientras que aquellos presentes en los cromosomas 3, 4 y 10 se corresponden con loci de efecto relativamente menor.Association mapping (AM) or GWAS (Genome Wide Association Study), is used to find specific genomic regions related to phenotypic trait variation. In plant breeding it enables the use of populations not experimentally designed. Significant markers can be used in marker-assisted selection. It is assumed that statistical modeling that incorporates information about kinship and environmental correlations makes the AM more efficient. An objective of this thesis is to compare the performance, in terms of the estimation of the variance components, marker scores, and BLUP (Best Linear Unbiased Predictor) of the genotype effects, in single-environment and multienvironmental models for GWAS which including genetic correlations through a pedigree or a similarity matrix of molecular markers. Multienvironmental models produced more accurate estimates of genetic variability and offered an estimate of the variance of the genotype-environment interaction (G×E), which is why they are preferred to modeling by environment. Given the abundance of Genomic Selection studies (GS) in vegetables, other objectives of the thesis were, i) to conduct a systematic review of published scientific literature on GS in vegetables, ii) to identify the main estimation methodologies used in the context of GS, iii) to apply meta-analysis techniques to obtain global measures of the efficiency of the most frequently used GS models in vegetables, and iv) to develop a protocol for meta-analysis aimed at identifying major-effect loci in genomic association studies. Meta-analysis results suggested that on average of GS efficiency is 60% in both cereals and other species of agricultural importance. Regarding traditional QTL analysis where there are numerous publications, the proposed protocol for the identification of the major-effect loci represents a powerful tool for the synthesis of results. Implemented in the search for resistance/tolerance's QTL to viral diseases in maize, it identified consensus in the publications that suggest QTL positioned on chromosome 1 with a relatively important additive effect, while those present on chromosomes 3, 4, and 10 correspond to loci of relatively minor effect.Fil: Rueda Calderón, María Angélica. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.Fil: Bruno, Cecilia Inés. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.Fil: Bruno, Cecilia Inés. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.Bruno, Cecilia Inés2020info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttp://hdl.handle.net/11086/28166spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-29T13:44:26Zoai:rdu.unc.edu.ar:11086/28166Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:44:26.657Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Herramientas estadísticas para el análisis de datos en estudios de asociación genómica
title Herramientas estadísticas para el análisis de datos en estudios de asociación genómica
spellingShingle Herramientas estadísticas para el análisis de datos en estudios de asociación genómica
Rueda Calderón, María Angélica
Fitomejoramiento
Marcadores genéticos
Selección
Interacción genotipo ambiente
Genotipos
Fenotipos
Estadística
Métodos estadísticos
Análisis estadístico
Análisis de datos
Modelos lineales
title_short Herramientas estadísticas para el análisis de datos en estudios de asociación genómica
title_full Herramientas estadísticas para el análisis de datos en estudios de asociación genómica
title_fullStr Herramientas estadísticas para el análisis de datos en estudios de asociación genómica
title_full_unstemmed Herramientas estadísticas para el análisis de datos en estudios de asociación genómica
title_sort Herramientas estadísticas para el análisis de datos en estudios de asociación genómica
dc.creator.none.fl_str_mv Rueda Calderón, María Angélica
author Rueda Calderón, María Angélica
author_facet Rueda Calderón, María Angélica
author_role author
dc.contributor.none.fl_str_mv Bruno, Cecilia Inés
dc.subject.none.fl_str_mv Fitomejoramiento
Marcadores genéticos
Selección
Interacción genotipo ambiente
Genotipos
Fenotipos
Estadística
Métodos estadísticos
Análisis estadístico
Análisis de datos
Modelos lineales
topic Fitomejoramiento
Marcadores genéticos
Selección
Interacción genotipo ambiente
Genotipos
Fenotipos
Estadística
Métodos estadísticos
Análisis estadístico
Análisis de datos
Modelos lineales
dc.description.none.fl_txt_mv Tesis (Doctor en Ciencias Agropecuarias) -- UNC- Facultad de Ciencias Agropecuarias, 2020
Fil: Rueda Calderón, María Angélica. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.
Fil: Bruno, Cecilia Inés. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Bruno, Cecilia Inés. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.
El mapeo asociativo (MA) o GWAS (por sus siglas en inglés, Genome Wide Association Study) es usado para encontrar lugares específicos del genoma relacionados con la variación de un caracter fenotípico. En el mejoramiento vegetal posibilita el uso de poblaciones no diseñadas experimentalmente. Los marcadores significativos pueden ser usados en selección asistida por marcadores. Se supone que la modelación estadística que incorpora información sobre el parentesco y correlaciones ambientales hace más eficiente el MA. Un objetivo de esta tesis es comparar el desempeño, en términos de la estimación de las componentes de varianza, las puntuaciones de los marcadores y los BLUP (best linear unbiased predictor) de los efectos de genotipo, de los modelos por ambiente y multiambientales para GWAS que incluyen correlaciones genéticas a través de un pedigrí o una matriz de similitud de marcadores moleculares. Los modelos multiambientales produjeron estimaciones más precisas de la variabilidad genética y ofrecen una estimación de la varianza de la interacción genotipo-ambiente (G×E), razón por la cual son preferidos a la modelación por ambiente. Dada la abundancia de estudios de selección genómica (SG) en vegetales, otros objetivos de la tesis fueron, i) realizar una revisión sistemática de literatura científica publicada sobre SG en vegetales, ii) identificar las principales metodologías de estimación usadas en el contexto de SG, iii) aplicar técnicas propias del meta-análisis para obtener medidas globales de la eficiencia de los modelos SG usados con mayor frecuencia en vegetales y iv) desarrollar un protocolo para meta-análisis orientado a identificar loci de efecto mayor en estudios de asociación genómica. Los resultados del meta-análisis sugirieron que la eficiencia de la SG en promedio es del 60% tanto en cereales como en otras especies de importancia agrícola. Respecto al análisis de QTL tradicional donde existen numerosas publicaciones el protocolo propuesto para la identificación de loci de efecto mayor representa una herramienta potente para la síntesis de resultados. Implementado en la búsqueda de QTL para resistencia/tolerancia a enfermedades virales en maíz identificó consensos en las publicaciones que sugieren QTL posicionados en el cromosoma 1 con efecto aditivo relativamente importante, mientras que aquellos presentes en los cromosomas 3, 4 y 10 se corresponden con loci de efecto relativamente menor.
Association mapping (AM) or GWAS (Genome Wide Association Study), is used to find specific genomic regions related to phenotypic trait variation. In plant breeding it enables the use of populations not experimentally designed. Significant markers can be used in marker-assisted selection. It is assumed that statistical modeling that incorporates information about kinship and environmental correlations makes the AM more efficient. An objective of this thesis is to compare the performance, in terms of the estimation of the variance components, marker scores, and BLUP (Best Linear Unbiased Predictor) of the genotype effects, in single-environment and multienvironmental models for GWAS which including genetic correlations through a pedigree or a similarity matrix of molecular markers. Multienvironmental models produced more accurate estimates of genetic variability and offered an estimate of the variance of the genotype-environment interaction (G×E), which is why they are preferred to modeling by environment. Given the abundance of Genomic Selection studies (GS) in vegetables, other objectives of the thesis were, i) to conduct a systematic review of published scientific literature on GS in vegetables, ii) to identify the main estimation methodologies used in the context of GS, iii) to apply meta-analysis techniques to obtain global measures of the efficiency of the most frequently used GS models in vegetables, and iv) to develop a protocol for meta-analysis aimed at identifying major-effect loci in genomic association studies. Meta-analysis results suggested that on average of GS efficiency is 60% in both cereals and other species of agricultural importance. Regarding traditional QTL analysis where there are numerous publications, the proposed protocol for the identification of the major-effect loci represents a powerful tool for the synthesis of results. Implemented in the search for resistance/tolerance's QTL to viral diseases in maize, it identified consensus in the publications that suggest QTL positioned on chromosome 1 with a relatively important additive effect, while those present on chromosomes 3, 4, and 10 correspond to loci of relatively minor effect.
Fil: Rueda Calderón, María Angélica. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias; Argentina.
Fil: Bruno, Cecilia Inés. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Bruno, Cecilia Inés. Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET). Centro Científico Tecnológico (CCT Córdoba); Argentina.
description Tesis (Doctor en Ciencias Agropecuarias) -- UNC- Facultad de Ciencias Agropecuarias, 2020
publishDate 2020
dc.date.none.fl_str_mv 2020
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/28166
url http://hdl.handle.net/11086/28166
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1844618982208831488
score 13.070432