Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos

Autores
Peña Malavera, Andrea Natalia
Año de publicación
2015
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Blazarini, Mónica
Descripción
Tesis (DCI)--FCEFN-UNC, 2015
Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina.
El mapeo asociativo (MA) o GWAS (por sus siglas en inglés, Genome Wide Association Study) es usado para encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento vegetal, ya que posibilita el uso de poblaciones no diseñadas experimentalmente. Sin embargo, se ha detectado que en poblaciones con estructura genética (EG), la cantidad de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. La modelación estadística que incorpora información sobre la estructura genética poblacional hace más eficiente el MA. Un objetivo de esta tesis es evaluar métodos estadísticos para identificar EG, usar dicha estructura en modelos de mapeo y realizar pruebas de hipótesis sobre la significancia de la asociación marcador-carácter. Se evalúan con este fin métodos multivariados, modelos lineales mixtos (MLM) y métodos de corrección de valor-p por multiplicidad. Como criterios de evaluación se usaron errores de clasificación de métodos orientados a identificar EG, tasas de falsos positivos, potencia estadística y distribución de valores-p para distintas combinaciones de modelos de MA y métodos de corrección por multiplicidad. El uso de mapas auto-organizativos (SOM, Self-Organizing Maps) y el algoritmo del software STRUCTURE fueron los más eficientes para identificar EG. La clasificación dada por STRUCTURE usada para contemplar EGP en el modelo de MA, disminuyó la tasa de FDR (False Discovery Rate), esta disminución fue mayor cuando estas estrategias se usaron simultáneamente con la matriz de relaciones de parentesco entre individuos como matriz de covarianza del MLM de mapeo. Se propuso un método de corrección de valores-p basado en la estimación del número efectivo de pruebas (pruebas no dependientes), similar al propuesto por Li y Ji (LJ, 1995) y que se denominó MLJ (Modified Li&Ji) y resultó más efectivo para disminuir FDR que con los métodos tradicionales Benjamini & Hochberg (1995) y Li & Ji (2005), en escenarios de alta divergencia, principalmente cuando la EGP no forma parte del modelo de MA.
Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina.
Materia
Estructura genética
Modelos Lineales Mixtos
Correcciones por Multiplicidad
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/26086

id RDUUNC_a338093a86a3211eb737a85dfd802b27
oai_identifier_str oai:rdu.unc.edu.ar:11086/26086
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Aproximaciones estadísticas para el mapeo asociativo en estudios genéticosPeña Malavera, Andrea NataliaEstructura genéticaModelos Lineales MixtosCorrecciones por MultiplicidadTesis (DCI)--FCEFN-UNC, 2015Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina.El mapeo asociativo (MA) o GWAS (por sus siglas en inglés, Genome Wide Association Study) es usado para encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento vegetal, ya que posibilita el uso de poblaciones no diseñadas experimentalmente. Sin embargo, se ha detectado que en poblaciones con estructura genética (EG), la cantidad de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. La modelación estadística que incorpora información sobre la estructura genética poblacional hace más eficiente el MA. Un objetivo de esta tesis es evaluar métodos estadísticos para identificar EG, usar dicha estructura en modelos de mapeo y realizar pruebas de hipótesis sobre la significancia de la asociación marcador-carácter. Se evalúan con este fin métodos multivariados, modelos lineales mixtos (MLM) y métodos de corrección de valor-p por multiplicidad. Como criterios de evaluación se usaron errores de clasificación de métodos orientados a identificar EG, tasas de falsos positivos, potencia estadística y distribución de valores-p para distintas combinaciones de modelos de MA y métodos de corrección por multiplicidad. El uso de mapas auto-organizativos (SOM, Self-Organizing Maps) y el algoritmo del software STRUCTURE fueron los más eficientes para identificar EG. La clasificación dada por STRUCTURE usada para contemplar EGP en el modelo de MA, disminuyó la tasa de FDR (False Discovery Rate), esta disminución fue mayor cuando estas estrategias se usaron simultáneamente con la matriz de relaciones de parentesco entre individuos como matriz de covarianza del MLM de mapeo. Se propuso un método de corrección de valores-p basado en la estimación del número efectivo de pruebas (pruebas no dependientes), similar al propuesto por Li y Ji (LJ, 1995) y que se denominó MLJ (Modified Li&Ji) y resultó más efectivo para disminuir FDR que con los métodos tradicionales Benjamini & Hochberg (1995) y Li & Ji (2005), en escenarios de alta divergencia, principalmente cuando la EGP no forma parte del modelo de MA.Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina.Blazarini, Mónica2015info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttp://hdl.handle.net/11086/26086spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-29T13:41:28Zoai:rdu.unc.edu.ar:11086/26086Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:41:28.673Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos
title Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos
spellingShingle Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos
Peña Malavera, Andrea Natalia
Estructura genética
Modelos Lineales Mixtos
Correcciones por Multiplicidad
title_short Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos
title_full Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos
title_fullStr Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos
title_full_unstemmed Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos
title_sort Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos
dc.creator.none.fl_str_mv Peña Malavera, Andrea Natalia
author Peña Malavera, Andrea Natalia
author_facet Peña Malavera, Andrea Natalia
author_role author
dc.contributor.none.fl_str_mv Blazarini, Mónica
dc.subject.none.fl_str_mv Estructura genética
Modelos Lineales Mixtos
Correcciones por Multiplicidad
topic Estructura genética
Modelos Lineales Mixtos
Correcciones por Multiplicidad
dc.description.none.fl_txt_mv Tesis (DCI)--FCEFN-UNC, 2015
Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina.
El mapeo asociativo (MA) o GWAS (por sus siglas en inglés, Genome Wide Association Study) es usado para encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento vegetal, ya que posibilita el uso de poblaciones no diseñadas experimentalmente. Sin embargo, se ha detectado que en poblaciones con estructura genética (EG), la cantidad de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. La modelación estadística que incorpora información sobre la estructura genética poblacional hace más eficiente el MA. Un objetivo de esta tesis es evaluar métodos estadísticos para identificar EG, usar dicha estructura en modelos de mapeo y realizar pruebas de hipótesis sobre la significancia de la asociación marcador-carácter. Se evalúan con este fin métodos multivariados, modelos lineales mixtos (MLM) y métodos de corrección de valor-p por multiplicidad. Como criterios de evaluación se usaron errores de clasificación de métodos orientados a identificar EG, tasas de falsos positivos, potencia estadística y distribución de valores-p para distintas combinaciones de modelos de MA y métodos de corrección por multiplicidad. El uso de mapas auto-organizativos (SOM, Self-Organizing Maps) y el algoritmo del software STRUCTURE fueron los más eficientes para identificar EG. La clasificación dada por STRUCTURE usada para contemplar EGP en el modelo de MA, disminuyó la tasa de FDR (False Discovery Rate), esta disminución fue mayor cuando estas estrategias se usaron simultáneamente con la matriz de relaciones de parentesco entre individuos como matriz de covarianza del MLM de mapeo. Se propuso un método de corrección de valores-p basado en la estimación del número efectivo de pruebas (pruebas no dependientes), similar al propuesto por Li y Ji (LJ, 1995) y que se denominó MLJ (Modified Li&Ji) y resultó más efectivo para disminuir FDR que con los métodos tradicionales Benjamini & Hochberg (1995) y Li & Ji (2005), en escenarios de alta divergencia, principalmente cuando la EGP no forma parte del modelo de MA.
Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina.
description Tesis (DCI)--FCEFN-UNC, 2015
publishDate 2015
dc.date.none.fl_str_mv 2015
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/26086
url http://hdl.handle.net/11086/26086
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1844618902635544576
score 13.070432