Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos
- Autores
- Peña Malavera, Andrea Natalia
- Año de publicación
- 2015
- Idioma
- español castellano
- Tipo de recurso
- tesis doctoral
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Blazarini, Mónica
- Descripción
- Tesis (DCI)--FCEFN-UNC, 2015
Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina.
El mapeo asociativo (MA) o GWAS (por sus siglas en inglés, Genome Wide Association Study) es usado para encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento vegetal, ya que posibilita el uso de poblaciones no diseñadas experimentalmente. Sin embargo, se ha detectado que en poblaciones con estructura genética (EG), la cantidad de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. La modelación estadística que incorpora información sobre la estructura genética poblacional hace más eficiente el MA. Un objetivo de esta tesis es evaluar métodos estadísticos para identificar EG, usar dicha estructura en modelos de mapeo y realizar pruebas de hipótesis sobre la significancia de la asociación marcador-carácter. Se evalúan con este fin métodos multivariados, modelos lineales mixtos (MLM) y métodos de corrección de valor-p por multiplicidad. Como criterios de evaluación se usaron errores de clasificación de métodos orientados a identificar EG, tasas de falsos positivos, potencia estadística y distribución de valores-p para distintas combinaciones de modelos de MA y métodos de corrección por multiplicidad. El uso de mapas auto-organizativos (SOM, Self-Organizing Maps) y el algoritmo del software STRUCTURE fueron los más eficientes para identificar EG. La clasificación dada por STRUCTURE usada para contemplar EGP en el modelo de MA, disminuyó la tasa de FDR (False Discovery Rate), esta disminución fue mayor cuando estas estrategias se usaron simultáneamente con la matriz de relaciones de parentesco entre individuos como matriz de covarianza del MLM de mapeo. Se propuso un método de corrección de valores-p basado en la estimación del número efectivo de pruebas (pruebas no dependientes), similar al propuesto por Li y Ji (LJ, 1995) y que se denominó MLJ (Modified Li&Ji) y resultó más efectivo para disminuir FDR que con los métodos tradicionales Benjamini & Hochberg (1995) y Li & Ji (2005), en escenarios de alta divergencia, principalmente cuando la EGP no forma parte del modelo de MA.
Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina. - Materia
-
Estructura genética
Modelos Lineales Mixtos
Correcciones por Multiplicidad - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- Repositorio
- Institución
- Universidad Nacional de Córdoba
- OAI Identificador
- oai:rdu.unc.edu.ar:11086/26086
Ver los metadatos del registro completo
id |
RDUUNC_a338093a86a3211eb737a85dfd802b27 |
---|---|
oai_identifier_str |
oai:rdu.unc.edu.ar:11086/26086 |
network_acronym_str |
RDUUNC |
repository_id_str |
2572 |
network_name_str |
Repositorio Digital Universitario (UNC) |
spelling |
Aproximaciones estadísticas para el mapeo asociativo en estudios genéticosPeña Malavera, Andrea NataliaEstructura genéticaModelos Lineales MixtosCorrecciones por MultiplicidadTesis (DCI)--FCEFN-UNC, 2015Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina.El mapeo asociativo (MA) o GWAS (por sus siglas en inglés, Genome Wide Association Study) es usado para encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento vegetal, ya que posibilita el uso de poblaciones no diseñadas experimentalmente. Sin embargo, se ha detectado que en poblaciones con estructura genética (EG), la cantidad de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. La modelación estadística que incorpora información sobre la estructura genética poblacional hace más eficiente el MA. Un objetivo de esta tesis es evaluar métodos estadísticos para identificar EG, usar dicha estructura en modelos de mapeo y realizar pruebas de hipótesis sobre la significancia de la asociación marcador-carácter. Se evalúan con este fin métodos multivariados, modelos lineales mixtos (MLM) y métodos de corrección de valor-p por multiplicidad. Como criterios de evaluación se usaron errores de clasificación de métodos orientados a identificar EG, tasas de falsos positivos, potencia estadística y distribución de valores-p para distintas combinaciones de modelos de MA y métodos de corrección por multiplicidad. El uso de mapas auto-organizativos (SOM, Self-Organizing Maps) y el algoritmo del software STRUCTURE fueron los más eficientes para identificar EG. La clasificación dada por STRUCTURE usada para contemplar EGP en el modelo de MA, disminuyó la tasa de FDR (False Discovery Rate), esta disminución fue mayor cuando estas estrategias se usaron simultáneamente con la matriz de relaciones de parentesco entre individuos como matriz de covarianza del MLM de mapeo. Se propuso un método de corrección de valores-p basado en la estimación del número efectivo de pruebas (pruebas no dependientes), similar al propuesto por Li y Ji (LJ, 1995) y que se denominó MLJ (Modified Li&Ji) y resultó más efectivo para disminuir FDR que con los métodos tradicionales Benjamini & Hochberg (1995) y Li & Ji (2005), en escenarios de alta divergencia, principalmente cuando la EGP no forma parte del modelo de MA.Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina.Blazarini, Mónica2015info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttp://hdl.handle.net/11086/26086spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-29T13:41:28Zoai:rdu.unc.edu.ar:11086/26086Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:41:28.673Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse |
dc.title.none.fl_str_mv |
Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos |
title |
Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos |
spellingShingle |
Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos Peña Malavera, Andrea Natalia Estructura genética Modelos Lineales Mixtos Correcciones por Multiplicidad |
title_short |
Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos |
title_full |
Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos |
title_fullStr |
Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos |
title_full_unstemmed |
Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos |
title_sort |
Aproximaciones estadísticas para el mapeo asociativo en estudios genéticos |
dc.creator.none.fl_str_mv |
Peña Malavera, Andrea Natalia |
author |
Peña Malavera, Andrea Natalia |
author_facet |
Peña Malavera, Andrea Natalia |
author_role |
author |
dc.contributor.none.fl_str_mv |
Blazarini, Mónica |
dc.subject.none.fl_str_mv |
Estructura genética Modelos Lineales Mixtos Correcciones por Multiplicidad |
topic |
Estructura genética Modelos Lineales Mixtos Correcciones por Multiplicidad |
dc.description.none.fl_txt_mv |
Tesis (DCI)--FCEFN-UNC, 2015 Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina. El mapeo asociativo (MA) o GWAS (por sus siglas en inglés, Genome Wide Association Study) es usado para encontrar lugares específicos del genoma relacionados con la variación de un carácter fenotípico. Es una práctica difundida en el mejoramiento vegetal, ya que posibilita el uso de poblaciones no diseñadas experimentalmente. Sin embargo, se ha detectado que en poblaciones con estructura genética (EG), la cantidad de falsos positivos en la asociación marcador-carácter puede aumentar significativamente. La modelación estadística que incorpora información sobre la estructura genética poblacional hace más eficiente el MA. Un objetivo de esta tesis es evaluar métodos estadísticos para identificar EG, usar dicha estructura en modelos de mapeo y realizar pruebas de hipótesis sobre la significancia de la asociación marcador-carácter. Se evalúan con este fin métodos multivariados, modelos lineales mixtos (MLM) y métodos de corrección de valor-p por multiplicidad. Como criterios de evaluación se usaron errores de clasificación de métodos orientados a identificar EG, tasas de falsos positivos, potencia estadística y distribución de valores-p para distintas combinaciones de modelos de MA y métodos de corrección por multiplicidad. El uso de mapas auto-organizativos (SOM, Self-Organizing Maps) y el algoritmo del software STRUCTURE fueron los más eficientes para identificar EG. La clasificación dada por STRUCTURE usada para contemplar EGP en el modelo de MA, disminuyó la tasa de FDR (False Discovery Rate), esta disminución fue mayor cuando estas estrategias se usaron simultáneamente con la matriz de relaciones de parentesco entre individuos como matriz de covarianza del MLM de mapeo. Se propuso un método de corrección de valores-p basado en la estimación del número efectivo de pruebas (pruebas no dependientes), similar al propuesto por Li y Ji (LJ, 1995) y que se denominó MLJ (Modified Li&Ji) y resultó más efectivo para disminuir FDR que con los métodos tradicionales Benjamini & Hochberg (1995) y Li & Ji (2005), en escenarios de alta divergencia, principalmente cuando la EGP no forma parte del modelo de MA. Fil: Peña Malavera, Andrea Natalia. Universidad Nacional de Córdoba. Facultad de Ciencias Exactas, Físicas y Naturales; Argentina. |
description |
Tesis (DCI)--FCEFN-UNC, 2015 |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/doctoralThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_db06 info:ar-repo/semantics/tesisDoctoral |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11086/26086 |
url |
http://hdl.handle.net/11086/26086 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC |
reponame_str |
Repositorio Digital Universitario (UNC) |
collection |
Repositorio Digital Universitario (UNC) |
instname_str |
Universidad Nacional de Córdoba |
instacron_str |
UNC |
institution |
UNC |
repository.name.fl_str_mv |
Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba |
repository.mail.fl_str_mv |
oca.unc@gmail.com |
_version_ |
1844618902635544576 |
score |
13.070432 |