Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos

Autores: Videla, María Eugenia
Año de publicación: 2021
Idioma: español castellano
Tipo de recurso: tesis de maestría
Estado: versión publicada
Colaborador/a o director/a de tesis: Bruno, Cecilia Inés
Descripción: Tesis (Maestría en Estadística Aplicada) -- Universidad Nacional de Córdoba. Facultad de Ciencias Económicas. Escuela de Graduados ; Argentina, 2021.
Fil: Videla, María Eugenia. Universidad Nacional de Córdoba. Facultad de Ciencias Económicas; Argentina.
La disponibilidad de herramientas basadas en biotecnologías para evaluar miles de variantes genómicas simultáneamente ha revolucionado el paradigma en los estudios de diversidad genética. La información provista por los marcadores moleculares (MM) proporciona datos de naturaleza multivariada que pueden ser utilizados para identificar similitudes/diferencias genéticas entre individuos. Dado un conjunto de individuos caracterizados molecularmente, se espera que aquellos que presentan mayor similitud en su perfil genético, se encuentren relacionados, en algún grado de parentesco y por lo tanto, puedan agruparse definiendo poblaciones o grupos genéticos. Una plétora de métodos multivariados, para identificar grupos de individuos, ha sido propuesta para abordar la clasificación en un volumen masivo de MM, entre ellos, el análisis de conglomerados. A pesar de la existencia de diferentes algoritmos de clasificación, la cantidad de grupos sugeridos puede ser difusa. Dado a que los algoritmos definen grupos que no son conocidos a priori, independientemente del método de agrupamiento, la partición final de los datos requiere alguna clase de evaluación para encontrar el número óptimo de grupos que resulta ser la mejor partición natural de los datos. El objetivo del presente trabajo de tesis es evaluar el desempeño de distintos métodos de agrupamiento e índices de validación del número de grupo para detectar las correlaciones genéticas existentes entre individuos bajo distintos escenarios de estructura genética poblacional. Este trabajo de tesis ha sido organizado con una introducción general en el contexto de la descripción de los datos genómicos y el concepto de estructuración de lo mismos en el Capítulo 1. En el Capítulo 2 se compara el comportamiento de tres métodos de agrupamiento provenientes de diferentes familias de algoritmos a través de un estudio de simulación. En el Capítulo 3 la identificación del número óptimo de grupos generados por algoritmos de agrupamientos fue evaluada a través de la comparación de cuatro índices de validación. Finalmente, se ilustran, en el Capítulo 4, los métodos comparados sobre dos conjuntos de datos de maíz generados a partir de ensayos en el marco de programas de mejoramiento genético vegetal. Finalmente, hemos dispuesto en un Anexo los códigos de programación en R.
Fil: Videla, María Eugenia. Universidad Nacional de Córdoba. Facultad de Ciencias Económicas; Argentina.
Materia: Genómica estadística
Algoritmos
Marcadores moleculares
Análisis multivariado
Ordenamiento
Clasificación
Indices de validación de agrupamientos
SNPs
Nivel de accesibilidad: acceso abierto
Condiciones de uso
Repositorio
Institución: Universidad Nacional de Córdoba
OAI Identificador: oai:rdu.unc.edu.ar:11086/20184

Acceder

id	RDUUNC_cff15b316b07b0fc526e10539eb6ae06
oai_identifier_str	oai:rdu.unc.edu.ar:11086/20184
network_acronym_str	RDUUNC
repository_id_str	2572
network_name_str	Repositorio Digital Universitario (UNC)
spelling	Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicosVidela, María EugeniaGenómica estadísticaAlgoritmosMarcadores molecularesAnálisis multivariadoOrdenamientoClasificaciónIndices de validación de agrupamientosSNPsTesis (Maestría en Estadística Aplicada) -- Universidad Nacional de Córdoba. Facultad de Ciencias Económicas. Escuela de Graduados ; Argentina, 2021.Fil: Videla, María Eugenia. Universidad Nacional de Córdoba. Facultad de Ciencias Económicas; Argentina.La disponibilidad de herramientas basadas en biotecnologías para evaluar miles de variantes genómicas simultáneamente ha revolucionado el paradigma en los estudios de diversidad genética. La información provista por los marcadores moleculares (MM) proporciona datos de naturaleza multivariada que pueden ser utilizados para identificar similitudes/diferencias genéticas entre individuos. Dado un conjunto de individuos caracterizados molecularmente, se espera que aquellos que presentan mayor similitud en su perfil genético, se encuentren relacionados, en algún grado de parentesco y por lo tanto, puedan agruparse definiendo poblaciones o grupos genéticos. Una plétora de métodos multivariados, para identificar grupos de individuos, ha sido propuesta para abordar la clasificación en un volumen masivo de MM, entre ellos, el análisis de conglomerados. A pesar de la existencia de diferentes algoritmos de clasificación, la cantidad de grupos sugeridos puede ser difusa. Dado a que los algoritmos definen grupos que no son conocidos a priori, independientemente del método de agrupamiento, la partición final de los datos requiere alguna clase de evaluación para encontrar el número óptimo de grupos que resulta ser la mejor partición natural de los datos. El objetivo del presente trabajo de tesis es evaluar el desempeño de distintos métodos de agrupamiento e índices de validación del número de grupo para detectar las correlaciones genéticas existentes entre individuos bajo distintos escenarios de estructura genética poblacional. Este trabajo de tesis ha sido organizado con una introducción general en el contexto de la descripción de los datos genómicos y el concepto de estructuración de lo mismos en el Capítulo 1. En el Capítulo 2 se compara el comportamiento de tres métodos de agrupamiento provenientes de diferentes familias de algoritmos a través de un estudio de simulación. En el Capítulo 3 la identificación del número óptimo de grupos generados por algoritmos de agrupamientos fue evaluada a través de la comparación de cuatro índices de validación. Finalmente, se ilustran, en el Capítulo 4, los métodos comparados sobre dos conjuntos de datos de maíz generados a partir de ensayos en el marco de programas de mejoramiento genético vegetal. Finalmente, hemos dispuesto en un Anexo los códigos de programación en R.Fil: Videla, María Eugenia. Universidad Nacional de Córdoba. Facultad de Ciencias Económicas; Argentina.Bruno, Cecilia Inés2021info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttp://hdl.handle.net/11086/20184spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2026-02-12T12:14:31Zoai:rdu.unc.edu.ar:11086/20184Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722026-02-12 12:14:32.159Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv	Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos
title	Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos
spellingShingle	Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos Videla, María Eugenia Genómica estadística Algoritmos Marcadores moleculares Análisis multivariado Ordenamiento Clasificación Indices de validación de agrupamientos SNPs
title_short	Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos
title_full	Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos
title_fullStr	Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos
title_full_unstemmed	Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos
title_sort	Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos
dc.creator.none.fl_str_mv	Videla, María Eugenia
author	Videla, María Eugenia
author_facet	Videla, María Eugenia
author_role	author
dc.contributor.none.fl_str_mv	Bruno, Cecilia Inés
dc.subject.none.fl_str_mv	Genómica estadística Algoritmos Marcadores moleculares Análisis multivariado Ordenamiento Clasificación Indices de validación de agrupamientos SNPs
topic	Genómica estadística Algoritmos Marcadores moleculares Análisis multivariado Ordenamiento Clasificación Indices de validación de agrupamientos SNPs
dc.description.none.fl_txt_mv	Tesis (Maestría en Estadística Aplicada) -- Universidad Nacional de Córdoba. Facultad de Ciencias Económicas. Escuela de Graduados ; Argentina, 2021. Fil: Videla, María Eugenia. Universidad Nacional de Córdoba. Facultad de Ciencias Económicas; Argentina. La disponibilidad de herramientas basadas en biotecnologías para evaluar miles de variantes genómicas simultáneamente ha revolucionado el paradigma en los estudios de diversidad genética. La información provista por los marcadores moleculares (MM) proporciona datos de naturaleza multivariada que pueden ser utilizados para identificar similitudes/diferencias genéticas entre individuos. Dado un conjunto de individuos caracterizados molecularmente, se espera que aquellos que presentan mayor similitud en su perfil genético, se encuentren relacionados, en algún grado de parentesco y por lo tanto, puedan agruparse definiendo poblaciones o grupos genéticos. Una plétora de métodos multivariados, para identificar grupos de individuos, ha sido propuesta para abordar la clasificación en un volumen masivo de MM, entre ellos, el análisis de conglomerados. A pesar de la existencia de diferentes algoritmos de clasificación, la cantidad de grupos sugeridos puede ser difusa. Dado a que los algoritmos definen grupos que no son conocidos a priori, independientemente del método de agrupamiento, la partición final de los datos requiere alguna clase de evaluación para encontrar el número óptimo de grupos que resulta ser la mejor partición natural de los datos. El objetivo del presente trabajo de tesis es evaluar el desempeño de distintos métodos de agrupamiento e índices de validación del número de grupo para detectar las correlaciones genéticas existentes entre individuos bajo distintos escenarios de estructura genética poblacional. Este trabajo de tesis ha sido organizado con una introducción general en el contexto de la descripción de los datos genómicos y el concepto de estructuración de lo mismos en el Capítulo 1. En el Capítulo 2 se compara el comportamiento de tres métodos de agrupamiento provenientes de diferentes familias de algoritmos a través de un estudio de simulación. En el Capítulo 3 la identificación del número óptimo de grupos generados por algoritmos de agrupamientos fue evaluada a través de la comparación de cuatro índices de validación. Finalmente, se ilustran, en el Capítulo 4, los métodos comparados sobre dos conjuntos de datos de maíz generados a partir de ensayos en el marco de programas de mejoramiento genético vegetal. Finalmente, hemos dispuesto en un Anexo los códigos de programación en R. Fil: Videla, María Eugenia. Universidad Nacional de Córdoba. Facultad de Ciencias Económicas; Argentina.
description	Tesis (Maestría en Estadística Aplicada) -- Universidad Nacional de Córdoba. Facultad de Ciencias Económicas. Escuela de Graduados ; Argentina, 2021.
publishDate	2021
dc.date.none.fl_str_mv	2021
dc.type.none.fl_str_mv	info:eu-repo/semantics/masterThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_bdcc info:ar-repo/semantics/tesisDeMaestria
format	masterThesis
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://hdl.handle.net/11086/20184
url	http://hdl.handle.net/11086/20184
dc.language.none.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC
reponame_str	Repositorio Digital Universitario (UNC)
collection	Repositorio Digital Universitario (UNC)
instname_str	Universidad Nacional de Córdoba
instacron_str	UNC
institution	UNC
repository.name.fl_str_mv	Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv	oca.unc@gmail.com
_version_	1856934916614258689
score	12.930639

Evaluación de algoritmos de agrupamientos para inferir estructura genética poblacional en datos genómicos

Publicaciones similares