Análisis e integración de información de datos biológicos mediante análisis funcional

Autores
Rodríguez, Juan Cruz
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Fernández, Elmer Andrés
Descripción
Tesis (Doctor en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
Rodríguez, Juan Cruz. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
El análisis funcional refiere a un conjunto de técnicas que tienen como fin detectar aquellas funciones o procesos que se encuentran desregulados en un experimento biológico. Con el continuo avance en las tecnologías de obtención de expresión de muestras biológicas, la cantidad de bases de datos de libre disponibilidad aumenta constantemente. Las técnicas de análisis funcional se basan en el estudio de un único experimento, en la era del Big Data resulta natural notar la necesidad de explotar esta gran cantidad de bases de datos para su integración, y así, generar nuevas fuentes de información. Esta tesis propone, como objetivo principal, brindar una metodología que permita integrar grandes cantidades de bases de datos de expresión biológica. Integrando información de diversas poblaciones, fenotipos, enfermedades, entre otros, se podrá detectar patrones que caractericen cada grupo. Como primera instancia de tesis, se realizó una comparación exhaustiva de diversas alternativas para llevar a cabo el análisis funcional. Con tantas alternativas existentes, que siguen diversos supuestos e ideas, esta evaluación nos llevó a la creación del pipeline de Análisis Funcional Integrador: IFA. El IFA realiza su análisis tomando alternativas que otorgaron los mejores resultados desde un punto de vista biológico y estadístico. Para cumplir con el objetivo principal de esta tesis, presentamos la herramienta MIGSA (Massive and Integrative Gene Set Analysis). Gracias a esta herramienta, es ahora posible llevar a cabo un análisis funcional masivo e integrador de grandes cantidades de bases de datos biológicas que provienen tanto de distintas poblaciones como de distintas fuentes biológicas (genes, proteínas, entre otras). Además, MIGSA provee diversas herramientas que permiten explorar y visualizar fácilmente los resultados, y de esta manera, validar y generar nuevas hipótesis de estudio. La utilidad de nuestra herramienta fue comprobada ya que permitió, para sub-grupos de cáncer de mama -con pronósticos bien distintivos-, detectar genes y procesos biológicos que los caracterizan. MIGSA representa una herramienta que permite detectar efectivamente aspectos biológicos que podrían ser blancos de drogas, y así contrarrestar la condición bajo estudio.
Functional analysis refers to a set of techniques aimed at detecting those functions or processes that are deregulated in a biological experiment. With the continuous advances in technologies for obtaining the expression of biological samples, the number of freely available databases is constantly increasing. Functional analysis techniques are based on the study of a single experiment, in the era of Big Data, it is natural to notice the need to exploit this large amount of databases for integration, and thus generate new sources of information. This thesis proposes, as the main objective, to provide a methodology to integrate large amounts of databases of biological expression. Integrating information of diverse populations, phenotypes, diseases, among others, it will be possible to detect patterns that characterize each group. As the first instance of the thesis, an exhaustive comparison of diverse alternatives was made to carry out the functional analysis. With so many existing alternatives that follow different assumptions and ideas, this evaluation led to the creation of the Integrating Functional Analysis pipeline: IFA. The IFA carries out its analysis taking alternatives that gave the best results from a biological and statistical point of view. In order to fulfill the main objective of this thesis, we present the tool MIGSA (Massive and Integrative Gene Set Analysis). Thanks to this tool, it is now possible to carry out a massive and integrative functional analysis of large quantities of biological databases that come from different populations as well as from different biological sources (genes, proteins, among others). In addition, MIGSA provides several tools that allow to easily explore and visualize the results, and in this way, validate and generate new study hypotheses. The usefulness of our tool was proved since it allowed, for subgroups of breast cancer -with very distinctive prognoses-, to detect genes and biological processes that characterize them. MIGSA represents a tool that allows us to effectively detect biological aspects that could be drug targets, and thus counteract the condition under study.
info:eu-repo/semantics/publishedVersion
Rodríguez, Juan Cruz. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia
Minería de datos
Ciencia de datos
Integración de información
Bioinformática
Computational biology
Bioinformatics
Life and medical sciences
Applied computing
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/14277

id RDUUNC_9cfb8293bccd5636bc3cf7acb8c6b8b3
oai_identifier_str oai:rdu.unc.edu.ar:11086/14277
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Análisis e integración de información de datos biológicos mediante análisis funcionalRodríguez, Juan CruzMinería de datosCiencia de datosIntegración de informaciónBioinformáticaComputational biologyBioinformaticsLife and medical sciencesApplied computingTesis (Doctor en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.Rodríguez, Juan Cruz. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.El análisis funcional refiere a un conjunto de técnicas que tienen como fin detectar aquellas funciones o procesos que se encuentran desregulados en un experimento biológico. Con el continuo avance en las tecnologías de obtención de expresión de muestras biológicas, la cantidad de bases de datos de libre disponibilidad aumenta constantemente. Las técnicas de análisis funcional se basan en el estudio de un único experimento, en la era del Big Data resulta natural notar la necesidad de explotar esta gran cantidad de bases de datos para su integración, y así, generar nuevas fuentes de información. Esta tesis propone, como objetivo principal, brindar una metodología que permita integrar grandes cantidades de bases de datos de expresión biológica. Integrando información de diversas poblaciones, fenotipos, enfermedades, entre otros, se podrá detectar patrones que caractericen cada grupo. Como primera instancia de tesis, se realizó una comparación exhaustiva de diversas alternativas para llevar a cabo el análisis funcional. Con tantas alternativas existentes, que siguen diversos supuestos e ideas, esta evaluación nos llevó a la creación del pipeline de Análisis Funcional Integrador: IFA. El IFA realiza su análisis tomando alternativas que otorgaron los mejores resultados desde un punto de vista biológico y estadístico. Para cumplir con el objetivo principal de esta tesis, presentamos la herramienta MIGSA (Massive and Integrative Gene Set Analysis). Gracias a esta herramienta, es ahora posible llevar a cabo un análisis funcional masivo e integrador de grandes cantidades de bases de datos biológicas que provienen tanto de distintas poblaciones como de distintas fuentes biológicas (genes, proteínas, entre otras). Además, MIGSA provee diversas herramientas que permiten explorar y visualizar fácilmente los resultados, y de esta manera, validar y generar nuevas hipótesis de estudio. La utilidad de nuestra herramienta fue comprobada ya que permitió, para sub-grupos de cáncer de mama -con pronósticos bien distintivos-, detectar genes y procesos biológicos que los caracterizan. MIGSA representa una herramienta que permite detectar efectivamente aspectos biológicos que podrían ser blancos de drogas, y así contrarrestar la condición bajo estudio.Functional analysis refers to a set of techniques aimed at detecting those functions or processes that are deregulated in a biological experiment. With the continuous advances in technologies for obtaining the expression of biological samples, the number of freely available databases is constantly increasing. Functional analysis techniques are based on the study of a single experiment, in the era of Big Data, it is natural to notice the need to exploit this large amount of databases for integration, and thus generate new sources of information. This thesis proposes, as the main objective, to provide a methodology to integrate large amounts of databases of biological expression. Integrating information of diverse populations, phenotypes, diseases, among others, it will be possible to detect patterns that characterize each group. As the first instance of the thesis, an exhaustive comparison of diverse alternatives was made to carry out the functional analysis. With so many existing alternatives that follow different assumptions and ideas, this evaluation led to the creation of the Integrating Functional Analysis pipeline: IFA. The IFA carries out its analysis taking alternatives that gave the best results from a biological and statistical point of view. In order to fulfill the main objective of this thesis, we present the tool MIGSA (Massive and Integrative Gene Set Analysis). Thanks to this tool, it is now possible to carry out a massive and integrative functional analysis of large quantities of biological databases that come from different populations as well as from different biological sources (genes, proteins, among others). In addition, MIGSA provides several tools that allow to easily explore and visualize the results, and in this way, validate and generate new study hypotheses. The usefulness of our tool was proved since it allowed, for subgroups of breast cancer -with very distinctive prognoses-, to detect genes and biological processes that characterize them. MIGSA represents a tool that allows us to effectively detect biological aspects that could be drug targets, and thus counteract the condition under study.info:eu-repo/semantics/publishedVersionRodríguez, Juan Cruz. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Fernández, Elmer Andrés2019-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttp://hdl.handle.net/11086/14277spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-29T13:43:22Zoai:rdu.unc.edu.ar:11086/14277Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:43:22.554Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Análisis e integración de información de datos biológicos mediante análisis funcional
title Análisis e integración de información de datos biológicos mediante análisis funcional
spellingShingle Análisis e integración de información de datos biológicos mediante análisis funcional
Rodríguez, Juan Cruz
Minería de datos
Ciencia de datos
Integración de información
Bioinformática
Computational biology
Bioinformatics
Life and medical sciences
Applied computing
title_short Análisis e integración de información de datos biológicos mediante análisis funcional
title_full Análisis e integración de información de datos biológicos mediante análisis funcional
title_fullStr Análisis e integración de información de datos biológicos mediante análisis funcional
title_full_unstemmed Análisis e integración de información de datos biológicos mediante análisis funcional
title_sort Análisis e integración de información de datos biológicos mediante análisis funcional
dc.creator.none.fl_str_mv Rodríguez, Juan Cruz
author Rodríguez, Juan Cruz
author_facet Rodríguez, Juan Cruz
author_role author
dc.contributor.none.fl_str_mv Fernández, Elmer Andrés
dc.subject.none.fl_str_mv Minería de datos
Ciencia de datos
Integración de información
Bioinformática
Computational biology
Bioinformatics
Life and medical sciences
Applied computing
topic Minería de datos
Ciencia de datos
Integración de información
Bioinformática
Computational biology
Bioinformatics
Life and medical sciences
Applied computing
dc.description.none.fl_txt_mv Tesis (Doctor en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
Rodríguez, Juan Cruz. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
El análisis funcional refiere a un conjunto de técnicas que tienen como fin detectar aquellas funciones o procesos que se encuentran desregulados en un experimento biológico. Con el continuo avance en las tecnologías de obtención de expresión de muestras biológicas, la cantidad de bases de datos de libre disponibilidad aumenta constantemente. Las técnicas de análisis funcional se basan en el estudio de un único experimento, en la era del Big Data resulta natural notar la necesidad de explotar esta gran cantidad de bases de datos para su integración, y así, generar nuevas fuentes de información. Esta tesis propone, como objetivo principal, brindar una metodología que permita integrar grandes cantidades de bases de datos de expresión biológica. Integrando información de diversas poblaciones, fenotipos, enfermedades, entre otros, se podrá detectar patrones que caractericen cada grupo. Como primera instancia de tesis, se realizó una comparación exhaustiva de diversas alternativas para llevar a cabo el análisis funcional. Con tantas alternativas existentes, que siguen diversos supuestos e ideas, esta evaluación nos llevó a la creación del pipeline de Análisis Funcional Integrador: IFA. El IFA realiza su análisis tomando alternativas que otorgaron los mejores resultados desde un punto de vista biológico y estadístico. Para cumplir con el objetivo principal de esta tesis, presentamos la herramienta MIGSA (Massive and Integrative Gene Set Analysis). Gracias a esta herramienta, es ahora posible llevar a cabo un análisis funcional masivo e integrador de grandes cantidades de bases de datos biológicas que provienen tanto de distintas poblaciones como de distintas fuentes biológicas (genes, proteínas, entre otras). Además, MIGSA provee diversas herramientas que permiten explorar y visualizar fácilmente los resultados, y de esta manera, validar y generar nuevas hipótesis de estudio. La utilidad de nuestra herramienta fue comprobada ya que permitió, para sub-grupos de cáncer de mama -con pronósticos bien distintivos-, detectar genes y procesos biológicos que los caracterizan. MIGSA representa una herramienta que permite detectar efectivamente aspectos biológicos que podrían ser blancos de drogas, y así contrarrestar la condición bajo estudio.
Functional analysis refers to a set of techniques aimed at detecting those functions or processes that are deregulated in a biological experiment. With the continuous advances in technologies for obtaining the expression of biological samples, the number of freely available databases is constantly increasing. Functional analysis techniques are based on the study of a single experiment, in the era of Big Data, it is natural to notice the need to exploit this large amount of databases for integration, and thus generate new sources of information. This thesis proposes, as the main objective, to provide a methodology to integrate large amounts of databases of biological expression. Integrating information of diverse populations, phenotypes, diseases, among others, it will be possible to detect patterns that characterize each group. As the first instance of the thesis, an exhaustive comparison of diverse alternatives was made to carry out the functional analysis. With so many existing alternatives that follow different assumptions and ideas, this evaluation led to the creation of the Integrating Functional Analysis pipeline: IFA. The IFA carries out its analysis taking alternatives that gave the best results from a biological and statistical point of view. In order to fulfill the main objective of this thesis, we present the tool MIGSA (Massive and Integrative Gene Set Analysis). Thanks to this tool, it is now possible to carry out a massive and integrative functional analysis of large quantities of biological databases that come from different populations as well as from different biological sources (genes, proteins, among others). In addition, MIGSA provides several tools that allow to easily explore and visualize the results, and in this way, validate and generate new study hypotheses. The usefulness of our tool was proved since it allowed, for subgroups of breast cancer -with very distinctive prognoses-, to detect genes and biological processes that characterize them. MIGSA represents a tool that allows us to effectively detect biological aspects that could be drug targets, and thus counteract the condition under study.
info:eu-repo/semantics/publishedVersion
Rodríguez, Juan Cruz. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description Tesis (Doctor en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
publishDate 2019
dc.date.none.fl_str_mv 2019-09
dc.type.none.fl_str_mv info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/doctoralThesis
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
status_str publishedVersion
format doctoralThesis
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/14277
url http://hdl.handle.net/11086/14277
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1844618954022060032
score 13.070432