Búsqueda de mecanismos regulatorios en redes biológicas usando multigrados en base de datos no relacionadas

Autores
Cardona Velásquez, Crhistian
Año de publicación
2016
Idioma
español castellano
Tipo de recurso
tesis de maestría
Estado
versión publicada
Colaborador/a o director/a de tesis
Soria, Marcelo Abel
Descripción
El análisis de redes de interacciones se aplica en forma creciente en investigación biológica. Se han reportado análisis derivados de los métodos desarrollados para análisis de redes sociales en diferentes organismos y con distintos objetivos. Para el análisis de redes biológicas se manipulan estructuras de datos en memoria que en su mayoría no están optimizadas para grandes cantidades de datos y en las cuales no es posible realizar exploración de datos conectados en red de manera ágil y flexible. Una alternativa de uso creciente para este tipo de situaciones, no solo en biología, es el uso de bases de datos no relacionales orientadas a grafos. En este trabajo investigamos el uso de bases de datos no relacionales orientadas a grafos para el análisis de datos moleculares de la bacteria Mycobacterium tuberculosis, causante de la tuberculosis humana. Específicamente utilizamos datos de experimentos que cubren diversos procesos biológicos: expresión génica, interacciones proteína - proteína e interacciones proteína - ADN. Este tipo de enfoque integrado se conoce como biología de sistemas y es un área donde el uso de bases de datos de grafos todavía está en su infancia, pero tiene enorme potencial. Para los análisis se construye un multigrafo mixto y se definen preguntas a nivel biológico que posteriormente se traducen en patrones de consultas con quasi-cliques; las consultas se implementan en dos bases de datos no relacionales orientadas a grafos: Neo4J (http://neo4j.com/) y Titan (http://thinkaurelius.github.io/titan/) haciendo uso de lenguajes de consulta tales como Cypher y Gremlin.
The Interaction Network Analysis applies increasingly in biological research. Derivatives methods have been reported developed for analysis of social networks in different organisms and different objectives. For the analysis of biological networks in memory data structures that mostly are not optimized for large amounts of data and where not possible exploration network data online swiftly and flexibly handled. An alternative scenario growing use such situations, not only in biology, is the use of non-relational graph databases. We investigated the use of non-relational graph databases oriented to analysis of molecular data of the bacterium Mycobacterium tuberculosis, which causes human tuberculosis. Specifically, we use data from experiments covering various biological processes: gene expression, protein-protein interactions and protein – DNA interactions. Such an approach known as Integrated Systems Biology and is an area where the use of bases graph databases is still in its infancy but has huge potential. For analyzes a mixed multigraph is constructed and biologically questions later translate into patterns of queries with quasi-cliques are defined; the queries are implemented in two non-relational graph databases: Neo4J (http://neo4j.com/) and Titan (http://thinkaurelius.github.io/titan/) by use query languages like Cypher and Gremlin.
Fil: Cardona Velásquez, Crhistian. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
QUASI-CLIQUE
BASE DE DATOS DE GRAFOS
MULTIGRAFO
MECANISMO REGULATORIO
MYCOBACTERIUM TUBERCULOSIS
QUASI-CLIQUE
GRAPH DATABASE
MULTIGRAPH
REGULATORY MECHANISMS
MYCOBACTERIUM TUBERCULOSIS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n6182_CardonaVelasquez

id BDUBAFCEN_22d0bb0e1372fe5e684799fc61d191a6
oai_identifier_str tesis:tesis_n6182_CardonaVelasquez
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Búsqueda de mecanismos regulatorios en redes biológicas usando multigrados en base de datos no relacionadasCardona Velásquez, CrhistianQUASI-CLIQUEBASE DE DATOS DE GRAFOSMULTIGRAFOMECANISMO REGULATORIOMYCOBACTERIUM TUBERCULOSISQUASI-CLIQUEGRAPH DATABASEMULTIGRAPHREGULATORY MECHANISMSMYCOBACTERIUM TUBERCULOSISEl análisis de redes de interacciones se aplica en forma creciente en investigación biológica. Se han reportado análisis derivados de los métodos desarrollados para análisis de redes sociales en diferentes organismos y con distintos objetivos. Para el análisis de redes biológicas se manipulan estructuras de datos en memoria que en su mayoría no están optimizadas para grandes cantidades de datos y en las cuales no es posible realizar exploración de datos conectados en red de manera ágil y flexible. Una alternativa de uso creciente para este tipo de situaciones, no solo en biología, es el uso de bases de datos no relacionales orientadas a grafos. En este trabajo investigamos el uso de bases de datos no relacionales orientadas a grafos para el análisis de datos moleculares de la bacteria Mycobacterium tuberculosis, causante de la tuberculosis humana. Específicamente utilizamos datos de experimentos que cubren diversos procesos biológicos: expresión génica, interacciones proteína - proteína e interacciones proteína - ADN. Este tipo de enfoque integrado se conoce como biología de sistemas y es un área donde el uso de bases de datos de grafos todavía está en su infancia, pero tiene enorme potencial. Para los análisis se construye un multigrafo mixto y se definen preguntas a nivel biológico que posteriormente se traducen en patrones de consultas con quasi-cliques; las consultas se implementan en dos bases de datos no relacionales orientadas a grafos: Neo4J (http://neo4j.com/) y Titan (http://thinkaurelius.github.io/titan/) haciendo uso de lenguajes de consulta tales como Cypher y Gremlin.The Interaction Network Analysis applies increasingly in biological research. Derivatives methods have been reported developed for analysis of social networks in different organisms and different objectives. For the analysis of biological networks in memory data structures that mostly are not optimized for large amounts of data and where not possible exploration network data online swiftly and flexibly handled. An alternative scenario growing use such situations, not only in biology, is the use of non-relational graph databases. We investigated the use of non-relational graph databases oriented to analysis of molecular data of the bacterium Mycobacterium tuberculosis, which causes human tuberculosis. Specifically, we use data from experiments covering various biological processes: gene expression, protein-protein interactions and protein – DNA interactions. Such an approach known as Integrated Systems Biology and is an area where the use of bases graph databases is still in its infancy but has huge potential. For analyzes a mixed multigraph is constructed and biologically questions later translate into patterns of queries with quasi-cliques are defined; the queries are implemented in two non-relational graph databases: Neo4J (http://neo4j.com/) and Titan (http://thinkaurelius.github.io/titan/) by use query languages like Cypher and Gremlin.Fil: Cardona Velásquez, Crhistian. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesSoria, Marcelo Abel2016-08-18info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n6182_CardonaVelasquezspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:41:13Ztesis:tesis_n6182_CardonaVelasquezInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:41:14.449Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Búsqueda de mecanismos regulatorios en redes biológicas usando multigrados en base de datos no relacionadas
title Búsqueda de mecanismos regulatorios en redes biológicas usando multigrados en base de datos no relacionadas
spellingShingle Búsqueda de mecanismos regulatorios en redes biológicas usando multigrados en base de datos no relacionadas
Cardona Velásquez, Crhistian
QUASI-CLIQUE
BASE DE DATOS DE GRAFOS
MULTIGRAFO
MECANISMO REGULATORIO
MYCOBACTERIUM TUBERCULOSIS
QUASI-CLIQUE
GRAPH DATABASE
MULTIGRAPH
REGULATORY MECHANISMS
MYCOBACTERIUM TUBERCULOSIS
title_short Búsqueda de mecanismos regulatorios en redes biológicas usando multigrados en base de datos no relacionadas
title_full Búsqueda de mecanismos regulatorios en redes biológicas usando multigrados en base de datos no relacionadas
title_fullStr Búsqueda de mecanismos regulatorios en redes biológicas usando multigrados en base de datos no relacionadas
title_full_unstemmed Búsqueda de mecanismos regulatorios en redes biológicas usando multigrados en base de datos no relacionadas
title_sort Búsqueda de mecanismos regulatorios en redes biológicas usando multigrados en base de datos no relacionadas
dc.creator.none.fl_str_mv Cardona Velásquez, Crhistian
author Cardona Velásquez, Crhistian
author_facet Cardona Velásquez, Crhistian
author_role author
dc.contributor.none.fl_str_mv Soria, Marcelo Abel
dc.subject.none.fl_str_mv QUASI-CLIQUE
BASE DE DATOS DE GRAFOS
MULTIGRAFO
MECANISMO REGULATORIO
MYCOBACTERIUM TUBERCULOSIS
QUASI-CLIQUE
GRAPH DATABASE
MULTIGRAPH
REGULATORY MECHANISMS
MYCOBACTERIUM TUBERCULOSIS
topic QUASI-CLIQUE
BASE DE DATOS DE GRAFOS
MULTIGRAFO
MECANISMO REGULATORIO
MYCOBACTERIUM TUBERCULOSIS
QUASI-CLIQUE
GRAPH DATABASE
MULTIGRAPH
REGULATORY MECHANISMS
MYCOBACTERIUM TUBERCULOSIS
dc.description.none.fl_txt_mv El análisis de redes de interacciones se aplica en forma creciente en investigación biológica. Se han reportado análisis derivados de los métodos desarrollados para análisis de redes sociales en diferentes organismos y con distintos objetivos. Para el análisis de redes biológicas se manipulan estructuras de datos en memoria que en su mayoría no están optimizadas para grandes cantidades de datos y en las cuales no es posible realizar exploración de datos conectados en red de manera ágil y flexible. Una alternativa de uso creciente para este tipo de situaciones, no solo en biología, es el uso de bases de datos no relacionales orientadas a grafos. En este trabajo investigamos el uso de bases de datos no relacionales orientadas a grafos para el análisis de datos moleculares de la bacteria Mycobacterium tuberculosis, causante de la tuberculosis humana. Específicamente utilizamos datos de experimentos que cubren diversos procesos biológicos: expresión génica, interacciones proteína - proteína e interacciones proteína - ADN. Este tipo de enfoque integrado se conoce como biología de sistemas y es un área donde el uso de bases de datos de grafos todavía está en su infancia, pero tiene enorme potencial. Para los análisis se construye un multigrafo mixto y se definen preguntas a nivel biológico que posteriormente se traducen en patrones de consultas con quasi-cliques; las consultas se implementan en dos bases de datos no relacionales orientadas a grafos: Neo4J (http://neo4j.com/) y Titan (http://thinkaurelius.github.io/titan/) haciendo uso de lenguajes de consulta tales como Cypher y Gremlin.
The Interaction Network Analysis applies increasingly in biological research. Derivatives methods have been reported developed for analysis of social networks in different organisms and different objectives. For the analysis of biological networks in memory data structures that mostly are not optimized for large amounts of data and where not possible exploration network data online swiftly and flexibly handled. An alternative scenario growing use such situations, not only in biology, is the use of non-relational graph databases. We investigated the use of non-relational graph databases oriented to analysis of molecular data of the bacterium Mycobacterium tuberculosis, which causes human tuberculosis. Specifically, we use data from experiments covering various biological processes: gene expression, protein-protein interactions and protein – DNA interactions. Such an approach known as Integrated Systems Biology and is an area where the use of bases graph databases is still in its infancy but has huge potential. For analyzes a mixed multigraph is constructed and biologically questions later translate into patterns of queries with quasi-cliques are defined; the queries are implemented in two non-relational graph databases: Neo4J (http://neo4j.com/) and Titan (http://thinkaurelius.github.io/titan/) by use query languages like Cypher and Gremlin.
Fil: Cardona Velásquez, Crhistian. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description El análisis de redes de interacciones se aplica en forma creciente en investigación biológica. Se han reportado análisis derivados de los métodos desarrollados para análisis de redes sociales en diferentes organismos y con distintos objetivos. Para el análisis de redes biológicas se manipulan estructuras de datos en memoria que en su mayoría no están optimizadas para grandes cantidades de datos y en las cuales no es posible realizar exploración de datos conectados en red de manera ágil y flexible. Una alternativa de uso creciente para este tipo de situaciones, no solo en biología, es el uso de bases de datos no relacionales orientadas a grafos. En este trabajo investigamos el uso de bases de datos no relacionales orientadas a grafos para el análisis de datos moleculares de la bacteria Mycobacterium tuberculosis, causante de la tuberculosis humana. Específicamente utilizamos datos de experimentos que cubren diversos procesos biológicos: expresión génica, interacciones proteína - proteína e interacciones proteína - ADN. Este tipo de enfoque integrado se conoce como biología de sistemas y es un área donde el uso de bases de datos de grafos todavía está en su infancia, pero tiene enorme potencial. Para los análisis se construye un multigrafo mixto y se definen preguntas a nivel biológico que posteriormente se traducen en patrones de consultas con quasi-cliques; las consultas se implementan en dos bases de datos no relacionales orientadas a grafos: Neo4J (http://neo4j.com/) y Titan (http://thinkaurelius.github.io/titan/) haciendo uso de lenguajes de consulta tales como Cypher y Gremlin.
publishDate 2016
dc.date.none.fl_str_mv 2016-08-18
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_bdcc
info:ar-repo/semantics/tesisDeMaestria
format masterThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n6182_CardonaVelasquez
url https://hdl.handle.net/20.500.12110/tesis_n6182_CardonaVelasquez
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618702776958976
score 13.070432