Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos

Autores
Kaufman, Bruno
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Chernomoretz, Ariel
Descripción
En el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto.
The field of computational biology makes use of enormous quantities of genetic, chemical and pharmacological information in order to find answers to questions of interest in these fields. This thesis will investigate concepts in complex network theory relevant to a structured analysis of said data. As an example of genomic application, we first explore networks resulting from a statistical mechanics-based analysis of 5’ splice sites. Through this analysis, conclusions are inferred regarding the inner workings of the splicing process, by which the genetic information stored in DNA is processed, and sections relevant to the construction of proteins (exons) are identified and separated from those to be ignored (introns). Afterwards, a network framework is used in order to characterize and consolidate data regarding the interaction between drugs and proteins, as well as their chemical and functional qualities. A procedure is established for the simultaneous use of this informa- tion, including chemical similarity data between drug molecules, known interaction data between drugs and proteins, and protein-protein relationships based on the presence of functional domains (PFAM) and evolutionary lineages in common (orthology). Finally, a network diffusion approach is used, generalizing diffusion equations to non-Euclidean space, in order to perform semi-supervised learning on this data, and thus propose new therapeutic targets for known drugs. The thesis hence explores the role of the network Laplace operator, responsible for the use of the physical concept of diffusion within a complex networks framework. Through these analyses, this thesis establishes the importance of complex networks theory in employing diverse data, es- pecially when the goal is to make use of them in tandem.
Fil: Kaufman, Bruno. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
REDES COMPLEJAS
BIOINFORMATICA
PRIORIZACION
DIFUSION
PROTEINAS
FARMACOS
COMPLEX NETWORKS
BIOINFORMATICS
PRIORITIZATION
DIFFUSION
PROTEINS
DRUGS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n7659_Kaufman

id BDUBAFCEN_59a459c913d94ecb7738c63e0b994284
oai_identifier_str tesis:tesis_n7659_Kaufman
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicosComplex networks applied to the characterization, integration and prioritization of biochemical dataKaufman, BrunoREDES COMPLEJASBIOINFORMATICAPRIORIZACIONDIFUSIONPROTEINASFARMACOSCOMPLEX NETWORKSBIOINFORMATICSPRIORITIZATIONDIFFUSIONPROTEINSDRUGSEn el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto.The field of computational biology makes use of enormous quantities of genetic, chemical and pharmacological information in order to find answers to questions of interest in these fields. This thesis will investigate concepts in complex network theory relevant to a structured analysis of said data. As an example of genomic application, we first explore networks resulting from a statistical mechanics-based analysis of 5’ splice sites. Through this analysis, conclusions are inferred regarding the inner workings of the splicing process, by which the genetic information stored in DNA is processed, and sections relevant to the construction of proteins (exons) are identified and separated from those to be ignored (introns). Afterwards, a network framework is used in order to characterize and consolidate data regarding the interaction between drugs and proteins, as well as their chemical and functional qualities. A procedure is established for the simultaneous use of this informa- tion, including chemical similarity data between drug molecules, known interaction data between drugs and proteins, and protein-protein relationships based on the presence of functional domains (PFAM) and evolutionary lineages in common (orthology). Finally, a network diffusion approach is used, generalizing diffusion equations to non-Euclidean space, in order to perform semi-supervised learning on this data, and thus propose new therapeutic targets for known drugs. The thesis hence explores the role of the network Laplace operator, responsible for the use of the physical concept of diffusion within a complex networks framework. Through these analyses, this thesis establishes the importance of complex networks theory in employing diverse data, es- pecially when the goal is to make use of them in tandem.Fil: Kaufman, Bruno. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesChernomoretz, Ariel2024-11-15info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n7659_Kaufmanspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-10-23T11:16:59Ztesis:tesis_n7659_KaufmanInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-10-23 11:17:00.405Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
Complex networks applied to the characterization, integration and prioritization of biochemical data
title Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
spellingShingle Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
Kaufman, Bruno
REDES COMPLEJAS
BIOINFORMATICA
PRIORIZACION
DIFUSION
PROTEINAS
FARMACOS
COMPLEX NETWORKS
BIOINFORMATICS
PRIORITIZATION
DIFFUSION
PROTEINS
DRUGS
title_short Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
title_full Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
title_fullStr Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
title_full_unstemmed Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
title_sort Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
dc.creator.none.fl_str_mv Kaufman, Bruno
author Kaufman, Bruno
author_facet Kaufman, Bruno
author_role author
dc.contributor.none.fl_str_mv Chernomoretz, Ariel
dc.subject.none.fl_str_mv REDES COMPLEJAS
BIOINFORMATICA
PRIORIZACION
DIFUSION
PROTEINAS
FARMACOS
COMPLEX NETWORKS
BIOINFORMATICS
PRIORITIZATION
DIFFUSION
PROTEINS
DRUGS
topic REDES COMPLEJAS
BIOINFORMATICA
PRIORIZACION
DIFUSION
PROTEINAS
FARMACOS
COMPLEX NETWORKS
BIOINFORMATICS
PRIORITIZATION
DIFFUSION
PROTEINS
DRUGS
dc.description.none.fl_txt_mv En el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto.
The field of computational biology makes use of enormous quantities of genetic, chemical and pharmacological information in order to find answers to questions of interest in these fields. This thesis will investigate concepts in complex network theory relevant to a structured analysis of said data. As an example of genomic application, we first explore networks resulting from a statistical mechanics-based analysis of 5’ splice sites. Through this analysis, conclusions are inferred regarding the inner workings of the splicing process, by which the genetic information stored in DNA is processed, and sections relevant to the construction of proteins (exons) are identified and separated from those to be ignored (introns). Afterwards, a network framework is used in order to characterize and consolidate data regarding the interaction between drugs and proteins, as well as their chemical and functional qualities. A procedure is established for the simultaneous use of this informa- tion, including chemical similarity data between drug molecules, known interaction data between drugs and proteins, and protein-protein relationships based on the presence of functional domains (PFAM) and evolutionary lineages in common (orthology). Finally, a network diffusion approach is used, generalizing diffusion equations to non-Euclidean space, in order to perform semi-supervised learning on this data, and thus propose new therapeutic targets for known drugs. The thesis hence explores the role of the network Laplace operator, responsible for the use of the physical concept of diffusion within a complex networks framework. Through these analyses, this thesis establishes the importance of complex networks theory in employing diverse data, es- pecially when the goal is to make use of them in tandem.
Fil: Kaufman, Bruno. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description En el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto.
publishDate 2024
dc.date.none.fl_str_mv 2024-11-15
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n7659_Kaufman
url https://hdl.handle.net/20.500.12110/tesis_n7659_Kaufman
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1846784852023574528
score 12.982451