Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos

Autores: Kaufman, Bruno
Año de publicación: 2024
Idioma: español castellano
Tipo de recurso: tesis doctoral
Estado: versión publicada
Colaborador/a o director/a de tesis: Chernomoretz, Ariel
Descripción: En el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto.
The field of computational biology makes use of enormous quantities of genetic, chemical and pharmacological information in order to find answers to questions of interest in these fields. This thesis will investigate concepts in complex network theory relevant to a structured analysis of said data. As an example of genomic application, we first explore networks resulting from a statistical mechanics-based analysis of 5’ splice sites. Through this analysis, conclusions are inferred regarding the inner workings of the splicing process, by which the genetic information stored in DNA is processed, and sections relevant to the construction of proteins (exons) are identified and separated from those to be ignored (introns). Afterwards, a network framework is used in order to characterize and consolidate data regarding the interaction between drugs and proteins, as well as their chemical and functional qualities. A procedure is established for the simultaneous use of this informa- tion, including chemical similarity data between drug molecules, known interaction data between drugs and proteins, and protein-protein relationships based on the presence of functional domains (PFAM) and evolutionary lineages in common (orthology). Finally, a network diffusion approach is used, generalizing diffusion equations to non-Euclidean space, in order to perform semi-supervised learning on this data, and thus propose new therapeutic targets for known drugs. The thesis hence explores the role of the network Laplace operator, responsible for the use of the physical concept of diffusion within a complex networks framework. Through these analyses, this thesis establishes the importance of complex networks theory in employing diverse data, es- pecially when the goal is to make use of them in tandem.
Fil: Kaufman, Bruno. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia: REDES COMPLEJAS
BIOINFORMATICA
PRIORIZACION
DIFUSION
PROTEINAS
FARMACOS
COMPLEX NETWORKS
BIOINFORMATICS
PRIORITIZATION
DIFFUSION
PROTEINS
DRUGS
Nivel de accesibilidad: acceso abierto
Condiciones de uso: https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Institución: Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador: tesis:tesis_n7659_Kaufman

Acceder

id	BDUBAFCEN_59a459c913d94ecb7738c63e0b994284
oai_identifier_str	tesis:tesis_n7659_Kaufman
network_acronym_str	BDUBAFCEN
repository_id_str	1896
network_name_str	Biblioteca Digital (UBA-FCEN)
spelling	Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicosComplex networks applied to the characterization, integration and prioritization of biochemical dataKaufman, BrunoREDES COMPLEJASBIOINFORMATICAPRIORIZACIONDIFUSIONPROTEINASFARMACOSCOMPLEX NETWORKSBIOINFORMATICSPRIORITIZATIONDIFFUSIONPROTEINSDRUGSEn el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto.The field of computational biology makes use of enormous quantities of genetic, chemical and pharmacological information in order to find answers to questions of interest in these fields. This thesis will investigate concepts in complex network theory relevant to a structured analysis of said data. As an example of genomic application, we first explore networks resulting from a statistical mechanics-based analysis of 5’ splice sites. Through this analysis, conclusions are inferred regarding the inner workings of the splicing process, by which the genetic information stored in DNA is processed, and sections relevant to the construction of proteins (exons) are identified and separated from those to be ignored (introns). Afterwards, a network framework is used in order to characterize and consolidate data regarding the interaction between drugs and proteins, as well as their chemical and functional qualities. A procedure is established for the simultaneous use of this informa- tion, including chemical similarity data between drug molecules, known interaction data between drugs and proteins, and protein-protein relationships based on the presence of functional domains (PFAM) and evolutionary lineages in common (orthology). Finally, a network diffusion approach is used, generalizing diffusion equations to non-Euclidean space, in order to perform semi-supervised learning on this data, and thus propose new therapeutic targets for known drugs. The thesis hence explores the role of the network Laplace operator, responsible for the use of the physical concept of diffusion within a complex networks framework. Through these analyses, this thesis establishes the importance of complex networks theory in employing diverse data, es- pecially when the goal is to make use of them in tandem.Fil: Kaufman, Bruno. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesChernomoretz, Ariel2024-11-15info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n7659_Kaufmanspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2026-02-12T12:16:38Ztesis:tesis_n7659_KaufmanInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962026-02-12 12:16:40.075Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv	Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos Complex networks applied to the characterization, integration and prioritization of biochemical data
title	Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
spellingShingle	Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos Kaufman, Bruno REDES COMPLEJAS BIOINFORMATICA PRIORIZACION DIFUSION PROTEINAS FARMACOS COMPLEX NETWORKS BIOINFORMATICS PRIORITIZATION DIFFUSION PROTEINS DRUGS
title_short	Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
title_full	Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
title_fullStr	Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
title_full_unstemmed	Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
title_sort	Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
dc.creator.none.fl_str_mv	Kaufman, Bruno
author	Kaufman, Bruno
author_facet	Kaufman, Bruno
author_role	author
dc.contributor.none.fl_str_mv	Chernomoretz, Ariel
dc.subject.none.fl_str_mv	REDES COMPLEJAS BIOINFORMATICA PRIORIZACION DIFUSION PROTEINAS FARMACOS COMPLEX NETWORKS BIOINFORMATICS PRIORITIZATION DIFFUSION PROTEINS DRUGS
topic	REDES COMPLEJAS BIOINFORMATICA PRIORIZACION DIFUSION PROTEINAS FARMACOS COMPLEX NETWORKS BIOINFORMATICS PRIORITIZATION DIFFUSION PROTEINS DRUGS
dc.description.none.fl_txt_mv	En el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto. The field of computational biology makes use of enormous quantities of genetic, chemical and pharmacological information in order to find answers to questions of interest in these fields. This thesis will investigate concepts in complex network theory relevant to a structured analysis of said data. As an example of genomic application, we first explore networks resulting from a statistical mechanics-based analysis of 5’ splice sites. Through this analysis, conclusions are inferred regarding the inner workings of the splicing process, by which the genetic information stored in DNA is processed, and sections relevant to the construction of proteins (exons) are identified and separated from those to be ignored (introns). Afterwards, a network framework is used in order to characterize and consolidate data regarding the interaction between drugs and proteins, as well as their chemical and functional qualities. A procedure is established for the simultaneous use of this informa- tion, including chemical similarity data between drug molecules, known interaction data between drugs and proteins, and protein-protein relationships based on the presence of functional domains (PFAM) and evolutionary lineages in common (orthology). Finally, a network diffusion approach is used, generalizing diffusion equations to non-Euclidean space, in order to perform semi-supervised learning on this data, and thus propose new therapeutic targets for known drugs. The thesis hence explores the role of the network Laplace operator, responsible for the use of the physical concept of diffusion within a complex networks framework. Through these analyses, this thesis establishes the importance of complex networks theory in employing diverse data, es- pecially when the goal is to make use of them in tandem. Fil: Kaufman, Bruno. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description	En el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto.
publishDate	2024
dc.date.none.fl_str_mv	2024-11-15
dc.type.none.fl_str_mv	info:eu-repo/semantics/doctoralThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_db06 info:ar-repo/semantics/tesisDoctoral
format	doctoralThesis
status_str	publishedVersion
dc.identifier.none.fl_str_mv	https://hdl.handle.net/20.500.12110/tesis_n7659_Kaufman
url	https://hdl.handle.net/20.500.12110/tesis_n7659_Kaufman
dc.language.none.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv	openAccess
rights_invalid_str_mv	https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv	reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN
reponame_str	Biblioteca Digital (UBA-FCEN)
collection	Biblioteca Digital (UBA-FCEN)
instname_str	Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str	UBA-FCEN
institution	UBA-FCEN
repository.name.fl_str_mv	Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv	ana@bl.fcen.uba.ar
_version_	1856934716554346496
score	12.930639

Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos

Publicaciones similares