Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos
- Autores
- Kaufman, Bruno
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- tesis doctoral
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Chernomoretz, Ariel
- Descripción
- En el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto.
The field of computational biology makes use of enormous quantities of genetic, chemical and pharmacological information in order to find answers to questions of interest in these fields. This thesis will investigate concepts in complex network theory relevant to a structured analysis of said data. As an example of genomic application, we first explore networks resulting from a statistical mechanics-based analysis of 5’ splice sites. Through this analysis, conclusions are inferred regarding the inner workings of the splicing process, by which the genetic information stored in DNA is processed, and sections relevant to the construction of proteins (exons) are identified and separated from those to be ignored (introns). Afterwards, a network framework is used in order to characterize and consolidate data regarding the interaction between drugs and proteins, as well as their chemical and functional qualities. A procedure is established for the simultaneous use of this informa- tion, including chemical similarity data between drug molecules, known interaction data between drugs and proteins, and protein-protein relationships based on the presence of functional domains (PFAM) and evolutionary lineages in common (orthology). Finally, a network diffusion approach is used, generalizing diffusion equations to non-Euclidean space, in order to perform semi-supervised learning on this data, and thus propose new therapeutic targets for known drugs. The thesis hence explores the role of the network Laplace operator, responsible for the use of the physical concept of diffusion within a complex networks framework. Through these analyses, this thesis establishes the importance of complex networks theory in employing diverse data, es- pecially when the goal is to make use of them in tandem.
Fil: Kaufman, Bruno. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
REDES COMPLEJAS
BIOINFORMATICA
PRIORIZACION
DIFUSION
PROTEINAS
FARMACOS
COMPLEX NETWORKS
BIOINFORMATICS
PRIORITIZATION
DIFFUSION
PROTEINS
DRUGS - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
.jpg)
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- tesis:tesis_n7659_Kaufman
Ver los metadatos del registro completo
| id |
BDUBAFCEN_59a459c913d94ecb7738c63e0b994284 |
|---|---|
| oai_identifier_str |
tesis:tesis_n7659_Kaufman |
| network_acronym_str |
BDUBAFCEN |
| repository_id_str |
1896 |
| network_name_str |
Biblioteca Digital (UBA-FCEN) |
| spelling |
Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicosComplex networks applied to the characterization, integration and prioritization of biochemical dataKaufman, BrunoREDES COMPLEJASBIOINFORMATICAPRIORIZACIONDIFUSIONPROTEINASFARMACOSCOMPLEX NETWORKSBIOINFORMATICSPRIORITIZATIONDIFFUSIONPROTEINSDRUGSEn el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto.The field of computational biology makes use of enormous quantities of genetic, chemical and pharmacological information in order to find answers to questions of interest in these fields. This thesis will investigate concepts in complex network theory relevant to a structured analysis of said data. As an example of genomic application, we first explore networks resulting from a statistical mechanics-based analysis of 5’ splice sites. Through this analysis, conclusions are inferred regarding the inner workings of the splicing process, by which the genetic information stored in DNA is processed, and sections relevant to the construction of proteins (exons) are identified and separated from those to be ignored (introns). Afterwards, a network framework is used in order to characterize and consolidate data regarding the interaction between drugs and proteins, as well as their chemical and functional qualities. A procedure is established for the simultaneous use of this informa- tion, including chemical similarity data between drug molecules, known interaction data between drugs and proteins, and protein-protein relationships based on the presence of functional domains (PFAM) and evolutionary lineages in common (orthology). Finally, a network diffusion approach is used, generalizing diffusion equations to non-Euclidean space, in order to perform semi-supervised learning on this data, and thus propose new therapeutic targets for known drugs. The thesis hence explores the role of the network Laplace operator, responsible for the use of the physical concept of diffusion within a complex networks framework. Through these analyses, this thesis establishes the importance of complex networks theory in employing diverse data, es- pecially when the goal is to make use of them in tandem.Fil: Kaufman, Bruno. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesChernomoretz, Ariel2024-11-15info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n7659_Kaufmanspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-10-23T11:16:59Ztesis:tesis_n7659_KaufmanInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-10-23 11:17:00.405Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
| dc.title.none.fl_str_mv |
Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos Complex networks applied to the characterization, integration and prioritization of biochemical data |
| title |
Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos |
| spellingShingle |
Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos Kaufman, Bruno REDES COMPLEJAS BIOINFORMATICA PRIORIZACION DIFUSION PROTEINAS FARMACOS COMPLEX NETWORKS BIOINFORMATICS PRIORITIZATION DIFFUSION PROTEINS DRUGS |
| title_short |
Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos |
| title_full |
Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos |
| title_fullStr |
Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos |
| title_full_unstemmed |
Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos |
| title_sort |
Redes complejas aplicadas a la caracterización, integración y priorización de datos bioquímicos |
| dc.creator.none.fl_str_mv |
Kaufman, Bruno |
| author |
Kaufman, Bruno |
| author_facet |
Kaufman, Bruno |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Chernomoretz, Ariel |
| dc.subject.none.fl_str_mv |
REDES COMPLEJAS BIOINFORMATICA PRIORIZACION DIFUSION PROTEINAS FARMACOS COMPLEX NETWORKS BIOINFORMATICS PRIORITIZATION DIFFUSION PROTEINS DRUGS |
| topic |
REDES COMPLEJAS BIOINFORMATICA PRIORIZACION DIFUSION PROTEINAS FARMACOS COMPLEX NETWORKS BIOINFORMATICS PRIORITIZATION DIFFUSION PROTEINS DRUGS |
| dc.description.none.fl_txt_mv |
En el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto. The field of computational biology makes use of enormous quantities of genetic, chemical and pharmacological information in order to find answers to questions of interest in these fields. This thesis will investigate concepts in complex network theory relevant to a structured analysis of said data. As an example of genomic application, we first explore networks resulting from a statistical mechanics-based analysis of 5’ splice sites. Through this analysis, conclusions are inferred regarding the inner workings of the splicing process, by which the genetic information stored in DNA is processed, and sections relevant to the construction of proteins (exons) are identified and separated from those to be ignored (introns). Afterwards, a network framework is used in order to characterize and consolidate data regarding the interaction between drugs and proteins, as well as their chemical and functional qualities. A procedure is established for the simultaneous use of this informa- tion, including chemical similarity data between drug molecules, known interaction data between drugs and proteins, and protein-protein relationships based on the presence of functional domains (PFAM) and evolutionary lineages in common (orthology). Finally, a network diffusion approach is used, generalizing diffusion equations to non-Euclidean space, in order to perform semi-supervised learning on this data, and thus propose new therapeutic targets for known drugs. The thesis hence explores the role of the network Laplace operator, responsible for the use of the physical concept of diffusion within a complex networks framework. Through these analyses, this thesis establishes the importance of complex networks theory in employing diverse data, es- pecially when the goal is to make use of them in tandem. Fil: Kaufman, Bruno. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
| description |
En el campo de la biología computacional se utilizan cantidades enormes de información genética, química, y farmacológica para responder preguntas de interés en estos campos. En esta tesis se investigan conceptos en redes complejas que habilitan un análisis estructurado de estos datos. Como ejemplo de aplicación genómica, primero se exploran redes resultantes de un análisis mecánico-estadístico de sitios de splicing 5'. A través de este análisis se infieren conclusiones acerca del funcionamiento interno del splicing, fenómeno mediante el cual se procesa la información genética almacenada en la molécula de ADN, y se identifican regiones que serán tenidas en cuenta para la construcción de proteínas (exones), en contraste a las secciones que serán descartadas (intrones). Luego se emplean las redes para la caracterización y consolidación de datos de interacción entre fármacos y proteínas, además de sus características químicas y funcionales. Se establece un procedimiento para la utilización en conjunto de datos de similaridad química entre moléculas de fármacos, datos de interacciones conocidas entre fármacos y proteínas, y relaciones entre proteínas basadas en la presencia de dominios funcionales (PFAM) y linaje evolutivo en común (ortología). Finalmente, se utiliza un enfoque de difusión en red, generalizando ecuaciones de difusión a espacios no-euclideanos, para el problema del aprendizaje semisupervisado sobre estos datos, y así proponer nuevos blancos terapéuticos para fármacos conocidos. Se explora el rol del operador Laplaciano en red, responsable del traspaso del concepto de difusión desde la física a las redes complejas. A través de estos análisis se establece la importancia del formalismo de redes complejas en el uso de datos diversos, en especial cuando se los busca utilizar en conjunto. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-11-15 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/doctoralThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_db06 info:ar-repo/semantics/tesisDoctoral |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/tesis_n7659_Kaufman |
| url |
https://hdl.handle.net/20.500.12110/tesis_n7659_Kaufman |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
| reponame_str |
Biblioteca Digital (UBA-FCEN) |
| collection |
Biblioteca Digital (UBA-FCEN) |
| instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| instacron_str |
UBA-FCEN |
| institution |
UBA-FCEN |
| repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
| _version_ |
1846784852023574528 |
| score |
12.982451 |