LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático

Autores
Abregú, Ángel Julián; De Micheli, Martín
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Martí, Marcelo Adrián
Turjanski, Pablo Guillermo
Descripción
En el presente trabajo de tesis se aborda el problema de generación de conjuntos de moléculas pequeñas que puedan comportarse como ligandos para proteína de interés y su inverso, la generación de conjuntos de proteínas con altas chances de acoplamiento a un ligando objetivo. En la actualidad, las bases de datos de moléculas poseen millones de compuestos y, poder predecir acoplamientos, es un problema relevante para la comunidad. Durante el desarrollo de esta tesis, nos enfocamos específicamente en el problema de vincular las propiedades conocidas sobre el sitio de unión de la proteína estudiada con las propiedades de los ligandos candidatos. Los descriptores escogidos son, por lo general, valores físico químicos, morfológicos y tipológicos, ya sean calculados o conocidos experimentalmente. Para realizar este vínculo de manera óptima, aplicamos técnicas de aprendizaje automático, estableciendo una valoración de los compuestos obtenidos en base a los parámetros calculados como óptimos para que una molécula se acople eficientemente a nuestro objetivo de interés. Los resultados finales, si bien no fueron los esperados, dan lugar a modelos de uso real mediante su incorporación en sistemas web que permiten su uso irrestricto. Para acercar a la comunidad nuestros desarrollos, tomamos como punto de partida una herramienta preexistente denominada LigQ. Esta herramienta permite calcular, dada una proteína como entrada, conjuntos de moléculas candidatas a ser ligandos de la misma, es decir, que pueden potencialmente acoplarse a ella modulando o inhibiendo su actividad. Adaptamos dicha herramienta, incorporando modelos de aprendizaje automático construídos durante este trabajo. Análogamente, para el problema inverso, desarrollamos una herramienta similar, a la que denominamos reverse-LigQ.
The present thesis work addresses the problem of generating sets of small molecules that can function as ligands for a certain protein of interest and its inverse, the generation of sets of proteins with high chances of binding to a target ligand. Currently, molecule databases have millions of compounds and it is a major problem for the scientific community to be able to predict these kinds of bindings. During the development of this thesis, we focused specifically on the problem of establishing a relationship between the known properties on the binding site of the studied protein and the properties of the candidate ligands. The chosen descriptors are, in general, physicochemical, morphological and topological values, whether computationally calculated or experimentally determined. We aimed to infer the relationship between those properties by applying Machine Learning techniques, selecting the obtained compounds based on the parameters calculated as optimal for a molecule to efficiently bind our target of interest. The final results, although not as good as expected, gave birth to models of real use through its incorporation into web systems that allow its unrestricted use. To bring our developments closer to the scientific community, we made use of a pre-existing tool called LigQ, which allows us to calculate, given a target protein as input, a set of molecules that can potentially bind to it and may ultimately modulate or inhibite its activity. We modified this tool by incorporating to it the Machine Learning models built in this work. Similarly, we developed a separate tool to address the inverse problem, which we called reverse-LigQ.
Fil: Abregú, Ángel Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Fil: De Micheli, Martín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
BIOINFORMATICA
QUIMIOINFORMATICA
BIOLOGIA COMPUTACIONAL
REDES NEURONALES
APRENDIZAJE AUTOMATICO
VIRTUAL SCREENING
INVERSE VIRTUAL SCREENING
BIOINFORMATICS
CHEMOINFORMATICS
COMPUTATIONAL BIOLOGY
NEURAL NETWORKS
MACHINE LEARNING
VIRTUAL SCREENING
INVERSE VIRTUAL SCREENING
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000607_Abregu

id BDUBAFCEN_958bec3b5ec1819caa018aaec3eca1e2
oai_identifier_str seminario:seminario_nCOM000607_Abregu
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automáticoAbregú, Ángel JuliánDe Micheli, MartínBIOINFORMATICAQUIMIOINFORMATICABIOLOGIA COMPUTACIONALREDES NEURONALESAPRENDIZAJE AUTOMATICOVIRTUAL SCREENINGINVERSE VIRTUAL SCREENINGBIOINFORMATICSCHEMOINFORMATICSCOMPUTATIONAL BIOLOGYNEURAL NETWORKSMACHINE LEARNINGVIRTUAL SCREENINGINVERSE VIRTUAL SCREENINGEn el presente trabajo de tesis se aborda el problema de generación de conjuntos de moléculas pequeñas que puedan comportarse como ligandos para proteína de interés y su inverso, la generación de conjuntos de proteínas con altas chances de acoplamiento a un ligando objetivo. En la actualidad, las bases de datos de moléculas poseen millones de compuestos y, poder predecir acoplamientos, es un problema relevante para la comunidad. Durante el desarrollo de esta tesis, nos enfocamos específicamente en el problema de vincular las propiedades conocidas sobre el sitio de unión de la proteína estudiada con las propiedades de los ligandos candidatos. Los descriptores escogidos son, por lo general, valores físico químicos, morfológicos y tipológicos, ya sean calculados o conocidos experimentalmente. Para realizar este vínculo de manera óptima, aplicamos técnicas de aprendizaje automático, estableciendo una valoración de los compuestos obtenidos en base a los parámetros calculados como óptimos para que una molécula se acople eficientemente a nuestro objetivo de interés. Los resultados finales, si bien no fueron los esperados, dan lugar a modelos de uso real mediante su incorporación en sistemas web que permiten su uso irrestricto. Para acercar a la comunidad nuestros desarrollos, tomamos como punto de partida una herramienta preexistente denominada LigQ. Esta herramienta permite calcular, dada una proteína como entrada, conjuntos de moléculas candidatas a ser ligandos de la misma, es decir, que pueden potencialmente acoplarse a ella modulando o inhibiendo su actividad. Adaptamos dicha herramienta, incorporando modelos de aprendizaje automático construídos durante este trabajo. Análogamente, para el problema inverso, desarrollamos una herramienta similar, a la que denominamos reverse-LigQ.The present thesis work addresses the problem of generating sets of small molecules that can function as ligands for a certain protein of interest and its inverse, the generation of sets of proteins with high chances of binding to a target ligand. Currently, molecule databases have millions of compounds and it is a major problem for the scientific community to be able to predict these kinds of bindings. During the development of this thesis, we focused specifically on the problem of establishing a relationship between the known properties on the binding site of the studied protein and the properties of the candidate ligands. The chosen descriptors are, in general, physicochemical, morphological and topological values, whether computationally calculated or experimentally determined. We aimed to infer the relationship between those properties by applying Machine Learning techniques, selecting the obtained compounds based on the parameters calculated as optimal for a molecule to efficiently bind our target of interest. The final results, although not as good as expected, gave birth to models of real use through its incorporation into web systems that allow its unrestricted use. To bring our developments closer to the scientific community, we made use of a pre-existing tool called LigQ, which allows us to calculate, given a target protein as input, a set of molecules that can potentially bind to it and may ultimately modulate or inhibite its activity. We modified this tool by incorporating to it the Machine Learning models built in this work. Similarly, we developed a separate tool to address the inverse problem, which we called reverse-LigQ.Fil: Abregú, Ángel Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Fil: De Micheli, Martín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesMartí, Marcelo AdriánTurjanski, Pablo Guillermo2019info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000607_Abreguspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:34Zseminario:seminario_nCOM000607_AbreguInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:35.612Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático
title LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático
spellingShingle LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático
Abregú, Ángel Julián
BIOINFORMATICA
QUIMIOINFORMATICA
BIOLOGIA COMPUTACIONAL
REDES NEURONALES
APRENDIZAJE AUTOMATICO
VIRTUAL SCREENING
INVERSE VIRTUAL SCREENING
BIOINFORMATICS
CHEMOINFORMATICS
COMPUTATIONAL BIOLOGY
NEURAL NETWORKS
MACHINE LEARNING
VIRTUAL SCREENING
INVERSE VIRTUAL SCREENING
title_short LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático
title_full LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático
title_fullStr LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático
title_full_unstemmed LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático
title_sort LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático
dc.creator.none.fl_str_mv Abregú, Ángel Julián
De Micheli, Martín
author Abregú, Ángel Julián
author_facet Abregú, Ángel Julián
De Micheli, Martín
author_role author
author2 De Micheli, Martín
author2_role author
dc.contributor.none.fl_str_mv Martí, Marcelo Adrián
Turjanski, Pablo Guillermo
dc.subject.none.fl_str_mv BIOINFORMATICA
QUIMIOINFORMATICA
BIOLOGIA COMPUTACIONAL
REDES NEURONALES
APRENDIZAJE AUTOMATICO
VIRTUAL SCREENING
INVERSE VIRTUAL SCREENING
BIOINFORMATICS
CHEMOINFORMATICS
COMPUTATIONAL BIOLOGY
NEURAL NETWORKS
MACHINE LEARNING
VIRTUAL SCREENING
INVERSE VIRTUAL SCREENING
topic BIOINFORMATICA
QUIMIOINFORMATICA
BIOLOGIA COMPUTACIONAL
REDES NEURONALES
APRENDIZAJE AUTOMATICO
VIRTUAL SCREENING
INVERSE VIRTUAL SCREENING
BIOINFORMATICS
CHEMOINFORMATICS
COMPUTATIONAL BIOLOGY
NEURAL NETWORKS
MACHINE LEARNING
VIRTUAL SCREENING
INVERSE VIRTUAL SCREENING
dc.description.none.fl_txt_mv En el presente trabajo de tesis se aborda el problema de generación de conjuntos de moléculas pequeñas que puedan comportarse como ligandos para proteína de interés y su inverso, la generación de conjuntos de proteínas con altas chances de acoplamiento a un ligando objetivo. En la actualidad, las bases de datos de moléculas poseen millones de compuestos y, poder predecir acoplamientos, es un problema relevante para la comunidad. Durante el desarrollo de esta tesis, nos enfocamos específicamente en el problema de vincular las propiedades conocidas sobre el sitio de unión de la proteína estudiada con las propiedades de los ligandos candidatos. Los descriptores escogidos son, por lo general, valores físico químicos, morfológicos y tipológicos, ya sean calculados o conocidos experimentalmente. Para realizar este vínculo de manera óptima, aplicamos técnicas de aprendizaje automático, estableciendo una valoración de los compuestos obtenidos en base a los parámetros calculados como óptimos para que una molécula se acople eficientemente a nuestro objetivo de interés. Los resultados finales, si bien no fueron los esperados, dan lugar a modelos de uso real mediante su incorporación en sistemas web que permiten su uso irrestricto. Para acercar a la comunidad nuestros desarrollos, tomamos como punto de partida una herramienta preexistente denominada LigQ. Esta herramienta permite calcular, dada una proteína como entrada, conjuntos de moléculas candidatas a ser ligandos de la misma, es decir, que pueden potencialmente acoplarse a ella modulando o inhibiendo su actividad. Adaptamos dicha herramienta, incorporando modelos de aprendizaje automático construídos durante este trabajo. Análogamente, para el problema inverso, desarrollamos una herramienta similar, a la que denominamos reverse-LigQ.
The present thesis work addresses the problem of generating sets of small molecules that can function as ligands for a certain protein of interest and its inverse, the generation of sets of proteins with high chances of binding to a target ligand. Currently, molecule databases have millions of compounds and it is a major problem for the scientific community to be able to predict these kinds of bindings. During the development of this thesis, we focused specifically on the problem of establishing a relationship between the known properties on the binding site of the studied protein and the properties of the candidate ligands. The chosen descriptors are, in general, physicochemical, morphological and topological values, whether computationally calculated or experimentally determined. We aimed to infer the relationship between those properties by applying Machine Learning techniques, selecting the obtained compounds based on the parameters calculated as optimal for a molecule to efficiently bind our target of interest. The final results, although not as good as expected, gave birth to models of real use through its incorporation into web systems that allow its unrestricted use. To bring our developments closer to the scientific community, we made use of a pre-existing tool called LigQ, which allows us to calculate, given a target protein as input, a set of molecules that can potentially bind to it and may ultimately modulate or inhibite its activity. We modified this tool by incorporating to it the Machine Learning models built in this work. Similarly, we developed a separate tool to address the inverse problem, which we called reverse-LigQ.
Fil: Abregú, Ángel Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Fil: De Micheli, Martín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description En el presente trabajo de tesis se aborda el problema de generación de conjuntos de moléculas pequeñas que puedan comportarse como ligandos para proteína de interés y su inverso, la generación de conjuntos de proteínas con altas chances de acoplamiento a un ligando objetivo. En la actualidad, las bases de datos de moléculas poseen millones de compuestos y, poder predecir acoplamientos, es un problema relevante para la comunidad. Durante el desarrollo de esta tesis, nos enfocamos específicamente en el problema de vincular las propiedades conocidas sobre el sitio de unión de la proteína estudiada con las propiedades de los ligandos candidatos. Los descriptores escogidos son, por lo general, valores físico químicos, morfológicos y tipológicos, ya sean calculados o conocidos experimentalmente. Para realizar este vínculo de manera óptima, aplicamos técnicas de aprendizaje automático, estableciendo una valoración de los compuestos obtenidos en base a los parámetros calculados como óptimos para que una molécula se acople eficientemente a nuestro objetivo de interés. Los resultados finales, si bien no fueron los esperados, dan lugar a modelos de uso real mediante su incorporación en sistemas web que permiten su uso irrestricto. Para acercar a la comunidad nuestros desarrollos, tomamos como punto de partida una herramienta preexistente denominada LigQ. Esta herramienta permite calcular, dada una proteína como entrada, conjuntos de moléculas candidatas a ser ligandos de la misma, es decir, que pueden potencialmente acoplarse a ella modulando o inhibiendo su actividad. Adaptamos dicha herramienta, incorporando modelos de aprendizaje automático construídos durante este trabajo. Análogamente, para el problema inverso, desarrollamos una herramienta similar, a la que denominamos reverse-LigQ.
publishDate 2019
dc.date.none.fl_str_mv 2019
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000607_Abregu
url https://hdl.handle.net/20.500.12110/seminario_nCOM000607_Abregu
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618754173960192
score 13.070432