LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático
- Autores
- Abregú, Ángel Julián; De Micheli, Martín
- Año de publicación
- 2019
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Martí, Marcelo Adrián
Turjanski, Pablo Guillermo - Descripción
- En el presente trabajo de tesis se aborda el problema de generación de conjuntos de moléculas pequeñas que puedan comportarse como ligandos para proteína de interés y su inverso, la generación de conjuntos de proteínas con altas chances de acoplamiento a un ligando objetivo. En la actualidad, las bases de datos de moléculas poseen millones de compuestos y, poder predecir acoplamientos, es un problema relevante para la comunidad. Durante el desarrollo de esta tesis, nos enfocamos específicamente en el problema de vincular las propiedades conocidas sobre el sitio de unión de la proteína estudiada con las propiedades de los ligandos candidatos. Los descriptores escogidos son, por lo general, valores físico químicos, morfológicos y tipológicos, ya sean calculados o conocidos experimentalmente. Para realizar este vínculo de manera óptima, aplicamos técnicas de aprendizaje automático, estableciendo una valoración de los compuestos obtenidos en base a los parámetros calculados como óptimos para que una molécula se acople eficientemente a nuestro objetivo de interés. Los resultados finales, si bien no fueron los esperados, dan lugar a modelos de uso real mediante su incorporación en sistemas web que permiten su uso irrestricto. Para acercar a la comunidad nuestros desarrollos, tomamos como punto de partida una herramienta preexistente denominada LigQ. Esta herramienta permite calcular, dada una proteína como entrada, conjuntos de moléculas candidatas a ser ligandos de la misma, es decir, que pueden potencialmente acoplarse a ella modulando o inhibiendo su actividad. Adaptamos dicha herramienta, incorporando modelos de aprendizaje automático construídos durante este trabajo. Análogamente, para el problema inverso, desarrollamos una herramienta similar, a la que denominamos reverse-LigQ.
The present thesis work addresses the problem of generating sets of small molecules that can function as ligands for a certain protein of interest and its inverse, the generation of sets of proteins with high chances of binding to a target ligand. Currently, molecule databases have millions of compounds and it is a major problem for the scientific community to be able to predict these kinds of bindings. During the development of this thesis, we focused specifically on the problem of establishing a relationship between the known properties on the binding site of the studied protein and the properties of the candidate ligands. The chosen descriptors are, in general, physicochemical, morphological and topological values, whether computationally calculated or experimentally determined. We aimed to infer the relationship between those properties by applying Machine Learning techniques, selecting the obtained compounds based on the parameters calculated as optimal for a molecule to efficiently bind our target of interest. The final results, although not as good as expected, gave birth to models of real use through its incorporation into web systems that allow its unrestricted use. To bring our developments closer to the scientific community, we made use of a pre-existing tool called LigQ, which allows us to calculate, given a target protein as input, a set of molecules that can potentially bind to it and may ultimately modulate or inhibite its activity. We modified this tool by incorporating to it the Machine Learning models built in this work. Similarly, we developed a separate tool to address the inverse problem, which we called reverse-LigQ.
Fil: Abregú, Ángel Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Fil: De Micheli, Martín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
BIOINFORMATICA
QUIMIOINFORMATICA
BIOLOGIA COMPUTACIONAL
REDES NEURONALES
APRENDIZAJE AUTOMATICO
VIRTUAL SCREENING
INVERSE VIRTUAL SCREENING
BIOINFORMATICS
CHEMOINFORMATICS
COMPUTATIONAL BIOLOGY
NEURAL NETWORKS
MACHINE LEARNING
VIRTUAL SCREENING
INVERSE VIRTUAL SCREENING - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nCOM000607_Abregu
Ver los metadatos del registro completo
id |
BDUBAFCEN_958bec3b5ec1819caa018aaec3eca1e2 |
---|---|
oai_identifier_str |
seminario:seminario_nCOM000607_Abregu |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automáticoAbregú, Ángel JuliánDe Micheli, MartínBIOINFORMATICAQUIMIOINFORMATICABIOLOGIA COMPUTACIONALREDES NEURONALESAPRENDIZAJE AUTOMATICOVIRTUAL SCREENINGINVERSE VIRTUAL SCREENINGBIOINFORMATICSCHEMOINFORMATICSCOMPUTATIONAL BIOLOGYNEURAL NETWORKSMACHINE LEARNINGVIRTUAL SCREENINGINVERSE VIRTUAL SCREENINGEn el presente trabajo de tesis se aborda el problema de generación de conjuntos de moléculas pequeñas que puedan comportarse como ligandos para proteína de interés y su inverso, la generación de conjuntos de proteínas con altas chances de acoplamiento a un ligando objetivo. En la actualidad, las bases de datos de moléculas poseen millones de compuestos y, poder predecir acoplamientos, es un problema relevante para la comunidad. Durante el desarrollo de esta tesis, nos enfocamos específicamente en el problema de vincular las propiedades conocidas sobre el sitio de unión de la proteína estudiada con las propiedades de los ligandos candidatos. Los descriptores escogidos son, por lo general, valores físico químicos, morfológicos y tipológicos, ya sean calculados o conocidos experimentalmente. Para realizar este vínculo de manera óptima, aplicamos técnicas de aprendizaje automático, estableciendo una valoración de los compuestos obtenidos en base a los parámetros calculados como óptimos para que una molécula se acople eficientemente a nuestro objetivo de interés. Los resultados finales, si bien no fueron los esperados, dan lugar a modelos de uso real mediante su incorporación en sistemas web que permiten su uso irrestricto. Para acercar a la comunidad nuestros desarrollos, tomamos como punto de partida una herramienta preexistente denominada LigQ. Esta herramienta permite calcular, dada una proteína como entrada, conjuntos de moléculas candidatas a ser ligandos de la misma, es decir, que pueden potencialmente acoplarse a ella modulando o inhibiendo su actividad. Adaptamos dicha herramienta, incorporando modelos de aprendizaje automático construídos durante este trabajo. Análogamente, para el problema inverso, desarrollamos una herramienta similar, a la que denominamos reverse-LigQ.The present thesis work addresses the problem of generating sets of small molecules that can function as ligands for a certain protein of interest and its inverse, the generation of sets of proteins with high chances of binding to a target ligand. Currently, molecule databases have millions of compounds and it is a major problem for the scientific community to be able to predict these kinds of bindings. During the development of this thesis, we focused specifically on the problem of establishing a relationship between the known properties on the binding site of the studied protein and the properties of the candidate ligands. The chosen descriptors are, in general, physicochemical, morphological and topological values, whether computationally calculated or experimentally determined. We aimed to infer the relationship between those properties by applying Machine Learning techniques, selecting the obtained compounds based on the parameters calculated as optimal for a molecule to efficiently bind our target of interest. The final results, although not as good as expected, gave birth to models of real use through its incorporation into web systems that allow its unrestricted use. To bring our developments closer to the scientific community, we made use of a pre-existing tool called LigQ, which allows us to calculate, given a target protein as input, a set of molecules that can potentially bind to it and may ultimately modulate or inhibite its activity. We modified this tool by incorporating to it the Machine Learning models built in this work. Similarly, we developed a separate tool to address the inverse problem, which we called reverse-LigQ.Fil: Abregú, Ángel Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Fil: De Micheli, Martín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesMartí, Marcelo AdriánTurjanski, Pablo Guillermo2019info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000607_Abreguspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:34Zseminario:seminario_nCOM000607_AbreguInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:35.612Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático |
title |
LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático |
spellingShingle |
LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático Abregú, Ángel Julián BIOINFORMATICA QUIMIOINFORMATICA BIOLOGIA COMPUTACIONAL REDES NEURONALES APRENDIZAJE AUTOMATICO VIRTUAL SCREENING INVERSE VIRTUAL SCREENING BIOINFORMATICS CHEMOINFORMATICS COMPUTATIONAL BIOLOGY NEURAL NETWORKS MACHINE LEARNING VIRTUAL SCREENING INVERSE VIRTUAL SCREENING |
title_short |
LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático |
title_full |
LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático |
title_fullStr |
LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático |
title_full_unstemmed |
LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático |
title_sort |
LigQ 2.0 y ReverseLigQ : dos herramientas de Virtual Screening e Inverse Virtual Screening basadas en aprendizaje automático |
dc.creator.none.fl_str_mv |
Abregú, Ángel Julián De Micheli, Martín |
author |
Abregú, Ángel Julián |
author_facet |
Abregú, Ángel Julián De Micheli, Martín |
author_role |
author |
author2 |
De Micheli, Martín |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Martí, Marcelo Adrián Turjanski, Pablo Guillermo |
dc.subject.none.fl_str_mv |
BIOINFORMATICA QUIMIOINFORMATICA BIOLOGIA COMPUTACIONAL REDES NEURONALES APRENDIZAJE AUTOMATICO VIRTUAL SCREENING INVERSE VIRTUAL SCREENING BIOINFORMATICS CHEMOINFORMATICS COMPUTATIONAL BIOLOGY NEURAL NETWORKS MACHINE LEARNING VIRTUAL SCREENING INVERSE VIRTUAL SCREENING |
topic |
BIOINFORMATICA QUIMIOINFORMATICA BIOLOGIA COMPUTACIONAL REDES NEURONALES APRENDIZAJE AUTOMATICO VIRTUAL SCREENING INVERSE VIRTUAL SCREENING BIOINFORMATICS CHEMOINFORMATICS COMPUTATIONAL BIOLOGY NEURAL NETWORKS MACHINE LEARNING VIRTUAL SCREENING INVERSE VIRTUAL SCREENING |
dc.description.none.fl_txt_mv |
En el presente trabajo de tesis se aborda el problema de generación de conjuntos de moléculas pequeñas que puedan comportarse como ligandos para proteína de interés y su inverso, la generación de conjuntos de proteínas con altas chances de acoplamiento a un ligando objetivo. En la actualidad, las bases de datos de moléculas poseen millones de compuestos y, poder predecir acoplamientos, es un problema relevante para la comunidad. Durante el desarrollo de esta tesis, nos enfocamos específicamente en el problema de vincular las propiedades conocidas sobre el sitio de unión de la proteína estudiada con las propiedades de los ligandos candidatos. Los descriptores escogidos son, por lo general, valores físico químicos, morfológicos y tipológicos, ya sean calculados o conocidos experimentalmente. Para realizar este vínculo de manera óptima, aplicamos técnicas de aprendizaje automático, estableciendo una valoración de los compuestos obtenidos en base a los parámetros calculados como óptimos para que una molécula se acople eficientemente a nuestro objetivo de interés. Los resultados finales, si bien no fueron los esperados, dan lugar a modelos de uso real mediante su incorporación en sistemas web que permiten su uso irrestricto. Para acercar a la comunidad nuestros desarrollos, tomamos como punto de partida una herramienta preexistente denominada LigQ. Esta herramienta permite calcular, dada una proteína como entrada, conjuntos de moléculas candidatas a ser ligandos de la misma, es decir, que pueden potencialmente acoplarse a ella modulando o inhibiendo su actividad. Adaptamos dicha herramienta, incorporando modelos de aprendizaje automático construídos durante este trabajo. Análogamente, para el problema inverso, desarrollamos una herramienta similar, a la que denominamos reverse-LigQ. The present thesis work addresses the problem of generating sets of small molecules that can function as ligands for a certain protein of interest and its inverse, the generation of sets of proteins with high chances of binding to a target ligand. Currently, molecule databases have millions of compounds and it is a major problem for the scientific community to be able to predict these kinds of bindings. During the development of this thesis, we focused specifically on the problem of establishing a relationship between the known properties on the binding site of the studied protein and the properties of the candidate ligands. The chosen descriptors are, in general, physicochemical, morphological and topological values, whether computationally calculated or experimentally determined. We aimed to infer the relationship between those properties by applying Machine Learning techniques, selecting the obtained compounds based on the parameters calculated as optimal for a molecule to efficiently bind our target of interest. The final results, although not as good as expected, gave birth to models of real use through its incorporation into web systems that allow its unrestricted use. To bring our developments closer to the scientific community, we made use of a pre-existing tool called LigQ, which allows us to calculate, given a target protein as input, a set of molecules that can potentially bind to it and may ultimately modulate or inhibite its activity. We modified this tool by incorporating to it the Machine Learning models built in this work. Similarly, we developed a separate tool to address the inverse problem, which we called reverse-LigQ. Fil: Abregú, Ángel Julián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Fil: De Micheli, Martín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
En el presente trabajo de tesis se aborda el problema de generación de conjuntos de moléculas pequeñas que puedan comportarse como ligandos para proteína de interés y su inverso, la generación de conjuntos de proteínas con altas chances de acoplamiento a un ligando objetivo. En la actualidad, las bases de datos de moléculas poseen millones de compuestos y, poder predecir acoplamientos, es un problema relevante para la comunidad. Durante el desarrollo de esta tesis, nos enfocamos específicamente en el problema de vincular las propiedades conocidas sobre el sitio de unión de la proteína estudiada con las propiedades de los ligandos candidatos. Los descriptores escogidos son, por lo general, valores físico químicos, morfológicos y tipológicos, ya sean calculados o conocidos experimentalmente. Para realizar este vínculo de manera óptima, aplicamos técnicas de aprendizaje automático, estableciendo una valoración de los compuestos obtenidos en base a los parámetros calculados como óptimos para que una molécula se acople eficientemente a nuestro objetivo de interés. Los resultados finales, si bien no fueron los esperados, dan lugar a modelos de uso real mediante su incorporación en sistemas web que permiten su uso irrestricto. Para acercar a la comunidad nuestros desarrollos, tomamos como punto de partida una herramienta preexistente denominada LigQ. Esta herramienta permite calcular, dada una proteína como entrada, conjuntos de moléculas candidatas a ser ligandos de la misma, es decir, que pueden potencialmente acoplarse a ella modulando o inhibiendo su actividad. Adaptamos dicha herramienta, incorporando modelos de aprendizaje automático construídos durante este trabajo. Análogamente, para el problema inverso, desarrollamos una herramienta similar, a la que denominamos reverse-LigQ. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nCOM000607_Abregu |
url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000607_Abregu |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1844618754173960192 |
score |
13.070432 |