Desarrollo de métodos estadísticos para el análisis de patrones biológicos en proteínas : aplicaciones a familias de proteínas repetitivas

Autores
Espada, Rocío
Año de publicación
2017
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Ferreiro, Diego U.
Descripción
Las proteínas son moléculas sumamente diversas, responsables de las más variadas funciones biológicas. Toda esta diversidad se encuentra codificada en las secuencias de aminoácidos que las constituyen. En este trabajo se aplican modelos cuantitativos, derivados de mecánica estadística, que permiten derivar propiedades generales (o macroscópicas) del plegado proteico a partir de su secuencia primaria (propiedades microscópicas). El trabajo se enfoca enel estudio de proteínas repetitivas, cuya simetría en secuencia y estructura, y propiedades derivadas de ellas, las han puesto en el centro del estudio del plegado proteico y del diseño de biomoléculas con aplicaciones biotecnológicas. En este trabajo, la simetría en secuencia de las proteínas repetitivas han permitido reducirla dimensionalidad del problema, permitiendo un ajuste fino de los parámetros del modeloque no es posible en proteínas globulares de gran tama˜no. Cada proteína (o estado) recibe unapuntuación o energía que se encuentra relacionada con la estabilidad del plegado, e inclusopermite estimar el efecto de mutaciones puntuales. Por otro lado, el modelo presentado esutilizado para generar ensambles de nuevas variantes que son indistinguibles respecto de lasproteínas naturales mediante algoritmos de caracterización de secuencia actuales. Los modelos desarrollados permiten derivar medidas de correlación entre sustitucionesde aminoácidos en proteínas. Como es esperable, estas correlaciones reflejan distintas propiedadesfuncionales y evolutivas. Los análisis aquí desarrollados permiten distinguir las correlaciones originadas en la alta simetría de las secuencias de proteínas repetitivas y aquellasque evidencian contactos en la estructura nativa.
Proteins are extremely diverse molecules, responsible for the most varied biological functions. All this diversity is encoded in the amino acid sequences that constitute them. In this work, quantitative models, derived from statistical mechanics, that allow to derive general (or macroscopic) properties of the protein folding from its primary sequence (microscopicproperties) are applied. This work focuses on the study of repetitive proteins, whose symmetryin sequence and structure, and properties derived from them, have placed them at thecenter of the study of protein folding and of the design of biomolecules with biotechnologicalapplications. In this work, the sequence symmetry of the repetitive proteins has allowed to reduce thedimensionality of the problem, permitting to adjust the parameters of the model, which isnot possible in large globular proteins. Each protein (or state) receives a score or energythat is related to the stability of the folding, and even allows to estimate the effect of pointmutations. On the other hand, the presented model is used to generate assemblies of newvariants that are indistinguishable from natural proteins by current sequence characterization algorithms. The developed models permit to derive measures of correlation between substitutionsof amino acids in proteins. As expected, these correlations reflect different functional andevolutionary properties. The analyzes developed here enables to distinguish the correlationsoriginated in the high symmetry of the repetitive protein sequences and those that showcontacts in the native structure.
Fil: Espada, Rocío. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
PROTEINAS REPETITIVAS
PLEGADO DE PROTEINAS
MODELO DE POTTS
PREDICCION DE ESTRUCTURA
PREDICCION DE TRIANGULITO G
REPEAT PROTEIN
PROTEIN FOLDING
POTTS MODEL
STRUCTURE PREDICTION
TRIANGLE G PREDICTION
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n6223_Espada

id BDUBAFCEN_952f08f5defe3e517e9c216e41b0bf75
oai_identifier_str tesis:tesis_n6223_Espada
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Desarrollo de métodos estadísticos para el análisis de patrones biológicos en proteínas : aplicaciones a familias de proteínas repetitivasStatistical methods for the analyses of biological patterns in proteins: applications to repeat protein familiesEspada, RocíoPROTEINAS REPETITIVASPLEGADO DE PROTEINASMODELO DE POTTSPREDICCION DE ESTRUCTURAPREDICCION DE TRIANGULITO GREPEAT PROTEINPROTEIN FOLDINGPOTTS MODELSTRUCTURE PREDICTIONTRIANGLE G PREDICTIONLas proteínas son moléculas sumamente diversas, responsables de las más variadas funciones biológicas. Toda esta diversidad se encuentra codificada en las secuencias de aminoácidos que las constituyen. En este trabajo se aplican modelos cuantitativos, derivados de mecánica estadística, que permiten derivar propiedades generales (o macroscópicas) del plegado proteico a partir de su secuencia primaria (propiedades microscópicas). El trabajo se enfoca enel estudio de proteínas repetitivas, cuya simetría en secuencia y estructura, y propiedades derivadas de ellas, las han puesto en el centro del estudio del plegado proteico y del diseño de biomoléculas con aplicaciones biotecnológicas. En este trabajo, la simetría en secuencia de las proteínas repetitivas han permitido reducirla dimensionalidad del problema, permitiendo un ajuste fino de los parámetros del modeloque no es posible en proteínas globulares de gran tama˜no. Cada proteína (o estado) recibe unapuntuación o energía que se encuentra relacionada con la estabilidad del plegado, e inclusopermite estimar el efecto de mutaciones puntuales. Por otro lado, el modelo presentado esutilizado para generar ensambles de nuevas variantes que son indistinguibles respecto de lasproteínas naturales mediante algoritmos de caracterización de secuencia actuales. Los modelos desarrollados permiten derivar medidas de correlación entre sustitucionesde aminoácidos en proteínas. Como es esperable, estas correlaciones reflejan distintas propiedadesfuncionales y evolutivas. Los análisis aquí desarrollados permiten distinguir las correlaciones originadas en la alta simetría de las secuencias de proteínas repetitivas y aquellasque evidencian contactos en la estructura nativa.Proteins are extremely diverse molecules, responsible for the most varied biological functions. All this diversity is encoded in the amino acid sequences that constitute them. In this work, quantitative models, derived from statistical mechanics, that allow to derive general (or macroscopic) properties of the protein folding from its primary sequence (microscopicproperties) are applied. This work focuses on the study of repetitive proteins, whose symmetryin sequence and structure, and properties derived from them, have placed them at thecenter of the study of protein folding and of the design of biomolecules with biotechnologicalapplications. In this work, the sequence symmetry of the repetitive proteins has allowed to reduce thedimensionality of the problem, permitting to adjust the parameters of the model, which isnot possible in large globular proteins. Each protein (or state) receives a score or energythat is related to the stability of the folding, and even allows to estimate the effect of pointmutations. On the other hand, the presented model is used to generate assemblies of newvariants that are indistinguishable from natural proteins by current sequence characterization algorithms. The developed models permit to derive measures of correlation between substitutionsof amino acids in proteins. As expected, these correlations reflect different functional andevolutionary properties. The analyzes developed here enables to distinguish the correlationsoriginated in the high symmetry of the repetitive protein sequences and those that showcontacts in the native structure.Fil: Espada, Rocío. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesFerreiro, Diego U.2017-04-07info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n6223_Espadaspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:42:01Ztesis:tesis_n6223_EspadaInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:42:02.619Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Desarrollo de métodos estadísticos para el análisis de patrones biológicos en proteínas : aplicaciones a familias de proteínas repetitivas
Statistical methods for the analyses of biological patterns in proteins: applications to repeat protein families
title Desarrollo de métodos estadísticos para el análisis de patrones biológicos en proteínas : aplicaciones a familias de proteínas repetitivas
spellingShingle Desarrollo de métodos estadísticos para el análisis de patrones biológicos en proteínas : aplicaciones a familias de proteínas repetitivas
Espada, Rocío
PROTEINAS REPETITIVAS
PLEGADO DE PROTEINAS
MODELO DE POTTS
PREDICCION DE ESTRUCTURA
PREDICCION DE TRIANGULITO G
REPEAT PROTEIN
PROTEIN FOLDING
POTTS MODEL
STRUCTURE PREDICTION
TRIANGLE G PREDICTION
title_short Desarrollo de métodos estadísticos para el análisis de patrones biológicos en proteínas : aplicaciones a familias de proteínas repetitivas
title_full Desarrollo de métodos estadísticos para el análisis de patrones biológicos en proteínas : aplicaciones a familias de proteínas repetitivas
title_fullStr Desarrollo de métodos estadísticos para el análisis de patrones biológicos en proteínas : aplicaciones a familias de proteínas repetitivas
title_full_unstemmed Desarrollo de métodos estadísticos para el análisis de patrones biológicos en proteínas : aplicaciones a familias de proteínas repetitivas
title_sort Desarrollo de métodos estadísticos para el análisis de patrones biológicos en proteínas : aplicaciones a familias de proteínas repetitivas
dc.creator.none.fl_str_mv Espada, Rocío
author Espada, Rocío
author_facet Espada, Rocío
author_role author
dc.contributor.none.fl_str_mv Ferreiro, Diego U.
dc.subject.none.fl_str_mv PROTEINAS REPETITIVAS
PLEGADO DE PROTEINAS
MODELO DE POTTS
PREDICCION DE ESTRUCTURA
PREDICCION DE TRIANGULITO G
REPEAT PROTEIN
PROTEIN FOLDING
POTTS MODEL
STRUCTURE PREDICTION
TRIANGLE G PREDICTION
topic PROTEINAS REPETITIVAS
PLEGADO DE PROTEINAS
MODELO DE POTTS
PREDICCION DE ESTRUCTURA
PREDICCION DE TRIANGULITO G
REPEAT PROTEIN
PROTEIN FOLDING
POTTS MODEL
STRUCTURE PREDICTION
TRIANGLE G PREDICTION
dc.description.none.fl_txt_mv Las proteínas son moléculas sumamente diversas, responsables de las más variadas funciones biológicas. Toda esta diversidad se encuentra codificada en las secuencias de aminoácidos que las constituyen. En este trabajo se aplican modelos cuantitativos, derivados de mecánica estadística, que permiten derivar propiedades generales (o macroscópicas) del plegado proteico a partir de su secuencia primaria (propiedades microscópicas). El trabajo se enfoca enel estudio de proteínas repetitivas, cuya simetría en secuencia y estructura, y propiedades derivadas de ellas, las han puesto en el centro del estudio del plegado proteico y del diseño de biomoléculas con aplicaciones biotecnológicas. En este trabajo, la simetría en secuencia de las proteínas repetitivas han permitido reducirla dimensionalidad del problema, permitiendo un ajuste fino de los parámetros del modeloque no es posible en proteínas globulares de gran tama˜no. Cada proteína (o estado) recibe unapuntuación o energía que se encuentra relacionada con la estabilidad del plegado, e inclusopermite estimar el efecto de mutaciones puntuales. Por otro lado, el modelo presentado esutilizado para generar ensambles de nuevas variantes que son indistinguibles respecto de lasproteínas naturales mediante algoritmos de caracterización de secuencia actuales. Los modelos desarrollados permiten derivar medidas de correlación entre sustitucionesde aminoácidos en proteínas. Como es esperable, estas correlaciones reflejan distintas propiedadesfuncionales y evolutivas. Los análisis aquí desarrollados permiten distinguir las correlaciones originadas en la alta simetría de las secuencias de proteínas repetitivas y aquellasque evidencian contactos en la estructura nativa.
Proteins are extremely diverse molecules, responsible for the most varied biological functions. All this diversity is encoded in the amino acid sequences that constitute them. In this work, quantitative models, derived from statistical mechanics, that allow to derive general (or macroscopic) properties of the protein folding from its primary sequence (microscopicproperties) are applied. This work focuses on the study of repetitive proteins, whose symmetryin sequence and structure, and properties derived from them, have placed them at thecenter of the study of protein folding and of the design of biomolecules with biotechnologicalapplications. In this work, the sequence symmetry of the repetitive proteins has allowed to reduce thedimensionality of the problem, permitting to adjust the parameters of the model, which isnot possible in large globular proteins. Each protein (or state) receives a score or energythat is related to the stability of the folding, and even allows to estimate the effect of pointmutations. On the other hand, the presented model is used to generate assemblies of newvariants that are indistinguishable from natural proteins by current sequence characterization algorithms. The developed models permit to derive measures of correlation between substitutionsof amino acids in proteins. As expected, these correlations reflect different functional andevolutionary properties. The analyzes developed here enables to distinguish the correlationsoriginated in the high symmetry of the repetitive protein sequences and those that showcontacts in the native structure.
Fil: Espada, Rocío. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description Las proteínas son moléculas sumamente diversas, responsables de las más variadas funciones biológicas. Toda esta diversidad se encuentra codificada en las secuencias de aminoácidos que las constituyen. En este trabajo se aplican modelos cuantitativos, derivados de mecánica estadística, que permiten derivar propiedades generales (o macroscópicas) del plegado proteico a partir de su secuencia primaria (propiedades microscópicas). El trabajo se enfoca enel estudio de proteínas repetitivas, cuya simetría en secuencia y estructura, y propiedades derivadas de ellas, las han puesto en el centro del estudio del plegado proteico y del diseño de biomoléculas con aplicaciones biotecnológicas. En este trabajo, la simetría en secuencia de las proteínas repetitivas han permitido reducirla dimensionalidad del problema, permitiendo un ajuste fino de los parámetros del modeloque no es posible en proteínas globulares de gran tama˜no. Cada proteína (o estado) recibe unapuntuación o energía que se encuentra relacionada con la estabilidad del plegado, e inclusopermite estimar el efecto de mutaciones puntuales. Por otro lado, el modelo presentado esutilizado para generar ensambles de nuevas variantes que son indistinguibles respecto de lasproteínas naturales mediante algoritmos de caracterización de secuencia actuales. Los modelos desarrollados permiten derivar medidas de correlación entre sustitucionesde aminoácidos en proteínas. Como es esperable, estas correlaciones reflejan distintas propiedadesfuncionales y evolutivas. Los análisis aquí desarrollados permiten distinguir las correlaciones originadas en la alta simetría de las secuencias de proteínas repetitivas y aquellasque evidencian contactos en la estructura nativa.
publishDate 2017
dc.date.none.fl_str_mv 2017-04-07
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n6223_Espada
url https://hdl.handle.net/20.500.12110/tesis_n6223_Espada
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618717384671232
score 13.070432