Análisis evolutivo de la interacción proteína-ADN

Autores
Aptekmann, Ariel Alejandro
Año de publicación
2018
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Nadra, Alejandro Daniel
Descripción
En la entidad funcional “interfaz proteína-ADN”, proteína y ADN se condicionanmutuamente en un proceso coevolutivo. El hecho de que múltiples reconocedoresmoleculares tengan que coexistir en un mismo genoma y ejercer sus funciones sininterferir con las funciones de los otros, condiciona sus requisitos de especificidady discriminación. En términos evolutivos, se observa además que pares homólogosmantienen su función en un espectro amplio de condiciones físico químicas. Se agregaa esto la dificultad de que una vez determinada una red regulatoria hay un efectoinercial, que dificulta el modificarla cuanto mas cantidad de partes interactuantesformen la misma. En este trabajo nos proponemos estudiar las condiciones, procesosy mecanismos que determinan las posibilidades de este fenómeno. Esta tesis puededividirse en siete etapas, cada una correspondiente con un capítulo. En el primercapítulo comenzamos por recopilar de forma sistemática información sobre las condicionesde vida de extremófilos, principalmente Archaea. En el segundo capítulo,para aquellos organismos con un genoma secuenciado y anotado, calculamos la composiciónde distintas regiones del genoma, evidenciando que la aparente correlaciónentre contenido de G+C y la temperatura óptima de crecimiento se debe a un sesgoen los datos usados históricamente. En el tercer capítulo estudiamos el contenido deinformación de los promotores en distintos genomas, evidenciando un desvío de loesperable de acuerdo a la teoría molecular de la información, proponiendo posiblesexplicaciones para esta desviación. En el cuarto capítulo se aplica un análisis similara la comparación de promotores de genomas nuclear y mitocondrial en los cualeshay, de manera sostenida y en un mismo organismo, una diferencia de temperatura. En el quinto capítulo se identifican y caracterizan motivos funcionales a nivel degenoma, relacionados con la regulación de un factor de transcripción involucrado encrecimiento radicular en plantas (RSL4). En el sexto capítulo, usando expresionesregulares como modelos de sitios de unión, estudiamos la coevolución de motivosen el espacio de secuencia, mostrando cómo el tama˜no del alfabeto tiene un efectosobre el número de posiciones discriminantes óptimas y cómo los sistemas naturalestienden a optimizarse influenciadas por este parámetro. En resumen, mediante elanálisis bibliográfico y el uso de herramientas bioinformáticas modernas, estudiamosel sistema “interacción proteína-ADN”, considerando restricciones biofísicas yevolutivas. Este análisis nos ha permitido reforzar hipótesis previas, así como encontrarresultados novedosos. Esta tesis ha requerido la aplicación de teoremas y eldesarrollo de algoritmos, que son enunciados a modo de apéndice.
At the functional entity “Protein-DNA interface”, Protein and DNA are mutuallyconditioned by a co evolutive process. Since multiple molecular recognicers coexistand remain functional on a same genome withouth interfering excesively betweenthem, each recognizer is required to have especificity. They must also mantain theirfunctions over a wide range of fisico-chemical conditions. As if those where notenough difficulties, once a regulatory network has been established, there is an inercialeffect that restricts its capability to be modified (Since more parts interacting arerequired to be changed). In this work we propose to study the conditions,mechanismsand processes that are determinant to this fenomena. This thesis can be divided intoseven stages, each corresponding to a chapter. In the first chapter we began by collectingsystematically information on the living conditions of extremophiles, especially Archaea. In the second chapter, for those organisms with a genome sequenced andannotated, we calculated the composition of different regions of the genome, showingthat the apparent correlation between G + C content and optimal growth temperatureis due to a bias in the data used historically. In the third chapter we study theinformation content of the promoters in different genomes, evidencing a deviationfrom what is expected according to the molecular theory of information, proposingpossible explanations for this deviation. In the fourth chapter a similar analysis isapplied to the comparison of promoters of nuclear and mitochondrial genomes inwhich there is, in a sustained manner and in the same organism, a temperaturedifference. The fifth chapter identifies and characterizes functional genome-relatedregulation of a transcription factor involved in root growth in plants (RSL4). In thesixth chapter, by using regular expressions as models of binding sites, we study thecoevolution of motifs in sequence space, showing how the size of the alphabet hasan effect on the number of optimal discriminant positions and how natural systemstend to be optimized by this parameter. In summary, through bibliographic analysisand the use of modern bioinformatics tools, we studied the ”protein-DNA interaction”system,considering biophysical and evolutionary restrictions. This analysis hasallowed us to reinforce previous hypotheses, as well as find novel results. This thesishas required the application of theorems and the development of algorithms, whichare enunciated as an appendix.
Fil: Aptekmann, Ariel Alejandro. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
ADN
PROTEINA
CONTENIDO DE INFORMACION
MOTIVOS
EXPRESIONES REGULARES
EXTREMOFILOS
ARCHAEA
LOGOS DE SECUENCIA
DNA
PROTEIN
INFORMATION CONTENT
MOTIFFS
REGULAR EXPRESSIONS
EXTREMOPHILES
ARCHAEA
SEQUENCE LOGO
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n6389_Aptekmann

id BDUBAFCEN_5b824ee2da84e8c5af57bede3a3a83cb
oai_identifier_str tesis:tesis_n6389_Aptekmann
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Análisis evolutivo de la interacción proteína-ADNEvolutionary analysis of the protein-DNA interactionAptekmann, Ariel AlejandroADNPROTEINACONTENIDO DE INFORMACIONMOTIVOSEXPRESIONES REGULARESEXTREMOFILOSARCHAEALOGOS DE SECUENCIADNAPROTEININFORMATION CONTENTMOTIFFSREGULAR EXPRESSIONSEXTREMOPHILESARCHAEASEQUENCE LOGOEn la entidad funcional “interfaz proteína-ADN”, proteína y ADN se condicionanmutuamente en un proceso coevolutivo. El hecho de que múltiples reconocedoresmoleculares tengan que coexistir en un mismo genoma y ejercer sus funciones sininterferir con las funciones de los otros, condiciona sus requisitos de especificidady discriminación. En términos evolutivos, se observa además que pares homólogosmantienen su función en un espectro amplio de condiciones físico químicas. Se agregaa esto la dificultad de que una vez determinada una red regulatoria hay un efectoinercial, que dificulta el modificarla cuanto mas cantidad de partes interactuantesformen la misma. En este trabajo nos proponemos estudiar las condiciones, procesosy mecanismos que determinan las posibilidades de este fenómeno. Esta tesis puededividirse en siete etapas, cada una correspondiente con un capítulo. En el primercapítulo comenzamos por recopilar de forma sistemática información sobre las condicionesde vida de extremófilos, principalmente Archaea. En el segundo capítulo,para aquellos organismos con un genoma secuenciado y anotado, calculamos la composiciónde distintas regiones del genoma, evidenciando que la aparente correlaciónentre contenido de G+C y la temperatura óptima de crecimiento se debe a un sesgoen los datos usados históricamente. En el tercer capítulo estudiamos el contenido deinformación de los promotores en distintos genomas, evidenciando un desvío de loesperable de acuerdo a la teoría molecular de la información, proponiendo posiblesexplicaciones para esta desviación. En el cuarto capítulo se aplica un análisis similara la comparación de promotores de genomas nuclear y mitocondrial en los cualeshay, de manera sostenida y en un mismo organismo, una diferencia de temperatura. En el quinto capítulo se identifican y caracterizan motivos funcionales a nivel degenoma, relacionados con la regulación de un factor de transcripción involucrado encrecimiento radicular en plantas (RSL4). En el sexto capítulo, usando expresionesregulares como modelos de sitios de unión, estudiamos la coevolución de motivosen el espacio de secuencia, mostrando cómo el tama˜no del alfabeto tiene un efectosobre el número de posiciones discriminantes óptimas y cómo los sistemas naturalestienden a optimizarse influenciadas por este parámetro. En resumen, mediante elanálisis bibliográfico y el uso de herramientas bioinformáticas modernas, estudiamosel sistema “interacción proteína-ADN”, considerando restricciones biofísicas yevolutivas. Este análisis nos ha permitido reforzar hipótesis previas, así como encontrarresultados novedosos. Esta tesis ha requerido la aplicación de teoremas y eldesarrollo de algoritmos, que son enunciados a modo de apéndice.At the functional entity “Protein-DNA interface”, Protein and DNA are mutuallyconditioned by a co evolutive process. Since multiple molecular recognicers coexistand remain functional on a same genome withouth interfering excesively betweenthem, each recognizer is required to have especificity. They must also mantain theirfunctions over a wide range of fisico-chemical conditions. As if those where notenough difficulties, once a regulatory network has been established, there is an inercialeffect that restricts its capability to be modified (Since more parts interacting arerequired to be changed). In this work we propose to study the conditions,mechanismsand processes that are determinant to this fenomena. This thesis can be divided intoseven stages, each corresponding to a chapter. In the first chapter we began by collectingsystematically information on the living conditions of extremophiles, especially Archaea. In the second chapter, for those organisms with a genome sequenced andannotated, we calculated the composition of different regions of the genome, showingthat the apparent correlation between G + C content and optimal growth temperatureis due to a bias in the data used historically. In the third chapter we study theinformation content of the promoters in different genomes, evidencing a deviationfrom what is expected according to the molecular theory of information, proposingpossible explanations for this deviation. In the fourth chapter a similar analysis isapplied to the comparison of promoters of nuclear and mitochondrial genomes inwhich there is, in a sustained manner and in the same organism, a temperaturedifference. The fifth chapter identifies and characterizes functional genome-relatedregulation of a transcription factor involved in root growth in plants (RSL4). In thesixth chapter, by using regular expressions as models of binding sites, we study thecoevolution of motifs in sequence space, showing how the size of the alphabet hasan effect on the number of optimal discriminant positions and how natural systemstend to be optimized by this parameter. In summary, through bibliographic analysisand the use of modern bioinformatics tools, we studied the ”protein-DNA interaction”system,considering biophysical and evolutionary restrictions. This analysis hasallowed us to reinforce previous hypotheses, as well as find novel results. This thesishas required the application of theorems and the development of algorithms, whichare enunciated as an appendix.Fil: Aptekmann, Ariel Alejandro. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesNadra, Alejandro Daniel2018-03-23info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n6389_Aptekmannspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:41:17Ztesis:tesis_n6389_AptekmannInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:41:18.6Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Análisis evolutivo de la interacción proteína-ADN
Evolutionary analysis of the protein-DNA interaction
title Análisis evolutivo de la interacción proteína-ADN
spellingShingle Análisis evolutivo de la interacción proteína-ADN
Aptekmann, Ariel Alejandro
ADN
PROTEINA
CONTENIDO DE INFORMACION
MOTIVOS
EXPRESIONES REGULARES
EXTREMOFILOS
ARCHAEA
LOGOS DE SECUENCIA
DNA
PROTEIN
INFORMATION CONTENT
MOTIFFS
REGULAR EXPRESSIONS
EXTREMOPHILES
ARCHAEA
SEQUENCE LOGO
title_short Análisis evolutivo de la interacción proteína-ADN
title_full Análisis evolutivo de la interacción proteína-ADN
title_fullStr Análisis evolutivo de la interacción proteína-ADN
title_full_unstemmed Análisis evolutivo de la interacción proteína-ADN
title_sort Análisis evolutivo de la interacción proteína-ADN
dc.creator.none.fl_str_mv Aptekmann, Ariel Alejandro
author Aptekmann, Ariel Alejandro
author_facet Aptekmann, Ariel Alejandro
author_role author
dc.contributor.none.fl_str_mv Nadra, Alejandro Daniel
dc.subject.none.fl_str_mv ADN
PROTEINA
CONTENIDO DE INFORMACION
MOTIVOS
EXPRESIONES REGULARES
EXTREMOFILOS
ARCHAEA
LOGOS DE SECUENCIA
DNA
PROTEIN
INFORMATION CONTENT
MOTIFFS
REGULAR EXPRESSIONS
EXTREMOPHILES
ARCHAEA
SEQUENCE LOGO
topic ADN
PROTEINA
CONTENIDO DE INFORMACION
MOTIVOS
EXPRESIONES REGULARES
EXTREMOFILOS
ARCHAEA
LOGOS DE SECUENCIA
DNA
PROTEIN
INFORMATION CONTENT
MOTIFFS
REGULAR EXPRESSIONS
EXTREMOPHILES
ARCHAEA
SEQUENCE LOGO
dc.description.none.fl_txt_mv En la entidad funcional “interfaz proteína-ADN”, proteína y ADN se condicionanmutuamente en un proceso coevolutivo. El hecho de que múltiples reconocedoresmoleculares tengan que coexistir en un mismo genoma y ejercer sus funciones sininterferir con las funciones de los otros, condiciona sus requisitos de especificidady discriminación. En términos evolutivos, se observa además que pares homólogosmantienen su función en un espectro amplio de condiciones físico químicas. Se agregaa esto la dificultad de que una vez determinada una red regulatoria hay un efectoinercial, que dificulta el modificarla cuanto mas cantidad de partes interactuantesformen la misma. En este trabajo nos proponemos estudiar las condiciones, procesosy mecanismos que determinan las posibilidades de este fenómeno. Esta tesis puededividirse en siete etapas, cada una correspondiente con un capítulo. En el primercapítulo comenzamos por recopilar de forma sistemática información sobre las condicionesde vida de extremófilos, principalmente Archaea. En el segundo capítulo,para aquellos organismos con un genoma secuenciado y anotado, calculamos la composiciónde distintas regiones del genoma, evidenciando que la aparente correlaciónentre contenido de G+C y la temperatura óptima de crecimiento se debe a un sesgoen los datos usados históricamente. En el tercer capítulo estudiamos el contenido deinformación de los promotores en distintos genomas, evidenciando un desvío de loesperable de acuerdo a la teoría molecular de la información, proponiendo posiblesexplicaciones para esta desviación. En el cuarto capítulo se aplica un análisis similara la comparación de promotores de genomas nuclear y mitocondrial en los cualeshay, de manera sostenida y en un mismo organismo, una diferencia de temperatura. En el quinto capítulo se identifican y caracterizan motivos funcionales a nivel degenoma, relacionados con la regulación de un factor de transcripción involucrado encrecimiento radicular en plantas (RSL4). En el sexto capítulo, usando expresionesregulares como modelos de sitios de unión, estudiamos la coevolución de motivosen el espacio de secuencia, mostrando cómo el tama˜no del alfabeto tiene un efectosobre el número de posiciones discriminantes óptimas y cómo los sistemas naturalestienden a optimizarse influenciadas por este parámetro. En resumen, mediante elanálisis bibliográfico y el uso de herramientas bioinformáticas modernas, estudiamosel sistema “interacción proteína-ADN”, considerando restricciones biofísicas yevolutivas. Este análisis nos ha permitido reforzar hipótesis previas, así como encontrarresultados novedosos. Esta tesis ha requerido la aplicación de teoremas y eldesarrollo de algoritmos, que son enunciados a modo de apéndice.
At the functional entity “Protein-DNA interface”, Protein and DNA are mutuallyconditioned by a co evolutive process. Since multiple molecular recognicers coexistand remain functional on a same genome withouth interfering excesively betweenthem, each recognizer is required to have especificity. They must also mantain theirfunctions over a wide range of fisico-chemical conditions. As if those where notenough difficulties, once a regulatory network has been established, there is an inercialeffect that restricts its capability to be modified (Since more parts interacting arerequired to be changed). In this work we propose to study the conditions,mechanismsand processes that are determinant to this fenomena. This thesis can be divided intoseven stages, each corresponding to a chapter. In the first chapter we began by collectingsystematically information on the living conditions of extremophiles, especially Archaea. In the second chapter, for those organisms with a genome sequenced andannotated, we calculated the composition of different regions of the genome, showingthat the apparent correlation between G + C content and optimal growth temperatureis due to a bias in the data used historically. In the third chapter we study theinformation content of the promoters in different genomes, evidencing a deviationfrom what is expected according to the molecular theory of information, proposingpossible explanations for this deviation. In the fourth chapter a similar analysis isapplied to the comparison of promoters of nuclear and mitochondrial genomes inwhich there is, in a sustained manner and in the same organism, a temperaturedifference. The fifth chapter identifies and characterizes functional genome-relatedregulation of a transcription factor involved in root growth in plants (RSL4). In thesixth chapter, by using regular expressions as models of binding sites, we study thecoevolution of motifs in sequence space, showing how the size of the alphabet hasan effect on the number of optimal discriminant positions and how natural systemstend to be optimized by this parameter. In summary, through bibliographic analysisand the use of modern bioinformatics tools, we studied the ”protein-DNA interaction”system,considering biophysical and evolutionary restrictions. This analysis hasallowed us to reinforce previous hypotheses, as well as find novel results. This thesishas required the application of theorems and the development of algorithms, whichare enunciated as an appendix.
Fil: Aptekmann, Ariel Alejandro. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description En la entidad funcional “interfaz proteína-ADN”, proteína y ADN se condicionanmutuamente en un proceso coevolutivo. El hecho de que múltiples reconocedoresmoleculares tengan que coexistir en un mismo genoma y ejercer sus funciones sininterferir con las funciones de los otros, condiciona sus requisitos de especificidady discriminación. En términos evolutivos, se observa además que pares homólogosmantienen su función en un espectro amplio de condiciones físico químicas. Se agregaa esto la dificultad de que una vez determinada una red regulatoria hay un efectoinercial, que dificulta el modificarla cuanto mas cantidad de partes interactuantesformen la misma. En este trabajo nos proponemos estudiar las condiciones, procesosy mecanismos que determinan las posibilidades de este fenómeno. Esta tesis puededividirse en siete etapas, cada una correspondiente con un capítulo. En el primercapítulo comenzamos por recopilar de forma sistemática información sobre las condicionesde vida de extremófilos, principalmente Archaea. En el segundo capítulo,para aquellos organismos con un genoma secuenciado y anotado, calculamos la composiciónde distintas regiones del genoma, evidenciando que la aparente correlaciónentre contenido de G+C y la temperatura óptima de crecimiento se debe a un sesgoen los datos usados históricamente. En el tercer capítulo estudiamos el contenido deinformación de los promotores en distintos genomas, evidenciando un desvío de loesperable de acuerdo a la teoría molecular de la información, proponiendo posiblesexplicaciones para esta desviación. En el cuarto capítulo se aplica un análisis similara la comparación de promotores de genomas nuclear y mitocondrial en los cualeshay, de manera sostenida y en un mismo organismo, una diferencia de temperatura. En el quinto capítulo se identifican y caracterizan motivos funcionales a nivel degenoma, relacionados con la regulación de un factor de transcripción involucrado encrecimiento radicular en plantas (RSL4). En el sexto capítulo, usando expresionesregulares como modelos de sitios de unión, estudiamos la coevolución de motivosen el espacio de secuencia, mostrando cómo el tama˜no del alfabeto tiene un efectosobre el número de posiciones discriminantes óptimas y cómo los sistemas naturalestienden a optimizarse influenciadas por este parámetro. En resumen, mediante elanálisis bibliográfico y el uso de herramientas bioinformáticas modernas, estudiamosel sistema “interacción proteína-ADN”, considerando restricciones biofísicas yevolutivas. Este análisis nos ha permitido reforzar hipótesis previas, así como encontrarresultados novedosos. Esta tesis ha requerido la aplicación de teoremas y eldesarrollo de algoritmos, que son enunciados a modo de apéndice.
publishDate 2018
dc.date.none.fl_str_mv 2018-03-23
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n6389_Aptekmann
url https://hdl.handle.net/20.500.12110/tesis_n6389_Aptekmann
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618703372550144
score 13.070432