Análisis evolutivo de la interacción proteína-ADN
- Autores
- Aptekmann, Ariel Alejandro
- Año de publicación
- 2018
- Idioma
- español castellano
- Tipo de recurso
- tesis doctoral
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Nadra, Alejandro Daniel
- Descripción
- En la entidad funcional “interfaz proteína-ADN”, proteína y ADN se condicionanmutuamente en un proceso coevolutivo. El hecho de que múltiples reconocedoresmoleculares tengan que coexistir en un mismo genoma y ejercer sus funciones sininterferir con las funciones de los otros, condiciona sus requisitos de especificidady discriminación. En términos evolutivos, se observa además que pares homólogosmantienen su función en un espectro amplio de condiciones físico químicas. Se agregaa esto la dificultad de que una vez determinada una red regulatoria hay un efectoinercial, que dificulta el modificarla cuanto mas cantidad de partes interactuantesformen la misma. En este trabajo nos proponemos estudiar las condiciones, procesosy mecanismos que determinan las posibilidades de este fenómeno. Esta tesis puededividirse en siete etapas, cada una correspondiente con un capítulo. En el primercapítulo comenzamos por recopilar de forma sistemática información sobre las condicionesde vida de extremófilos, principalmente Archaea. En el segundo capítulo,para aquellos organismos con un genoma secuenciado y anotado, calculamos la composiciónde distintas regiones del genoma, evidenciando que la aparente correlaciónentre contenido de G+C y la temperatura óptima de crecimiento se debe a un sesgoen los datos usados históricamente. En el tercer capítulo estudiamos el contenido deinformación de los promotores en distintos genomas, evidenciando un desvío de loesperable de acuerdo a la teoría molecular de la información, proponiendo posiblesexplicaciones para esta desviación. En el cuarto capítulo se aplica un análisis similara la comparación de promotores de genomas nuclear y mitocondrial en los cualeshay, de manera sostenida y en un mismo organismo, una diferencia de temperatura. En el quinto capítulo se identifican y caracterizan motivos funcionales a nivel degenoma, relacionados con la regulación de un factor de transcripción involucrado encrecimiento radicular en plantas (RSL4). En el sexto capítulo, usando expresionesregulares como modelos de sitios de unión, estudiamos la coevolución de motivosen el espacio de secuencia, mostrando cómo el tama˜no del alfabeto tiene un efectosobre el número de posiciones discriminantes óptimas y cómo los sistemas naturalestienden a optimizarse influenciadas por este parámetro. En resumen, mediante elanálisis bibliográfico y el uso de herramientas bioinformáticas modernas, estudiamosel sistema “interacción proteína-ADN”, considerando restricciones biofísicas yevolutivas. Este análisis nos ha permitido reforzar hipótesis previas, así como encontrarresultados novedosos. Esta tesis ha requerido la aplicación de teoremas y eldesarrollo de algoritmos, que son enunciados a modo de apéndice.
At the functional entity “Protein-DNA interface”, Protein and DNA are mutuallyconditioned by a co evolutive process. Since multiple molecular recognicers coexistand remain functional on a same genome withouth interfering excesively betweenthem, each recognizer is required to have especificity. They must also mantain theirfunctions over a wide range of fisico-chemical conditions. As if those where notenough difficulties, once a regulatory network has been established, there is an inercialeffect that restricts its capability to be modified (Since more parts interacting arerequired to be changed). In this work we propose to study the conditions,mechanismsand processes that are determinant to this fenomena. This thesis can be divided intoseven stages, each corresponding to a chapter. In the first chapter we began by collectingsystematically information on the living conditions of extremophiles, especially Archaea. In the second chapter, for those organisms with a genome sequenced andannotated, we calculated the composition of different regions of the genome, showingthat the apparent correlation between G + C content and optimal growth temperatureis due to a bias in the data used historically. In the third chapter we study theinformation content of the promoters in different genomes, evidencing a deviationfrom what is expected according to the molecular theory of information, proposingpossible explanations for this deviation. In the fourth chapter a similar analysis isapplied to the comparison of promoters of nuclear and mitochondrial genomes inwhich there is, in a sustained manner and in the same organism, a temperaturedifference. The fifth chapter identifies and characterizes functional genome-relatedregulation of a transcription factor involved in root growth in plants (RSL4). In thesixth chapter, by using regular expressions as models of binding sites, we study thecoevolution of motifs in sequence space, showing how the size of the alphabet hasan effect on the number of optimal discriminant positions and how natural systemstend to be optimized by this parameter. In summary, through bibliographic analysisand the use of modern bioinformatics tools, we studied the ”protein-DNA interaction”system,considering biophysical and evolutionary restrictions. This analysis hasallowed us to reinforce previous hypotheses, as well as find novel results. This thesishas required the application of theorems and the development of algorithms, whichare enunciated as an appendix.
Fil: Aptekmann, Ariel Alejandro. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
ADN
PROTEINA
CONTENIDO DE INFORMACION
MOTIVOS
EXPRESIONES REGULARES
EXTREMOFILOS
ARCHAEA
LOGOS DE SECUENCIA
DNA
PROTEIN
INFORMATION CONTENT
MOTIFFS
REGULAR EXPRESSIONS
EXTREMOPHILES
ARCHAEA
SEQUENCE LOGO - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- tesis:tesis_n6389_Aptekmann
Ver los metadatos del registro completo
id |
BDUBAFCEN_5b824ee2da84e8c5af57bede3a3a83cb |
---|---|
oai_identifier_str |
tesis:tesis_n6389_Aptekmann |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Análisis evolutivo de la interacción proteína-ADNEvolutionary analysis of the protein-DNA interactionAptekmann, Ariel AlejandroADNPROTEINACONTENIDO DE INFORMACIONMOTIVOSEXPRESIONES REGULARESEXTREMOFILOSARCHAEALOGOS DE SECUENCIADNAPROTEININFORMATION CONTENTMOTIFFSREGULAR EXPRESSIONSEXTREMOPHILESARCHAEASEQUENCE LOGOEn la entidad funcional “interfaz proteína-ADN”, proteína y ADN se condicionanmutuamente en un proceso coevolutivo. El hecho de que múltiples reconocedoresmoleculares tengan que coexistir en un mismo genoma y ejercer sus funciones sininterferir con las funciones de los otros, condiciona sus requisitos de especificidady discriminación. En términos evolutivos, se observa además que pares homólogosmantienen su función en un espectro amplio de condiciones físico químicas. Se agregaa esto la dificultad de que una vez determinada una red regulatoria hay un efectoinercial, que dificulta el modificarla cuanto mas cantidad de partes interactuantesformen la misma. En este trabajo nos proponemos estudiar las condiciones, procesosy mecanismos que determinan las posibilidades de este fenómeno. Esta tesis puededividirse en siete etapas, cada una correspondiente con un capítulo. En el primercapítulo comenzamos por recopilar de forma sistemática información sobre las condicionesde vida de extremófilos, principalmente Archaea. En el segundo capítulo,para aquellos organismos con un genoma secuenciado y anotado, calculamos la composiciónde distintas regiones del genoma, evidenciando que la aparente correlaciónentre contenido de G+C y la temperatura óptima de crecimiento se debe a un sesgoen los datos usados históricamente. En el tercer capítulo estudiamos el contenido deinformación de los promotores en distintos genomas, evidenciando un desvío de loesperable de acuerdo a la teoría molecular de la información, proponiendo posiblesexplicaciones para esta desviación. En el cuarto capítulo se aplica un análisis similara la comparación de promotores de genomas nuclear y mitocondrial en los cualeshay, de manera sostenida y en un mismo organismo, una diferencia de temperatura. En el quinto capítulo se identifican y caracterizan motivos funcionales a nivel degenoma, relacionados con la regulación de un factor de transcripción involucrado encrecimiento radicular en plantas (RSL4). En el sexto capítulo, usando expresionesregulares como modelos de sitios de unión, estudiamos la coevolución de motivosen el espacio de secuencia, mostrando cómo el tama˜no del alfabeto tiene un efectosobre el número de posiciones discriminantes óptimas y cómo los sistemas naturalestienden a optimizarse influenciadas por este parámetro. En resumen, mediante elanálisis bibliográfico y el uso de herramientas bioinformáticas modernas, estudiamosel sistema “interacción proteína-ADN”, considerando restricciones biofísicas yevolutivas. Este análisis nos ha permitido reforzar hipótesis previas, así como encontrarresultados novedosos. Esta tesis ha requerido la aplicación de teoremas y eldesarrollo de algoritmos, que son enunciados a modo de apéndice.At the functional entity “Protein-DNA interface”, Protein and DNA are mutuallyconditioned by a co evolutive process. Since multiple molecular recognicers coexistand remain functional on a same genome withouth interfering excesively betweenthem, each recognizer is required to have especificity. They must also mantain theirfunctions over a wide range of fisico-chemical conditions. As if those where notenough difficulties, once a regulatory network has been established, there is an inercialeffect that restricts its capability to be modified (Since more parts interacting arerequired to be changed). In this work we propose to study the conditions,mechanismsand processes that are determinant to this fenomena. This thesis can be divided intoseven stages, each corresponding to a chapter. In the first chapter we began by collectingsystematically information on the living conditions of extremophiles, especially Archaea. In the second chapter, for those organisms with a genome sequenced andannotated, we calculated the composition of different regions of the genome, showingthat the apparent correlation between G + C content and optimal growth temperatureis due to a bias in the data used historically. In the third chapter we study theinformation content of the promoters in different genomes, evidencing a deviationfrom what is expected according to the molecular theory of information, proposingpossible explanations for this deviation. In the fourth chapter a similar analysis isapplied to the comparison of promoters of nuclear and mitochondrial genomes inwhich there is, in a sustained manner and in the same organism, a temperaturedifference. The fifth chapter identifies and characterizes functional genome-relatedregulation of a transcription factor involved in root growth in plants (RSL4). In thesixth chapter, by using regular expressions as models of binding sites, we study thecoevolution of motifs in sequence space, showing how the size of the alphabet hasan effect on the number of optimal discriminant positions and how natural systemstend to be optimized by this parameter. In summary, through bibliographic analysisand the use of modern bioinformatics tools, we studied the ”protein-DNA interaction”system,considering biophysical and evolutionary restrictions. This analysis hasallowed us to reinforce previous hypotheses, as well as find novel results. This thesishas required the application of theorems and the development of algorithms, whichare enunciated as an appendix.Fil: Aptekmann, Ariel Alejandro. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesNadra, Alejandro Daniel2018-03-23info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n6389_Aptekmannspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:41:17Ztesis:tesis_n6389_AptekmannInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:41:18.6Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Análisis evolutivo de la interacción proteína-ADN Evolutionary analysis of the protein-DNA interaction |
title |
Análisis evolutivo de la interacción proteína-ADN |
spellingShingle |
Análisis evolutivo de la interacción proteína-ADN Aptekmann, Ariel Alejandro ADN PROTEINA CONTENIDO DE INFORMACION MOTIVOS EXPRESIONES REGULARES EXTREMOFILOS ARCHAEA LOGOS DE SECUENCIA DNA PROTEIN INFORMATION CONTENT MOTIFFS REGULAR EXPRESSIONS EXTREMOPHILES ARCHAEA SEQUENCE LOGO |
title_short |
Análisis evolutivo de la interacción proteína-ADN |
title_full |
Análisis evolutivo de la interacción proteína-ADN |
title_fullStr |
Análisis evolutivo de la interacción proteína-ADN |
title_full_unstemmed |
Análisis evolutivo de la interacción proteína-ADN |
title_sort |
Análisis evolutivo de la interacción proteína-ADN |
dc.creator.none.fl_str_mv |
Aptekmann, Ariel Alejandro |
author |
Aptekmann, Ariel Alejandro |
author_facet |
Aptekmann, Ariel Alejandro |
author_role |
author |
dc.contributor.none.fl_str_mv |
Nadra, Alejandro Daniel |
dc.subject.none.fl_str_mv |
ADN PROTEINA CONTENIDO DE INFORMACION MOTIVOS EXPRESIONES REGULARES EXTREMOFILOS ARCHAEA LOGOS DE SECUENCIA DNA PROTEIN INFORMATION CONTENT MOTIFFS REGULAR EXPRESSIONS EXTREMOPHILES ARCHAEA SEQUENCE LOGO |
topic |
ADN PROTEINA CONTENIDO DE INFORMACION MOTIVOS EXPRESIONES REGULARES EXTREMOFILOS ARCHAEA LOGOS DE SECUENCIA DNA PROTEIN INFORMATION CONTENT MOTIFFS REGULAR EXPRESSIONS EXTREMOPHILES ARCHAEA SEQUENCE LOGO |
dc.description.none.fl_txt_mv |
En la entidad funcional “interfaz proteína-ADN”, proteína y ADN se condicionanmutuamente en un proceso coevolutivo. El hecho de que múltiples reconocedoresmoleculares tengan que coexistir en un mismo genoma y ejercer sus funciones sininterferir con las funciones de los otros, condiciona sus requisitos de especificidady discriminación. En términos evolutivos, se observa además que pares homólogosmantienen su función en un espectro amplio de condiciones físico químicas. Se agregaa esto la dificultad de que una vez determinada una red regulatoria hay un efectoinercial, que dificulta el modificarla cuanto mas cantidad de partes interactuantesformen la misma. En este trabajo nos proponemos estudiar las condiciones, procesosy mecanismos que determinan las posibilidades de este fenómeno. Esta tesis puededividirse en siete etapas, cada una correspondiente con un capítulo. En el primercapítulo comenzamos por recopilar de forma sistemática información sobre las condicionesde vida de extremófilos, principalmente Archaea. En el segundo capítulo,para aquellos organismos con un genoma secuenciado y anotado, calculamos la composiciónde distintas regiones del genoma, evidenciando que la aparente correlaciónentre contenido de G+C y la temperatura óptima de crecimiento se debe a un sesgoen los datos usados históricamente. En el tercer capítulo estudiamos el contenido deinformación de los promotores en distintos genomas, evidenciando un desvío de loesperable de acuerdo a la teoría molecular de la información, proponiendo posiblesexplicaciones para esta desviación. En el cuarto capítulo se aplica un análisis similara la comparación de promotores de genomas nuclear y mitocondrial en los cualeshay, de manera sostenida y en un mismo organismo, una diferencia de temperatura. En el quinto capítulo se identifican y caracterizan motivos funcionales a nivel degenoma, relacionados con la regulación de un factor de transcripción involucrado encrecimiento radicular en plantas (RSL4). En el sexto capítulo, usando expresionesregulares como modelos de sitios de unión, estudiamos la coevolución de motivosen el espacio de secuencia, mostrando cómo el tama˜no del alfabeto tiene un efectosobre el número de posiciones discriminantes óptimas y cómo los sistemas naturalestienden a optimizarse influenciadas por este parámetro. En resumen, mediante elanálisis bibliográfico y el uso de herramientas bioinformáticas modernas, estudiamosel sistema “interacción proteína-ADN”, considerando restricciones biofísicas yevolutivas. Este análisis nos ha permitido reforzar hipótesis previas, así como encontrarresultados novedosos. Esta tesis ha requerido la aplicación de teoremas y eldesarrollo de algoritmos, que son enunciados a modo de apéndice. At the functional entity “Protein-DNA interface”, Protein and DNA are mutuallyconditioned by a co evolutive process. Since multiple molecular recognicers coexistand remain functional on a same genome withouth interfering excesively betweenthem, each recognizer is required to have especificity. They must also mantain theirfunctions over a wide range of fisico-chemical conditions. As if those where notenough difficulties, once a regulatory network has been established, there is an inercialeffect that restricts its capability to be modified (Since more parts interacting arerequired to be changed). In this work we propose to study the conditions,mechanismsand processes that are determinant to this fenomena. This thesis can be divided intoseven stages, each corresponding to a chapter. In the first chapter we began by collectingsystematically information on the living conditions of extremophiles, especially Archaea. In the second chapter, for those organisms with a genome sequenced andannotated, we calculated the composition of different regions of the genome, showingthat the apparent correlation between G + C content and optimal growth temperatureis due to a bias in the data used historically. In the third chapter we study theinformation content of the promoters in different genomes, evidencing a deviationfrom what is expected according to the molecular theory of information, proposingpossible explanations for this deviation. In the fourth chapter a similar analysis isapplied to the comparison of promoters of nuclear and mitochondrial genomes inwhich there is, in a sustained manner and in the same organism, a temperaturedifference. The fifth chapter identifies and characterizes functional genome-relatedregulation of a transcription factor involved in root growth in plants (RSL4). In thesixth chapter, by using regular expressions as models of binding sites, we study thecoevolution of motifs in sequence space, showing how the size of the alphabet hasan effect on the number of optimal discriminant positions and how natural systemstend to be optimized by this parameter. In summary, through bibliographic analysisand the use of modern bioinformatics tools, we studied the ”protein-DNA interaction”system,considering biophysical and evolutionary restrictions. This analysis hasallowed us to reinforce previous hypotheses, as well as find novel results. This thesishas required the application of theorems and the development of algorithms, whichare enunciated as an appendix. Fil: Aptekmann, Ariel Alejandro. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
En la entidad funcional “interfaz proteína-ADN”, proteína y ADN se condicionanmutuamente en un proceso coevolutivo. El hecho de que múltiples reconocedoresmoleculares tengan que coexistir en un mismo genoma y ejercer sus funciones sininterferir con las funciones de los otros, condiciona sus requisitos de especificidady discriminación. En términos evolutivos, se observa además que pares homólogosmantienen su función en un espectro amplio de condiciones físico químicas. Se agregaa esto la dificultad de que una vez determinada una red regulatoria hay un efectoinercial, que dificulta el modificarla cuanto mas cantidad de partes interactuantesformen la misma. En este trabajo nos proponemos estudiar las condiciones, procesosy mecanismos que determinan las posibilidades de este fenómeno. Esta tesis puededividirse en siete etapas, cada una correspondiente con un capítulo. En el primercapítulo comenzamos por recopilar de forma sistemática información sobre las condicionesde vida de extremófilos, principalmente Archaea. En el segundo capítulo,para aquellos organismos con un genoma secuenciado y anotado, calculamos la composiciónde distintas regiones del genoma, evidenciando que la aparente correlaciónentre contenido de G+C y la temperatura óptima de crecimiento se debe a un sesgoen los datos usados históricamente. En el tercer capítulo estudiamos el contenido deinformación de los promotores en distintos genomas, evidenciando un desvío de loesperable de acuerdo a la teoría molecular de la información, proponiendo posiblesexplicaciones para esta desviación. En el cuarto capítulo se aplica un análisis similara la comparación de promotores de genomas nuclear y mitocondrial en los cualeshay, de manera sostenida y en un mismo organismo, una diferencia de temperatura. En el quinto capítulo se identifican y caracterizan motivos funcionales a nivel degenoma, relacionados con la regulación de un factor de transcripción involucrado encrecimiento radicular en plantas (RSL4). En el sexto capítulo, usando expresionesregulares como modelos de sitios de unión, estudiamos la coevolución de motivosen el espacio de secuencia, mostrando cómo el tama˜no del alfabeto tiene un efectosobre el número de posiciones discriminantes óptimas y cómo los sistemas naturalestienden a optimizarse influenciadas por este parámetro. En resumen, mediante elanálisis bibliográfico y el uso de herramientas bioinformáticas modernas, estudiamosel sistema “interacción proteína-ADN”, considerando restricciones biofísicas yevolutivas. Este análisis nos ha permitido reforzar hipótesis previas, así como encontrarresultados novedosos. Esta tesis ha requerido la aplicación de teoremas y eldesarrollo de algoritmos, que son enunciados a modo de apéndice. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-03-23 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/doctoralThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_db06 info:ar-repo/semantics/tesisDoctoral |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/tesis_n6389_Aptekmann |
url |
https://hdl.handle.net/20.500.12110/tesis_n6389_Aptekmann |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1844618703372550144 |
score |
13.070432 |