Abstract:
En la entidad funcional “interfaz proteína-ADN”, proteína y ADN se condicionan mutuamente en un proceso coevolutivo. El hecho de que múltiples reconocedores moleculares tengan que coexistir en un mismo genoma y ejercer sus funciones sin interferir con las funciones de los otros, condiciona sus requisitos de especificidad y discriminación. En términos evolutivos, se observa además que pares homólogos mantienen su función en un espectro amplio de condiciones físico químicas. Se agrega a esto la dificultad de que una vez determinada una red regulatoria hay un efecto inercial, que dificulta el modificarla cuanto mas cantidad de partes interactuantes formen la misma. En este trabajo nos proponemos estudiar las condiciones, procesos y mecanismos que determinan las posibilidades de este fenómeno. Esta tesis puede dividirse en siete etapas, cada una correspondiente con un capítulo. En el primer capítulo comenzamos por recopilar de forma sistemática información sobre las condiciones de vida de extremófilos, principalmente Archaea. En el segundo capítulo, para aquellos organismos con un genoma secuenciado y anotado, calculamos la composición de distintas regiones del genoma, evidenciando que la aparente correlación entre contenido de G+C y la temperatura óptima de crecimiento se debe a un sesgo en los datos usados históricamente. En el tercer capítulo estudiamos el contenido de información de los promotores en distintos genomas, evidenciando un desvío de lo esperable de acuerdo a la teoría molecular de la información, proponiendo posibles explicaciones para esta desviación. En el cuarto capítulo se aplica un análisis similar a la comparación de promotores de genomas nuclear y mitocondrial en los cuales hay, de manera sostenida y en un mismo organismo, una diferencia de temperatura. En el quinto capítulo se identifican y caracterizan motivos funcionales a nivel de genoma, relacionados con la regulación de un factor de transcripción involucrado en crecimiento radicular en plantas (RSL4). En el sexto capítulo, usando expresiones regulares como modelos de sitios de unión, estudiamos la coevolución de motivos en el espacio de secuencia, mostrando cómo el tama˜no del alfabeto tiene un efecto sobre el número de posiciones discriminantes óptimas y cómo los sistemas naturales tienden a optimizarse influenciadas por este parámetro. En resumen, mediante el análisis bibliográfico y el uso de herramientas bioinformáticas modernas, estudiamos el sistema “interacción proteína-ADN”, considerando restricciones biofísicas y evolutivas. Este análisis nos ha permitido reforzar hipótesis previas, así como encontrar resultados novedosos. Esta tesis ha requerido la aplicación de teoremas y el desarrollo de algoritmos, que son enunciados a modo de apéndice.
At the functional entity “Protein-DNA interface”, Protein and DNA are mutually conditioned by a co evolutive process. Since multiple molecular recognicers coexist and remain functional on a same genome withouth interfering excesively between them, each recognizer is required to have especificity. They must also mantain their functions over a wide range of fisico-chemical conditions. As if those where not enough difficulties, once a regulatory network has been established, there is an inercial effect that restricts its capability to be modified (Since more parts interacting are required to be changed). In this work we propose to study the conditions,mechanisms and processes that are determinant to this fenomena. This thesis can be divided into seven stages, each corresponding to a chapter. In the first chapter we began by collecting systematically information on the living conditions of extremophiles, especially Archaea. In the second chapter, for those organisms with a genome sequenced and annotated, we calculated the composition of different regions of the genome, showing that the apparent correlation between G + C content and optimal growth temperature is due to a bias in the data used historically. In the third chapter we study the information content of the promoters in different genomes, evidencing a deviation from what is expected according to the molecular theory of information, proposing possible explanations for this deviation. In the fourth chapter a similar analysis is applied to the comparison of promoters of nuclear and mitochondrial genomes in which there is, in a sustained manner and in the same organism, a temperature difference. The fifth chapter identifies and characterizes functional genome-related regulation of a transcription factor involved in root growth in plants (RSL4). In the sixth chapter, by using regular expressions as models of binding sites, we study the coevolution of motifs in sequence space, showing how the size of the alphabet has an effect on the number of optimal discriminant positions and how natural systems tend to be optimized by this parameter. In summary, through bibliographic analysis and the use of modern bioinformatics tools, we studied the ”protein-DNA interaction”system, considering biophysical and evolutionary restrictions. This analysis has allowed us to reinforce previous hypotheses, as well as find novel results. This thesis has required the application of theorems and the development of algorithms, which are enunciated as an appendix.
Author affiliation: Aptekmann, Ariel Alejandro. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Repository: Biblioteca Digital (UBA-FCEN). Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales