Efectos fenotípicos de variantes génicas en genes asociados a cardiopatías congénitas

Autores
Kolomenski, Jorge Emilio
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión publicada
Colaborador/a o director/a de tesis
Nadra, Alejandro Daniel
Dain, Liliana Beatriz
Descripción
Las cardiopatías congénitas (CC) abarcan un amplio espectro de anomalías en la estructura del corazón y los grandes vasos. Tienen una prevalencia mundial que oscila entre 6 y 9 de cada 1000 nacimientos y se destacan como causa de muerte prenatal, neonatal e infantil y de morbilidad en edad pediátrica. El gen NKX2-5 codifica para un factor de transcripción crucial para el desarrollo del corazón. Es el primer factor de transcripción para el cual se observó una asociación entre sus variantes génicas (VGs) y el desarrollo de CC. Desde entonces, se han descrito múltiples variantes en NKX2-5 potencialmente causales de CC. En este trabajo nos propusimos desarrollar un flujo de trabajo para VGs de NKX2-5 que permita el estudio predictivo de su patogenicidad y su interacción con otras proteínas que se asocien funcionalmente en el desarrollo del corazón. Se recopilaron todas las VGs de NKX2-5 de bases de datos, publicaciones científicas y trabajos previos incluyendo variantes de pacientes del Centro Nacional de Genética Médica. También se caracterizaron todas las variantes de cambio de sentido posibles de la región estructurada de NKX2-5 (el homeodominio, HD). Por último, se caracterizaron todos los sitios de unión de NKX2-5 en el genoma humano y de ratón, así como los sitios de unión cercanos de 6 factores de transcripción relacionados, y se estudiaron los Gene Ontology terms (GO-terms) de genes cercanos. De esta forma, se recopilaron 1389 VGs de NKX2-5, de las cuales 144 fueron clasificadas como patogénicas. Estudiando su distribución, observamos una concentración de variantes clasificadas como patogénicas en la tercera alfa hélice del HD, la cual está en contacto con el ADN. Haciendo foco en fenotipos específicos, analizamos los fenotipos más comúnmente asociados a VGs patogénicas de NKX2-5 y su distribución a lo largo del gen. Observamos una abundancia de fenotipos asociados con comunicación interauricular, comunicación interventricular y bloqueo atrioventricular. Otros fenotipos presentaron frecuencias menores al 20%. En particular, se destacó la sobrerrepresentación de bloqueo atrioventricular en VGs de gran efecto en NKX2-5 y la distribución de VGs asociadas a Tetralogía de Fallot principalmente fuera del homeodominio. Se complementó el estudio realizado con el análisis de las 337 VGs de cambio de sentido posibles en el HD, para las cuales definimos una jerarquía de potenciales efectos en la funcionalidad de NKX2-5. Con estos resultados, estimamos una explicación funcional para 29 de las 36 VGs patogénicas de cambio de sentido del HD, y propusimos los potenciales efectos para 186 de las 301 VGs restantes, basándonos en predicciones in silico. Por otro lado, se recopilaron sitios de unión de NKX2-5 a partir de estudios de ChIP-seq. Para el genoma humano se obtuvieron 7730 potenciales sitios y 3130 en ratón, con 1021 y 1257 genes cercanos probablemente regulados por NKX2-5, respectivamente. Para cada uno de estos sitios, se analizó también la co-ocurrencia de sitios de unión de otros 6 factores de transcripción (TBX20, MEIS1, TGIF1, GATA4, TAL1, MAF) y se registraron GO-terms de genes cercanos. De este análisis se seleccionaron 21 genes de interés para los cuales se investigó su asociación a CC. Con el estudio de VGs patogénicas, los distintos genes seleccionados y sus fenotipos patogénicos asociados, se sugirieron genes y vías funcionales de interés para estudios a futuro, entre ellos, TBX5 para el estudio de fenotipos relacionados a bloqueo atrioventricular y ZIC3 para el estudio de fenotipos relacionados a heterotaxia. Por último, se creó un flujo de trabajo con la potencialidad de ser aplicado a otros genes y se definió una lista de genes sugeridos para estudiar de esta manera. En resumen, mediante un análisis exhaustivo de sitios de unión al genoma, genes potencialmente regulados, así como la contribución biológica de todas las posibles variantes de cambio de sentido en el HD, nuestros resultados contribuyen a reducir la brecha en el entendimiento de la relación genotipo-fenotipo entre VGs en NKX2-5 y CC. Asimismo, fue posible definir posibles mecanismos implicados en el desarrollo de CC a partir de interacciones con otros factores de transcripción y proponer un flujo de trabajo y genes de interés para aplicarlo y direccionar futuros estudios in vitro, así como de casos clínicos.
Congenital heart defects (CHD) encompass a broad spectrum of anomalies in the structure of the heart and great vessels. They affect between 6 and 9 births worldwide and stand out as a cause of prenatal, neonatal and infant death and pediatric morbidity. The NKX2-5 gene encodes for a transcription factor that is a key factor in heart development. It’s the first transcription factor for which an association between its genetic variants (GVs) and CHD development was observed. Since then, multiple NKX2-5 GVs have been observed to potentially cause CHD. In this work, we developed a pipeline to study NKX2-5 GVs to allow the predictive study of its pathogenicity and its interaction with other proteins that are also functionally associated with heart development. In order to do this, we gathered all of NKX2-5’s GVs from public databases, scientific papers and previous works including variants from Centro Nacional de Genética Médica patients. We also characterized all the possible missense variants in the structured region of NKX2-5, the homeodomain (HD). Lastly, we compiled all of NKX2-5’s binding sites in the human and mouse genomes, as well as nearby binding sites from other 6 transcription factors that are closely associated with NKX2-5, and we studied the nearby genes’ Gene Ontology (GO) terms. With this analysis, we compiled 1389 NKX2-5 GVs, of which 144 were classified as pathogenic. Studying their distribution, we observed that pathogenic variants were concentrated in the third alpha-helix of the HD, which is in contact with the DNA. Regarding specific phenotypes, we were able to describe the phenotypes most commonly associated with pathogenic GVs in NKX2-5 and their distribution. In this way, we were able to observe an abundance of atrial septal defects, ventricular septal defects and atrioventricular block, with other phenotypes being associated with less than 20% of pathogenic GVs. Of note, we found an overrepresentation of atrioventricular block in GVs with big effects on the NKX2-5 protein. We also observed that most pathogenic GVs associated with Tetralogy of Fallot were located outside of the homeodomain. We further complemented the study with the analysis of the 337 possible missense GVs in the NKX2-5 HD, for which we defined a hierarchy of potential effects on normal NKX2-5 functionality. With these results, we were able to estimate a functional explanation for 29 of the 36 pathogenic missense GVs in the HD, and we proposed potential effects for 186 of the 301 remaining GVs, going by our in silico predictors. In addition, we compiled NKX2-5 binding sites in human and mouse genomes from ChIP-seq studies. We obtained 7730 binding sites in human cells and 3130 in mice, with 1021 and 1257 nearby genes that are probably regulated by NKX2-5, respectively. For each one of these sites, we also analyzed co-occurrence of binding sites of 6 other transcription factors (TBX20, MEIS1, TGIF1, GATA4, TAL1, MAF), recorded the GO-terms of nearby genes and selected 21 genes to study their association with CHD. With the study of pathogenic GVs, selected genes and their associated pathogenic phenotypes, we proposed genes and functional pathways of interest to future studies. These are TBX5 for the study of atrioventricular block associated phenotypes and ZIC3 for the study of heterotaxy associated phenotypes. Lastly, we created a workflow that could be applied to other genes and defined a list of suggested genes to be studied with it. In summary, our results help to narrow the gap in our understanding of the genotype-phenotype between NKX2-5 GVs and CHD, contributing with an exhaustive analysis of genome binding sites, potentially regulated genes, as well as the biological contribution of all possible missense variants in the HD, accessible for future clinical cases. On the other hand, defining CHD development pathways from interaction with other transcription factors and proposing a workflow and interesting genes to apply it on to direct future studies.
Fil: Kolomenski, Jorge Emilio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
NKX2-5
CARDIOPATIAS CONGENITAS
VARIANTES GENICAS
SITIOS DE UNION
FACTORES DE TRANSCRIPCION
NKX2-5
CONGENITAL HEART DEFECTS
GENETIC VARIANTS
BINDING SITES
TRANSCRIPTION FACTORS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n7679_Kolomenski

id BDUBAFCEN_56fb033ab72d6dbe77b231f20967f166
oai_identifier_str tesis:tesis_n7679_Kolomenski
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Efectos fenotípicos de variantes génicas en genes asociados a cardiopatías congénitasPhenotypic effect of genetic variants in genes associated with congenital heart diseaseKolomenski, Jorge EmilioNKX2-5CARDIOPATIAS CONGENITASVARIANTES GENICASSITIOS DE UNIONFACTORES DE TRANSCRIPCIONNKX2-5CONGENITAL HEART DEFECTSGENETIC VARIANTSBINDING SITESTRANSCRIPTION FACTORSLas cardiopatías congénitas (CC) abarcan un amplio espectro de anomalías en la estructura del corazón y los grandes vasos. Tienen una prevalencia mundial que oscila entre 6 y 9 de cada 1000 nacimientos y se destacan como causa de muerte prenatal, neonatal e infantil y de morbilidad en edad pediátrica. El gen NKX2-5 codifica para un factor de transcripción crucial para el desarrollo del corazón. Es el primer factor de transcripción para el cual se observó una asociación entre sus variantes génicas (VGs) y el desarrollo de CC. Desde entonces, se han descrito múltiples variantes en NKX2-5 potencialmente causales de CC. En este trabajo nos propusimos desarrollar un flujo de trabajo para VGs de NKX2-5 que permita el estudio predictivo de su patogenicidad y su interacción con otras proteínas que se asocien funcionalmente en el desarrollo del corazón. Se recopilaron todas las VGs de NKX2-5 de bases de datos, publicaciones científicas y trabajos previos incluyendo variantes de pacientes del Centro Nacional de Genética Médica. También se caracterizaron todas las variantes de cambio de sentido posibles de la región estructurada de NKX2-5 (el homeodominio, HD). Por último, se caracterizaron todos los sitios de unión de NKX2-5 en el genoma humano y de ratón, así como los sitios de unión cercanos de 6 factores de transcripción relacionados, y se estudiaron los Gene Ontology terms (GO-terms) de genes cercanos. De esta forma, se recopilaron 1389 VGs de NKX2-5, de las cuales 144 fueron clasificadas como patogénicas. Estudiando su distribución, observamos una concentración de variantes clasificadas como patogénicas en la tercera alfa hélice del HD, la cual está en contacto con el ADN. Haciendo foco en fenotipos específicos, analizamos los fenotipos más comúnmente asociados a VGs patogénicas de NKX2-5 y su distribución a lo largo del gen. Observamos una abundancia de fenotipos asociados con comunicación interauricular, comunicación interventricular y bloqueo atrioventricular. Otros fenotipos presentaron frecuencias menores al 20%. En particular, se destacó la sobrerrepresentación de bloqueo atrioventricular en VGs de gran efecto en NKX2-5 y la distribución de VGs asociadas a Tetralogía de Fallot principalmente fuera del homeodominio. Se complementó el estudio realizado con el análisis de las 337 VGs de cambio de sentido posibles en el HD, para las cuales definimos una jerarquía de potenciales efectos en la funcionalidad de NKX2-5. Con estos resultados, estimamos una explicación funcional para 29 de las 36 VGs patogénicas de cambio de sentido del HD, y propusimos los potenciales efectos para 186 de las 301 VGs restantes, basándonos en predicciones in silico. Por otro lado, se recopilaron sitios de unión de NKX2-5 a partir de estudios de ChIP-seq. Para el genoma humano se obtuvieron 7730 potenciales sitios y 3130 en ratón, con 1021 y 1257 genes cercanos probablemente regulados por NKX2-5, respectivamente. Para cada uno de estos sitios, se analizó también la co-ocurrencia de sitios de unión de otros 6 factores de transcripción (TBX20, MEIS1, TGIF1, GATA4, TAL1, MAF) y se registraron GO-terms de genes cercanos. De este análisis se seleccionaron 21 genes de interés para los cuales se investigó su asociación a CC. Con el estudio de VGs patogénicas, los distintos genes seleccionados y sus fenotipos patogénicos asociados, se sugirieron genes y vías funcionales de interés para estudios a futuro, entre ellos, TBX5 para el estudio de fenotipos relacionados a bloqueo atrioventricular y ZIC3 para el estudio de fenotipos relacionados a heterotaxia. Por último, se creó un flujo de trabajo con la potencialidad de ser aplicado a otros genes y se definió una lista de genes sugeridos para estudiar de esta manera. En resumen, mediante un análisis exhaustivo de sitios de unión al genoma, genes potencialmente regulados, así como la contribución biológica de todas las posibles variantes de cambio de sentido en el HD, nuestros resultados contribuyen a reducir la brecha en el entendimiento de la relación genotipo-fenotipo entre VGs en NKX2-5 y CC. Asimismo, fue posible definir posibles mecanismos implicados en el desarrollo de CC a partir de interacciones con otros factores de transcripción y proponer un flujo de trabajo y genes de interés para aplicarlo y direccionar futuros estudios in vitro, así como de casos clínicos.Congenital heart defects (CHD) encompass a broad spectrum of anomalies in the structure of the heart and great vessels. They affect between 6 and 9 births worldwide and stand out as a cause of prenatal, neonatal and infant death and pediatric morbidity. The NKX2-5 gene encodes for a transcription factor that is a key factor in heart development. It’s the first transcription factor for which an association between its genetic variants (GVs) and CHD development was observed. Since then, multiple NKX2-5 GVs have been observed to potentially cause CHD. In this work, we developed a pipeline to study NKX2-5 GVs to allow the predictive study of its pathogenicity and its interaction with other proteins that are also functionally associated with heart development. In order to do this, we gathered all of NKX2-5’s GVs from public databases, scientific papers and previous works including variants from Centro Nacional de Genética Médica patients. We also characterized all the possible missense variants in the structured region of NKX2-5, the homeodomain (HD). Lastly, we compiled all of NKX2-5’s binding sites in the human and mouse genomes, as well as nearby binding sites from other 6 transcription factors that are closely associated with NKX2-5, and we studied the nearby genes’ Gene Ontology (GO) terms. With this analysis, we compiled 1389 NKX2-5 GVs, of which 144 were classified as pathogenic. Studying their distribution, we observed that pathogenic variants were concentrated in the third alpha-helix of the HD, which is in contact with the DNA. Regarding specific phenotypes, we were able to describe the phenotypes most commonly associated with pathogenic GVs in NKX2-5 and their distribution. In this way, we were able to observe an abundance of atrial septal defects, ventricular septal defects and atrioventricular block, with other phenotypes being associated with less than 20% of pathogenic GVs. Of note, we found an overrepresentation of atrioventricular block in GVs with big effects on the NKX2-5 protein. We also observed that most pathogenic GVs associated with Tetralogy of Fallot were located outside of the homeodomain. We further complemented the study with the analysis of the 337 possible missense GVs in the NKX2-5 HD, for which we defined a hierarchy of potential effects on normal NKX2-5 functionality. With these results, we were able to estimate a functional explanation for 29 of the 36 pathogenic missense GVs in the HD, and we proposed potential effects for 186 of the 301 remaining GVs, going by our in silico predictors. In addition, we compiled NKX2-5 binding sites in human and mouse genomes from ChIP-seq studies. We obtained 7730 binding sites in human cells and 3130 in mice, with 1021 and 1257 nearby genes that are probably regulated by NKX2-5, respectively. For each one of these sites, we also analyzed co-occurrence of binding sites of 6 other transcription factors (TBX20, MEIS1, TGIF1, GATA4, TAL1, MAF), recorded the GO-terms of nearby genes and selected 21 genes to study their association with CHD. With the study of pathogenic GVs, selected genes and their associated pathogenic phenotypes, we proposed genes and functional pathways of interest to future studies. These are TBX5 for the study of atrioventricular block associated phenotypes and ZIC3 for the study of heterotaxy associated phenotypes. Lastly, we created a workflow that could be applied to other genes and defined a list of suggested genes to be studied with it. In summary, our results help to narrow the gap in our understanding of the genotype-phenotype between NKX2-5 GVs and CHD, contributing with an exhaustive analysis of genome binding sites, potentially regulated genes, as well as the biological contribution of all possible missense variants in the HD, accessible for future clinical cases. On the other hand, defining CHD development pathways from interaction with other transcription factors and proposing a workflow and interesting genes to apply it on to direct future studies.Fil: Kolomenski, Jorge Emilio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesNadra, Alejandro DanielDain, Liliana Beatriz2019-12-19info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n7679_Kolomenskispainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:42:27Ztesis:tesis_n7679_KolomenskiInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:42:28.169Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Efectos fenotípicos de variantes génicas en genes asociados a cardiopatías congénitas
Phenotypic effect of genetic variants in genes associated with congenital heart disease
title Efectos fenotípicos de variantes génicas en genes asociados a cardiopatías congénitas
spellingShingle Efectos fenotípicos de variantes génicas en genes asociados a cardiopatías congénitas
Kolomenski, Jorge Emilio
NKX2-5
CARDIOPATIAS CONGENITAS
VARIANTES GENICAS
SITIOS DE UNION
FACTORES DE TRANSCRIPCION
NKX2-5
CONGENITAL HEART DEFECTS
GENETIC VARIANTS
BINDING SITES
TRANSCRIPTION FACTORS
title_short Efectos fenotípicos de variantes génicas en genes asociados a cardiopatías congénitas
title_full Efectos fenotípicos de variantes génicas en genes asociados a cardiopatías congénitas
title_fullStr Efectos fenotípicos de variantes génicas en genes asociados a cardiopatías congénitas
title_full_unstemmed Efectos fenotípicos de variantes génicas en genes asociados a cardiopatías congénitas
title_sort Efectos fenotípicos de variantes génicas en genes asociados a cardiopatías congénitas
dc.creator.none.fl_str_mv Kolomenski, Jorge Emilio
author Kolomenski, Jorge Emilio
author_facet Kolomenski, Jorge Emilio
author_role author
dc.contributor.none.fl_str_mv Nadra, Alejandro Daniel
Dain, Liliana Beatriz
dc.subject.none.fl_str_mv NKX2-5
CARDIOPATIAS CONGENITAS
VARIANTES GENICAS
SITIOS DE UNION
FACTORES DE TRANSCRIPCION
NKX2-5
CONGENITAL HEART DEFECTS
GENETIC VARIANTS
BINDING SITES
TRANSCRIPTION FACTORS
topic NKX2-5
CARDIOPATIAS CONGENITAS
VARIANTES GENICAS
SITIOS DE UNION
FACTORES DE TRANSCRIPCION
NKX2-5
CONGENITAL HEART DEFECTS
GENETIC VARIANTS
BINDING SITES
TRANSCRIPTION FACTORS
dc.description.none.fl_txt_mv Las cardiopatías congénitas (CC) abarcan un amplio espectro de anomalías en la estructura del corazón y los grandes vasos. Tienen una prevalencia mundial que oscila entre 6 y 9 de cada 1000 nacimientos y se destacan como causa de muerte prenatal, neonatal e infantil y de morbilidad en edad pediátrica. El gen NKX2-5 codifica para un factor de transcripción crucial para el desarrollo del corazón. Es el primer factor de transcripción para el cual se observó una asociación entre sus variantes génicas (VGs) y el desarrollo de CC. Desde entonces, se han descrito múltiples variantes en NKX2-5 potencialmente causales de CC. En este trabajo nos propusimos desarrollar un flujo de trabajo para VGs de NKX2-5 que permita el estudio predictivo de su patogenicidad y su interacción con otras proteínas que se asocien funcionalmente en el desarrollo del corazón. Se recopilaron todas las VGs de NKX2-5 de bases de datos, publicaciones científicas y trabajos previos incluyendo variantes de pacientes del Centro Nacional de Genética Médica. También se caracterizaron todas las variantes de cambio de sentido posibles de la región estructurada de NKX2-5 (el homeodominio, HD). Por último, se caracterizaron todos los sitios de unión de NKX2-5 en el genoma humano y de ratón, así como los sitios de unión cercanos de 6 factores de transcripción relacionados, y se estudiaron los Gene Ontology terms (GO-terms) de genes cercanos. De esta forma, se recopilaron 1389 VGs de NKX2-5, de las cuales 144 fueron clasificadas como patogénicas. Estudiando su distribución, observamos una concentración de variantes clasificadas como patogénicas en la tercera alfa hélice del HD, la cual está en contacto con el ADN. Haciendo foco en fenotipos específicos, analizamos los fenotipos más comúnmente asociados a VGs patogénicas de NKX2-5 y su distribución a lo largo del gen. Observamos una abundancia de fenotipos asociados con comunicación interauricular, comunicación interventricular y bloqueo atrioventricular. Otros fenotipos presentaron frecuencias menores al 20%. En particular, se destacó la sobrerrepresentación de bloqueo atrioventricular en VGs de gran efecto en NKX2-5 y la distribución de VGs asociadas a Tetralogía de Fallot principalmente fuera del homeodominio. Se complementó el estudio realizado con el análisis de las 337 VGs de cambio de sentido posibles en el HD, para las cuales definimos una jerarquía de potenciales efectos en la funcionalidad de NKX2-5. Con estos resultados, estimamos una explicación funcional para 29 de las 36 VGs patogénicas de cambio de sentido del HD, y propusimos los potenciales efectos para 186 de las 301 VGs restantes, basándonos en predicciones in silico. Por otro lado, se recopilaron sitios de unión de NKX2-5 a partir de estudios de ChIP-seq. Para el genoma humano se obtuvieron 7730 potenciales sitios y 3130 en ratón, con 1021 y 1257 genes cercanos probablemente regulados por NKX2-5, respectivamente. Para cada uno de estos sitios, se analizó también la co-ocurrencia de sitios de unión de otros 6 factores de transcripción (TBX20, MEIS1, TGIF1, GATA4, TAL1, MAF) y se registraron GO-terms de genes cercanos. De este análisis se seleccionaron 21 genes de interés para los cuales se investigó su asociación a CC. Con el estudio de VGs patogénicas, los distintos genes seleccionados y sus fenotipos patogénicos asociados, se sugirieron genes y vías funcionales de interés para estudios a futuro, entre ellos, TBX5 para el estudio de fenotipos relacionados a bloqueo atrioventricular y ZIC3 para el estudio de fenotipos relacionados a heterotaxia. Por último, se creó un flujo de trabajo con la potencialidad de ser aplicado a otros genes y se definió una lista de genes sugeridos para estudiar de esta manera. En resumen, mediante un análisis exhaustivo de sitios de unión al genoma, genes potencialmente regulados, así como la contribución biológica de todas las posibles variantes de cambio de sentido en el HD, nuestros resultados contribuyen a reducir la brecha en el entendimiento de la relación genotipo-fenotipo entre VGs en NKX2-5 y CC. Asimismo, fue posible definir posibles mecanismos implicados en el desarrollo de CC a partir de interacciones con otros factores de transcripción y proponer un flujo de trabajo y genes de interés para aplicarlo y direccionar futuros estudios in vitro, así como de casos clínicos.
Congenital heart defects (CHD) encompass a broad spectrum of anomalies in the structure of the heart and great vessels. They affect between 6 and 9 births worldwide and stand out as a cause of prenatal, neonatal and infant death and pediatric morbidity. The NKX2-5 gene encodes for a transcription factor that is a key factor in heart development. It’s the first transcription factor for which an association between its genetic variants (GVs) and CHD development was observed. Since then, multiple NKX2-5 GVs have been observed to potentially cause CHD. In this work, we developed a pipeline to study NKX2-5 GVs to allow the predictive study of its pathogenicity and its interaction with other proteins that are also functionally associated with heart development. In order to do this, we gathered all of NKX2-5’s GVs from public databases, scientific papers and previous works including variants from Centro Nacional de Genética Médica patients. We also characterized all the possible missense variants in the structured region of NKX2-5, the homeodomain (HD). Lastly, we compiled all of NKX2-5’s binding sites in the human and mouse genomes, as well as nearby binding sites from other 6 transcription factors that are closely associated with NKX2-5, and we studied the nearby genes’ Gene Ontology (GO) terms. With this analysis, we compiled 1389 NKX2-5 GVs, of which 144 were classified as pathogenic. Studying their distribution, we observed that pathogenic variants were concentrated in the third alpha-helix of the HD, which is in contact with the DNA. Regarding specific phenotypes, we were able to describe the phenotypes most commonly associated with pathogenic GVs in NKX2-5 and their distribution. In this way, we were able to observe an abundance of atrial septal defects, ventricular septal defects and atrioventricular block, with other phenotypes being associated with less than 20% of pathogenic GVs. Of note, we found an overrepresentation of atrioventricular block in GVs with big effects on the NKX2-5 protein. We also observed that most pathogenic GVs associated with Tetralogy of Fallot were located outside of the homeodomain. We further complemented the study with the analysis of the 337 possible missense GVs in the NKX2-5 HD, for which we defined a hierarchy of potential effects on normal NKX2-5 functionality. With these results, we were able to estimate a functional explanation for 29 of the 36 pathogenic missense GVs in the HD, and we proposed potential effects for 186 of the 301 remaining GVs, going by our in silico predictors. In addition, we compiled NKX2-5 binding sites in human and mouse genomes from ChIP-seq studies. We obtained 7730 binding sites in human cells and 3130 in mice, with 1021 and 1257 nearby genes that are probably regulated by NKX2-5, respectively. For each one of these sites, we also analyzed co-occurrence of binding sites of 6 other transcription factors (TBX20, MEIS1, TGIF1, GATA4, TAL1, MAF), recorded the GO-terms of nearby genes and selected 21 genes to study their association with CHD. With the study of pathogenic GVs, selected genes and their associated pathogenic phenotypes, we proposed genes and functional pathways of interest to future studies. These are TBX5 for the study of atrioventricular block associated phenotypes and ZIC3 for the study of heterotaxy associated phenotypes. Lastly, we created a workflow that could be applied to other genes and defined a list of suggested genes to be studied with it. In summary, our results help to narrow the gap in our understanding of the genotype-phenotype between NKX2-5 GVs and CHD, contributing with an exhaustive analysis of genome binding sites, potentially regulated genes, as well as the biological contribution of all possible missense variants in the HD, accessible for future clinical cases. On the other hand, defining CHD development pathways from interaction with other transcription factors and proposing a workflow and interesting genes to apply it on to direct future studies.
Fil: Kolomenski, Jorge Emilio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description Las cardiopatías congénitas (CC) abarcan un amplio espectro de anomalías en la estructura del corazón y los grandes vasos. Tienen una prevalencia mundial que oscila entre 6 y 9 de cada 1000 nacimientos y se destacan como causa de muerte prenatal, neonatal e infantil y de morbilidad en edad pediátrica. El gen NKX2-5 codifica para un factor de transcripción crucial para el desarrollo del corazón. Es el primer factor de transcripción para el cual se observó una asociación entre sus variantes génicas (VGs) y el desarrollo de CC. Desde entonces, se han descrito múltiples variantes en NKX2-5 potencialmente causales de CC. En este trabajo nos propusimos desarrollar un flujo de trabajo para VGs de NKX2-5 que permita el estudio predictivo de su patogenicidad y su interacción con otras proteínas que se asocien funcionalmente en el desarrollo del corazón. Se recopilaron todas las VGs de NKX2-5 de bases de datos, publicaciones científicas y trabajos previos incluyendo variantes de pacientes del Centro Nacional de Genética Médica. También se caracterizaron todas las variantes de cambio de sentido posibles de la región estructurada de NKX2-5 (el homeodominio, HD). Por último, se caracterizaron todos los sitios de unión de NKX2-5 en el genoma humano y de ratón, así como los sitios de unión cercanos de 6 factores de transcripción relacionados, y se estudiaron los Gene Ontology terms (GO-terms) de genes cercanos. De esta forma, se recopilaron 1389 VGs de NKX2-5, de las cuales 144 fueron clasificadas como patogénicas. Estudiando su distribución, observamos una concentración de variantes clasificadas como patogénicas en la tercera alfa hélice del HD, la cual está en contacto con el ADN. Haciendo foco en fenotipos específicos, analizamos los fenotipos más comúnmente asociados a VGs patogénicas de NKX2-5 y su distribución a lo largo del gen. Observamos una abundancia de fenotipos asociados con comunicación interauricular, comunicación interventricular y bloqueo atrioventricular. Otros fenotipos presentaron frecuencias menores al 20%. En particular, se destacó la sobrerrepresentación de bloqueo atrioventricular en VGs de gran efecto en NKX2-5 y la distribución de VGs asociadas a Tetralogía de Fallot principalmente fuera del homeodominio. Se complementó el estudio realizado con el análisis de las 337 VGs de cambio de sentido posibles en el HD, para las cuales definimos una jerarquía de potenciales efectos en la funcionalidad de NKX2-5. Con estos resultados, estimamos una explicación funcional para 29 de las 36 VGs patogénicas de cambio de sentido del HD, y propusimos los potenciales efectos para 186 de las 301 VGs restantes, basándonos en predicciones in silico. Por otro lado, se recopilaron sitios de unión de NKX2-5 a partir de estudios de ChIP-seq. Para el genoma humano se obtuvieron 7730 potenciales sitios y 3130 en ratón, con 1021 y 1257 genes cercanos probablemente regulados por NKX2-5, respectivamente. Para cada uno de estos sitios, se analizó también la co-ocurrencia de sitios de unión de otros 6 factores de transcripción (TBX20, MEIS1, TGIF1, GATA4, TAL1, MAF) y se registraron GO-terms de genes cercanos. De este análisis se seleccionaron 21 genes de interés para los cuales se investigó su asociación a CC. Con el estudio de VGs patogénicas, los distintos genes seleccionados y sus fenotipos patogénicos asociados, se sugirieron genes y vías funcionales de interés para estudios a futuro, entre ellos, TBX5 para el estudio de fenotipos relacionados a bloqueo atrioventricular y ZIC3 para el estudio de fenotipos relacionados a heterotaxia. Por último, se creó un flujo de trabajo con la potencialidad de ser aplicado a otros genes y se definió una lista de genes sugeridos para estudiar de esta manera. En resumen, mediante un análisis exhaustivo de sitios de unión al genoma, genes potencialmente regulados, así como la contribución biológica de todas las posibles variantes de cambio de sentido en el HD, nuestros resultados contribuyen a reducir la brecha en el entendimiento de la relación genotipo-fenotipo entre VGs en NKX2-5 y CC. Asimismo, fue posible definir posibles mecanismos implicados en el desarrollo de CC a partir de interacciones con otros factores de transcripción y proponer un flujo de trabajo y genes de interés para aplicarlo y direccionar futuros estudios in vitro, así como de casos clínicos.
publishDate 2019
dc.date.none.fl_str_mv 2019-12-19
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n7679_Kolomenski
url https://hdl.handle.net/20.500.12110/tesis_n7679_Kolomenski
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618725730287616
score 13.070432