Uso de datos de transcriptómica para la anotación de genes en el genoma de pacú (Piaractus mesopotamicus)

Autores
Posner, Victoria María
Año de publicación
2022
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión aceptada
Colaborador/a o director/a de tesis
Mascali, Florencia Victoria
Descripción
En Argentina, la producción de pacú (Piaractus mesopotamicus) ocupa el primer lugar dentro de las producciones por piscicultura de especies nativas. A pesar de la importancia de la misma, existe poca información genómica sobre esta especie, lo cual limita el desarrollo de tecnología y de programas de mejoramiento genético. En el Laboratorio Mixto de Biotecnología Acuática fueron ensamblados recientemente un genoma de referencia para hembra y uno para macho a partir de la tecnología de secuenciación corta de Illumina. Sin embargo, los mismos aún no han sido anotados. Profundizar el análisis de dichos genomas permitirá no solo aumentar el conocimiento sobre diferentes aspectos de la biología del pacú, sino que también dará lugar al diseño y desarrollo de nuevos proyectos. Es por ello que el objetivo de este trabajo fue contribuir a la anotación de dichos genomas utilizando datos de transcriptómica disponibles para esta especie. En el presente trabajo se utilizaron secuencias de un transcriptoma de músculo de pacú provenientes de un repositorio público. Se realizó un análisis de calidad de las secuencias crudas y luego se ensamblaron de manera conjunta usando el programa Trinity. El análisis del ensamblado indicó que el mismo es de alta calidad, con un alto aprovechamiento de las secuencias crudas (98.84 %) y alta presencia (81.4%) de ortólogos de ciertos genes que son universales, se expresan persistentemente y se presentan casi exclusivamente como copias únicas en el genoma. Para la anotación funcional se combinaron datos de predicción de secuencias proteicas, análisis de homologías de secuencias y predicción de dominios, de péptidos señales y de familias. Al anotar el transcriptoma se encontraron 64.111 genes e isoformas, indicando una perspectiva de alta utilidad en el uso de estas secuencias para anotar los genomas. Los genomas obtenidos para un macho y una hembra de pacú a partir de tecnología Illumina se encuentran altamente fragmentados. Esto trajo como consecuencia una gran dificultad computacional en el proceso de anotación de los mismos, a pesar de trabajar en un servidor con un alto poder de cómputo. Por esto, solo se llevó a cabo una prueba de anotación de un fragmento de cada genoma. El genoma de la hembra se procesó en un 38%, anotando 5.970 genes, con un largo promedio de 4.660,44 bases. El genoma del macho, en cambio, se procesó en un 23%, anotando 4.182 genes, con un largo promedio de 3.953,42 bases A pesar de ser resultados preliminares los mismos son alentadores, ya que presentan altos niveles de calidad según el parámetro AED.
In Argentina, the production of pacú (Piaractus mesopotamicus) occupies the first place within the productions by fish farming of native species. Despite its importance, there is little genomic information on this species, which limits the development of technology and breeding programs. A female and a male reference genome were recently assembled at the Joint Aquatic Biotechnology Laboratory using Illumina short sequencing technology. However, they have not yet been annotated. Deepening the analysis of these genomes will allow not only to increase knowledge about different aspects of the biology of the pacú, but will also lead to the design and development of new projects. That is why the aim of this work was to contribute to In the present work, sequences of a pacú muscle transcriptome from a public repository were used. Quality analysis of the raw sequences was performed and these were then assembled together using the Trinity program. The analysis of the assembly indicated that it is of high quality, with a high use of raw sequences (98.84%) and a high presence (81.4%) of orthologs of certain genes that are universal, are persistently expressed and are presented almost exclusively as unique copies in the genome. Data from protein sequence prediction, sequence homology analysis, and domain, signal peptide, and family prediction were combined for functional annotation. Annotating the transcriptome found 64,111 genes and isoforms, indicating a prospect of high utility in using these sequences to annotate genomes. Genomes obtained for one male and one female pacú from Illumina technology are highly fragmented. This resulted in great computational difficulty in the annotation process, despite working on a server with high computing power. For this reason, only one annotation test of a fragment of each genome was carried out. The female genome was 38% processed, scoring 5,970 genes, with an average length of 4,660.44 bases. The male genome, on the other hand, was processed in 23%, annotating 4,182 genes, with an average length of 3,953.42 bases. Despite being preliminary results, they are encouraging, since they present high levels of quality according to the AED parameter.
Fil: Fil: Apellido, Nombre. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentina
Fil: Fil: Posner, Victoria María. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentina
Materia
Transcriptomas
Genomas
Anotación de datos
Argentina
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 Argentina)
Repositorio
RepHipUNR (UNR)
Institución
Universidad Nacional de Rosario
OAI Identificador
oai:rephip.unr.edu.ar:2133/26076

id RepHipUNR_3eb8d21a29b410e7eda230453bd01cd9
oai_identifier_str oai:rephip.unr.edu.ar:2133/26076
network_acronym_str RepHipUNR
repository_id_str 1550
network_name_str RepHipUNR (UNR)
spelling Uso de datos de transcriptómica para la anotación de genes en el genoma de pacú (Piaractus mesopotamicus)Posner, Victoria MaríaTranscriptomasGenomasAnotación de datosArgentinaEn Argentina, la producción de pacú (Piaractus mesopotamicus) ocupa el primer lugar dentro de las producciones por piscicultura de especies nativas. A pesar de la importancia de la misma, existe poca información genómica sobre esta especie, lo cual limita el desarrollo de tecnología y de programas de mejoramiento genético. En el Laboratorio Mixto de Biotecnología Acuática fueron ensamblados recientemente un genoma de referencia para hembra y uno para macho a partir de la tecnología de secuenciación corta de Illumina. Sin embargo, los mismos aún no han sido anotados. Profundizar el análisis de dichos genomas permitirá no solo aumentar el conocimiento sobre diferentes aspectos de la biología del pacú, sino que también dará lugar al diseño y desarrollo de nuevos proyectos. Es por ello que el objetivo de este trabajo fue contribuir a la anotación de dichos genomas utilizando datos de transcriptómica disponibles para esta especie. En el presente trabajo se utilizaron secuencias de un transcriptoma de músculo de pacú provenientes de un repositorio público. Se realizó un análisis de calidad de las secuencias crudas y luego se ensamblaron de manera conjunta usando el programa Trinity. El análisis del ensamblado indicó que el mismo es de alta calidad, con un alto aprovechamiento de las secuencias crudas (98.84 %) y alta presencia (81.4%) de ortólogos de ciertos genes que son universales, se expresan persistentemente y se presentan casi exclusivamente como copias únicas en el genoma. Para la anotación funcional se combinaron datos de predicción de secuencias proteicas, análisis de homologías de secuencias y predicción de dominios, de péptidos señales y de familias. Al anotar el transcriptoma se encontraron 64.111 genes e isoformas, indicando una perspectiva de alta utilidad en el uso de estas secuencias para anotar los genomas. Los genomas obtenidos para un macho y una hembra de pacú a partir de tecnología Illumina se encuentran altamente fragmentados. Esto trajo como consecuencia una gran dificultad computacional en el proceso de anotación de los mismos, a pesar de trabajar en un servidor con un alto poder de cómputo. Por esto, solo se llevó a cabo una prueba de anotación de un fragmento de cada genoma. El genoma de la hembra se procesó en un 38%, anotando 5.970 genes, con un largo promedio de 4.660,44 bases. El genoma del macho, en cambio, se procesó en un 23%, anotando 4.182 genes, con un largo promedio de 3.953,42 bases A pesar de ser resultados preliminares los mismos son alentadores, ya que presentan altos niveles de calidad según el parámetro AED.In Argentina, the production of pacú (Piaractus mesopotamicus) occupies the first place within the productions by fish farming of native species. Despite its importance, there is little genomic information on this species, which limits the development of technology and breeding programs. A female and a male reference genome were recently assembled at the Joint Aquatic Biotechnology Laboratory using Illumina short sequencing technology. However, they have not yet been annotated. Deepening the analysis of these genomes will allow not only to increase knowledge about different aspects of the biology of the pacú, but will also lead to the design and development of new projects. That is why the aim of this work was to contribute to In the present work, sequences of a pacú muscle transcriptome from a public repository were used. Quality analysis of the raw sequences was performed and these were then assembled together using the Trinity program. The analysis of the assembly indicated that it is of high quality, with a high use of raw sequences (98.84%) and a high presence (81.4%) of orthologs of certain genes that are universal, are persistently expressed and are presented almost exclusively as unique copies in the genome. Data from protein sequence prediction, sequence homology analysis, and domain, signal peptide, and family prediction were combined for functional annotation. Annotating the transcriptome found 64,111 genes and isoforms, indicating a prospect of high utility in using these sequences to annotate genomes. Genomes obtained for one male and one female pacú from Illumina technology are highly fragmented. This resulted in great computational difficulty in the annotation process, despite working on a server with high computing power. For this reason, only one annotation test of a fragment of each genome was carried out. The female genome was 38% processed, scoring 5,970 genes, with an average length of 4,660.44 bases. The male genome, on the other hand, was processed in 23%, annotating 4,182 genes, with an average length of 3,953.42 bases. Despite being preliminary results, they are encouraging, since they present high levels of quality according to the AED parameter.Fil: Fil: Apellido, Nombre. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; ArgentinaFil: Fil: Posner, Victoria María. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; ArgentinaFacultad de Ciencias Agrarias. Universidad Nacional de RosarioMascali, Florencia Victoria2022info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/2133/26076spainfo:eu-repo/semantics/openAccessAtribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 Argentina)http://creativecommons.org/licenses/by-nc-sa/2.5/ar/Licencia RepHipreponame:RepHipUNR (UNR)instname:Universidad Nacional de Rosario2025-10-16T09:29:56Zoai:rephip.unr.edu.ar:2133/26076instacron:UNRInstitucionalhttps://rephip.unr.edu.ar/Universidad públicaNo correspondehttps://rephip.unr.edu.ar/oai/requestrephip@unr.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:15502025-10-16 09:29:56.96RepHipUNR (UNR) - Universidad Nacional de Rosariofalse
dc.title.none.fl_str_mv Uso de datos de transcriptómica para la anotación de genes en el genoma de pacú (Piaractus mesopotamicus)
title Uso de datos de transcriptómica para la anotación de genes en el genoma de pacú (Piaractus mesopotamicus)
spellingShingle Uso de datos de transcriptómica para la anotación de genes en el genoma de pacú (Piaractus mesopotamicus)
Posner, Victoria María
Transcriptomas
Genomas
Anotación de datos
Argentina
title_short Uso de datos de transcriptómica para la anotación de genes en el genoma de pacú (Piaractus mesopotamicus)
title_full Uso de datos de transcriptómica para la anotación de genes en el genoma de pacú (Piaractus mesopotamicus)
title_fullStr Uso de datos de transcriptómica para la anotación de genes en el genoma de pacú (Piaractus mesopotamicus)
title_full_unstemmed Uso de datos de transcriptómica para la anotación de genes en el genoma de pacú (Piaractus mesopotamicus)
title_sort Uso de datos de transcriptómica para la anotación de genes en el genoma de pacú (Piaractus mesopotamicus)
dc.creator.none.fl_str_mv Posner, Victoria María
author Posner, Victoria María
author_facet Posner, Victoria María
author_role author
dc.contributor.none.fl_str_mv Mascali, Florencia Victoria
dc.subject.none.fl_str_mv Transcriptomas
Genomas
Anotación de datos
Argentina
topic Transcriptomas
Genomas
Anotación de datos
Argentina
dc.description.none.fl_txt_mv En Argentina, la producción de pacú (Piaractus mesopotamicus) ocupa el primer lugar dentro de las producciones por piscicultura de especies nativas. A pesar de la importancia de la misma, existe poca información genómica sobre esta especie, lo cual limita el desarrollo de tecnología y de programas de mejoramiento genético. En el Laboratorio Mixto de Biotecnología Acuática fueron ensamblados recientemente un genoma de referencia para hembra y uno para macho a partir de la tecnología de secuenciación corta de Illumina. Sin embargo, los mismos aún no han sido anotados. Profundizar el análisis de dichos genomas permitirá no solo aumentar el conocimiento sobre diferentes aspectos de la biología del pacú, sino que también dará lugar al diseño y desarrollo de nuevos proyectos. Es por ello que el objetivo de este trabajo fue contribuir a la anotación de dichos genomas utilizando datos de transcriptómica disponibles para esta especie. En el presente trabajo se utilizaron secuencias de un transcriptoma de músculo de pacú provenientes de un repositorio público. Se realizó un análisis de calidad de las secuencias crudas y luego se ensamblaron de manera conjunta usando el programa Trinity. El análisis del ensamblado indicó que el mismo es de alta calidad, con un alto aprovechamiento de las secuencias crudas (98.84 %) y alta presencia (81.4%) de ortólogos de ciertos genes que son universales, se expresan persistentemente y se presentan casi exclusivamente como copias únicas en el genoma. Para la anotación funcional se combinaron datos de predicción de secuencias proteicas, análisis de homologías de secuencias y predicción de dominios, de péptidos señales y de familias. Al anotar el transcriptoma se encontraron 64.111 genes e isoformas, indicando una perspectiva de alta utilidad en el uso de estas secuencias para anotar los genomas. Los genomas obtenidos para un macho y una hembra de pacú a partir de tecnología Illumina se encuentran altamente fragmentados. Esto trajo como consecuencia una gran dificultad computacional en el proceso de anotación de los mismos, a pesar de trabajar en un servidor con un alto poder de cómputo. Por esto, solo se llevó a cabo una prueba de anotación de un fragmento de cada genoma. El genoma de la hembra se procesó en un 38%, anotando 5.970 genes, con un largo promedio de 4.660,44 bases. El genoma del macho, en cambio, se procesó en un 23%, anotando 4.182 genes, con un largo promedio de 3.953,42 bases A pesar de ser resultados preliminares los mismos son alentadores, ya que presentan altos niveles de calidad según el parámetro AED.
In Argentina, the production of pacú (Piaractus mesopotamicus) occupies the first place within the productions by fish farming of native species. Despite its importance, there is little genomic information on this species, which limits the development of technology and breeding programs. A female and a male reference genome were recently assembled at the Joint Aquatic Biotechnology Laboratory using Illumina short sequencing technology. However, they have not yet been annotated. Deepening the analysis of these genomes will allow not only to increase knowledge about different aspects of the biology of the pacú, but will also lead to the design and development of new projects. That is why the aim of this work was to contribute to In the present work, sequences of a pacú muscle transcriptome from a public repository were used. Quality analysis of the raw sequences was performed and these were then assembled together using the Trinity program. The analysis of the assembly indicated that it is of high quality, with a high use of raw sequences (98.84%) and a high presence (81.4%) of orthologs of certain genes that are universal, are persistently expressed and are presented almost exclusively as unique copies in the genome. Data from protein sequence prediction, sequence homology analysis, and domain, signal peptide, and family prediction were combined for functional annotation. Annotating the transcriptome found 64,111 genes and isoforms, indicating a prospect of high utility in using these sequences to annotate genomes. Genomes obtained for one male and one female pacú from Illumina technology are highly fragmented. This resulted in great computational difficulty in the annotation process, despite working on a server with high computing power. For this reason, only one annotation test of a fragment of each genome was carried out. The female genome was 38% processed, scoring 5,970 genes, with an average length of 4,660.44 bases. The male genome, on the other hand, was processed in 23%, annotating 4,182 genes, with an average length of 3,953.42 bases. Despite being preliminary results, they are encouraging, since they present high levels of quality according to the AED parameter.
Fil: Fil: Apellido, Nombre. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentina
Fil: Fil: Posner, Victoria María. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentina
description En Argentina, la producción de pacú (Piaractus mesopotamicus) ocupa el primer lugar dentro de las producciones por piscicultura de especies nativas. A pesar de la importancia de la misma, existe poca información genómica sobre esta especie, lo cual limita el desarrollo de tecnología y de programas de mejoramiento genético. En el Laboratorio Mixto de Biotecnología Acuática fueron ensamblados recientemente un genoma de referencia para hembra y uno para macho a partir de la tecnología de secuenciación corta de Illumina. Sin embargo, los mismos aún no han sido anotados. Profundizar el análisis de dichos genomas permitirá no solo aumentar el conocimiento sobre diferentes aspectos de la biología del pacú, sino que también dará lugar al diseño y desarrollo de nuevos proyectos. Es por ello que el objetivo de este trabajo fue contribuir a la anotación de dichos genomas utilizando datos de transcriptómica disponibles para esta especie. En el presente trabajo se utilizaron secuencias de un transcriptoma de músculo de pacú provenientes de un repositorio público. Se realizó un análisis de calidad de las secuencias crudas y luego se ensamblaron de manera conjunta usando el programa Trinity. El análisis del ensamblado indicó que el mismo es de alta calidad, con un alto aprovechamiento de las secuencias crudas (98.84 %) y alta presencia (81.4%) de ortólogos de ciertos genes que son universales, se expresan persistentemente y se presentan casi exclusivamente como copias únicas en el genoma. Para la anotación funcional se combinaron datos de predicción de secuencias proteicas, análisis de homologías de secuencias y predicción de dominios, de péptidos señales y de familias. Al anotar el transcriptoma se encontraron 64.111 genes e isoformas, indicando una perspectiva de alta utilidad en el uso de estas secuencias para anotar los genomas. Los genomas obtenidos para un macho y una hembra de pacú a partir de tecnología Illumina se encuentran altamente fragmentados. Esto trajo como consecuencia una gran dificultad computacional en el proceso de anotación de los mismos, a pesar de trabajar en un servidor con un alto poder de cómputo. Por esto, solo se llevó a cabo una prueba de anotación de un fragmento de cada genoma. El genoma de la hembra se procesó en un 38%, anotando 5.970 genes, con un largo promedio de 4.660,44 bases. El genoma del macho, en cambio, se procesó en un 23%, anotando 4.182 genes, con un largo promedio de 3.953,42 bases A pesar de ser resultados preliminares los mismos son alentadores, ya que presentan altos niveles de calidad según el parámetro AED.
publishDate 2022
dc.date.none.fl_str_mv 2022
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/acceptedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str acceptedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/2133/26076
url http://hdl.handle.net/2133/26076
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 Argentina)
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Licencia RepHip
eu_rights_str_mv openAccess
rights_invalid_str_mv Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 Argentina)
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Licencia RepHip
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Facultad de Ciencias Agrarias. Universidad Nacional de Rosario
publisher.none.fl_str_mv Facultad de Ciencias Agrarias. Universidad Nacional de Rosario
dc.source.none.fl_str_mv reponame:RepHipUNR (UNR)
instname:Universidad Nacional de Rosario
reponame_str RepHipUNR (UNR)
collection RepHipUNR (UNR)
instname_str Universidad Nacional de Rosario
repository.name.fl_str_mv RepHipUNR (UNR) - Universidad Nacional de Rosario
repository.mail.fl_str_mv rephip@unr.edu.ar
_version_ 1846142925360070656
score 12.712165