A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum

Autores
Pistilli, Alejandro D.; Pratta, Guillermo Raúl; Angelone, Laura Monica; Arce, Debora Pamela
Año de publicación
2018
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
Se presenta el desarrollo de una arquitectura en pipeline que automatiza la descarga de promotores de Solanum lycopersicum desde la Sol Genomics Network y luego los analiza con los programas MEME y TOMTOM. El código está disponible en www.github.com/lalebot/pip-prom-tom y utiliza Git como software de control de versiones. Se combina el uso de threads en Python, expresiones regulares y base de datos SQLite para que conjuntamente disminuyan el tiempo de descarga de los promotores y optimicen la utilización de recursos informáticos. La metodología que presenta este trabajo es potencialmente aplicable a otras áreas biológicas.
A pipeline architecture is implemented to automatize gene promoter sequence download from tomato genome Solanum lycopersicum annotated in Sol Genomics Network. Output gene promoters can be analyzed with MEME and TOMTOM programs. The code is available at www.github.com/lalebot/pip-prom-tom and Git is used as ontrol versions software. Combined Python threads, regular expressions, and SQLite databases are used to reduce time for downloading sequences and optimize informatic resources. The methodology presented in this work is potentially applicable to other biological fields.
Fil: Pistilli, Alejandro D.. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentina
Fil: Pratta, Guillermo Raúl. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Instituto de Investigaciones en Ciencias Agrarias de Rosario. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias. Instituto de Investigaciones en Ciencias Agrarias de Rosario; Argentina
Fil: Angelone, Laura Monica. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas. Universidad Nacional de Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas; Argentina
Fil: Arce, Debora Pamela. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Instituto de Investigaciones en Ciencias Agrarias de Rosario. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias. Instituto de Investigaciones en Ciencias Agrarias de Rosario; Argentina
Materia
BIOINFORMATICS
PLANT BIOLOGY SYSTEMS
GENE EXPRESSION ANALYSIS
MEME
TOMTOM
PHYTON
SQLITE
THREADS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/94760

id CONICETDig_c35e6cb20424f77491a68412c47803e9
oai_identifier_str oai:ri.conicet.gov.ar:11336/94760
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicumPistilli, Alejandro D.Pratta, Guillermo RaúlAngelone, Laura MonicaArce, Debora PamelaBIOINFORMATICSPLANT BIOLOGY SYSTEMSGENE EXPRESSION ANALYSISMEMETOMTOMPHYTONSQLITETHREADShttps://purl.org/becyt/ford/1.2https://purl.org/becyt/ford/1https://purl.org/becyt/ford/4.1https://purl.org/becyt/ford/4Se presenta el desarrollo de una arquitectura en pipeline que automatiza la descarga de promotores de Solanum lycopersicum desde la Sol Genomics Network y luego los analiza con los programas MEME y TOMTOM. El código está disponible en www.github.com/lalebot/pip-prom-tom y utiliza Git como software de control de versiones. Se combina el uso de threads en Python, expresiones regulares y base de datos SQLite para que conjuntamente disminuyan el tiempo de descarga de los promotores y optimicen la utilización de recursos informáticos. La metodología que presenta este trabajo es potencialmente aplicable a otras áreas biológicas.A pipeline architecture is implemented to automatize gene promoter sequence download from tomato genome Solanum lycopersicum annotated in Sol Genomics Network. Output gene promoters can be analyzed with MEME and TOMTOM programs. The code is available at www.github.com/lalebot/pip-prom-tom and Git is used as ontrol versions software. Combined Python threads, regular expressions, and SQLite databases are used to reduce time for downloading sequences and optimize informatic resources. The methodology presented in this work is potentially applicable to other biological fields.Fil: Pistilli, Alejandro D.. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; ArgentinaFil: Pratta, Guillermo Raúl. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Instituto de Investigaciones en Ciencias Agrarias de Rosario. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias. Instituto de Investigaciones en Ciencias Agrarias de Rosario; ArgentinaFil: Angelone, Laura Monica. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas. Universidad Nacional de Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas; ArgentinaFil: Arce, Debora Pamela. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Instituto de Investigaciones en Ciencias Agrarias de Rosario. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias. Instituto de Investigaciones en Ciencias Agrarias de Rosario; ArgentinaSociedad Argentina de Bioingeniería2018-10info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/94760Pistilli, Alejandro D.; Pratta, Guillermo Raúl; Angelone, Laura Monica; Arce, Debora Pamela; A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum; Sociedad Argentina de Bioingeniería; Revista Argentina de Bioingeniería; 20; 10; 10-2018; 3-62591-376XCONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/http://revista.sabi.org.ar/index.php/revista/article/view/137info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-29T09:55:47Zoai:ri.conicet.gov.ar:11336/94760instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-29 09:55:47.485CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum
title A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum
spellingShingle A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum
Pistilli, Alejandro D.
BIOINFORMATICS
PLANT BIOLOGY SYSTEMS
GENE EXPRESSION ANALYSIS
MEME
TOMTOM
PHYTON
SQLITE
THREADS
title_short A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum
title_full A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum
title_fullStr A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum
title_full_unstemmed A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum
title_sort A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum
dc.creator.none.fl_str_mv Pistilli, Alejandro D.
Pratta, Guillermo Raúl
Angelone, Laura Monica
Arce, Debora Pamela
author Pistilli, Alejandro D.
author_facet Pistilli, Alejandro D.
Pratta, Guillermo Raúl
Angelone, Laura Monica
Arce, Debora Pamela
author_role author
author2 Pratta, Guillermo Raúl
Angelone, Laura Monica
Arce, Debora Pamela
author2_role author
author
author
dc.subject.none.fl_str_mv BIOINFORMATICS
PLANT BIOLOGY SYSTEMS
GENE EXPRESSION ANALYSIS
MEME
TOMTOM
PHYTON
SQLITE
THREADS
topic BIOINFORMATICS
PLANT BIOLOGY SYSTEMS
GENE EXPRESSION ANALYSIS
MEME
TOMTOM
PHYTON
SQLITE
THREADS
purl_subject.fl_str_mv https://purl.org/becyt/ford/1.2
https://purl.org/becyt/ford/1
https://purl.org/becyt/ford/4.1
https://purl.org/becyt/ford/4
dc.description.none.fl_txt_mv Se presenta el desarrollo de una arquitectura en pipeline que automatiza la descarga de promotores de Solanum lycopersicum desde la Sol Genomics Network y luego los analiza con los programas MEME y TOMTOM. El código está disponible en www.github.com/lalebot/pip-prom-tom y utiliza Git como software de control de versiones. Se combina el uso de threads en Python, expresiones regulares y base de datos SQLite para que conjuntamente disminuyan el tiempo de descarga de los promotores y optimicen la utilización de recursos informáticos. La metodología que presenta este trabajo es potencialmente aplicable a otras áreas biológicas.
A pipeline architecture is implemented to automatize gene promoter sequence download from tomato genome Solanum lycopersicum annotated in Sol Genomics Network. Output gene promoters can be analyzed with MEME and TOMTOM programs. The code is available at www.github.com/lalebot/pip-prom-tom and Git is used as ontrol versions software. Combined Python threads, regular expressions, and SQLite databases are used to reduce time for downloading sequences and optimize informatic resources. The methodology presented in this work is potentially applicable to other biological fields.
Fil: Pistilli, Alejandro D.. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentina
Fil: Pratta, Guillermo Raúl. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Instituto de Investigaciones en Ciencias Agrarias de Rosario. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias. Instituto de Investigaciones en Ciencias Agrarias de Rosario; Argentina
Fil: Angelone, Laura Monica. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas. Universidad Nacional de Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas; Argentina
Fil: Arce, Debora Pamela. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Instituto de Investigaciones en Ciencias Agrarias de Rosario. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias. Instituto de Investigaciones en Ciencias Agrarias de Rosario; Argentina
description Se presenta el desarrollo de una arquitectura en pipeline que automatiza la descarga de promotores de Solanum lycopersicum desde la Sol Genomics Network y luego los analiza con los programas MEME y TOMTOM. El código está disponible en www.github.com/lalebot/pip-prom-tom y utiliza Git como software de control de versiones. Se combina el uso de threads en Python, expresiones regulares y base de datos SQLite para que conjuntamente disminuyan el tiempo de descarga de los promotores y optimicen la utilización de recursos informáticos. La metodología que presenta este trabajo es potencialmente aplicable a otras áreas biológicas.
publishDate 2018
dc.date.none.fl_str_mv 2018-10
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/94760
Pistilli, Alejandro D.; Pratta, Guillermo Raúl; Angelone, Laura Monica; Arce, Debora Pamela; A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum; Sociedad Argentina de Bioingeniería; Revista Argentina de Bioingeniería; 20; 10; 10-2018; 3-6
2591-376X
CONICET Digital
CONICET
url http://hdl.handle.net/11336/94760
identifier_str_mv Pistilli, Alejandro D.; Pratta, Guillermo Raúl; Angelone, Laura Monica; Arce, Debora Pamela; A pipeline design for downloading and analyzing promoter sequences in solanum lycopersicum; Sociedad Argentina de Bioingeniería; Revista Argentina de Bioingeniería; 20; 10; 10-2018; 3-6
2591-376X
CONICET Digital
CONICET
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/http://revista.sabi.org.ar/index.php/revista/article/view/137
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
application/pdf
dc.publisher.none.fl_str_mv Sociedad Argentina de Bioingeniería
publisher.none.fl_str_mv Sociedad Argentina de Bioingeniería
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1844613679497084928
score 13.070432