Efectividad del método de búsqueda metaheurístico enfriamiento simulado en la determinación de una secuencia consenso a partir de múltiples secuencias

Autores
Díaz, Adrián Gustavo
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
tesis de maestría
Estado
versión aceptada
Colaborador/a o director/a de tesis
Minetti, Gabriela
Parisi, Gustavo
Fornasari, Silvina
Balatti, Galo
Descripción
Fil: Díaz, Adrián Gustavo. Universidad Nacional de Quilmes; Argentina.
Uno de los eventos que cambia la forma de estudiar y hacer Biología es la capacidad de estudiar los lenguajes que escriben las componentes de la vida. Una vez que comprendimos y entendimos que la información genética está almacenada en las cadenas de ADN a principios de la década de 1950, la velocidad de nuevos descubrimientos avanzó a una velocidad exponencial. A finales de la década de 1970, el científico Sanger pudo secuenciar un fragmento de ADN, abriendo la puerta a conocer el orden de nucleótidos que conforman esa sección de la molécula. Con el paso del tiempo, los métodos fueron mejorando tanto en velocidad como en costos por lectura. La secuenciación, es decir, la lectura y representación de un gen, ARN mensajero o proteína (entre otros) dio paso a una nueva etapa en la Biología. Es inevitable que la Informática se vuelva parte central de los procesos de investigación en la ciencia, y la Biología no es la excepción. De hecho, la Bioinformática surgió como una ciencia que combina entre otras a la Informática con la Biología en pos de extraer información y nuevo conocimiento desde todos los datos extraídos de las muestras biológicas. Este trabajo muestra, a lo largo de su desarrollo, un claro ejemplo de la contribución de la Computación en la Biología. Actualmente hay una cantidad incalculable de datos por ser estudiada, procesada y usada como fuente de entrada de nuevos procesos de investigación, desarrollo y aplicación. En el caso de la secuenciación de entidades biológicas como ADN de genes, ARN mensajeros, aminoácidos de secuencias proteínas, por no hablar de artefactos completos como genomas, proteomas, transcriptomas, entre otros. El análisis de dichas entidades en conjunto permitió caracterizar al conjunto más allá del individuo. Entre los muchos ejemplos, se pueden deducir regiones que han sido conservadas a lo largo de los procesos evolutivos de las diferentes especies estudia-das. El éxito de estos estudios bioinformáticas se ve plasmado en que sea cotidiano realizar alineamientos múltiples de secuencias o caracterizar una familia de proteínas con una secuencia consenso o un logo. Todo esto es posible gracias al trabajo multidisciplinario entre expertos biólogos e informáticos desde hace muchos años. La idea del autor al momento de efectuar este trabajo es aportar una comparación entre herramientas existentes en el ámbito de la construcción de alineamientos múltiples de secuencias y una implementación de la metaheurística “Enfriamiento Simulado” (SA por sus siglas en inglés de Simulated Annealing). Este trabajo describe el camino recorrido al crear un método bioinformática y sentar las bases de comparación y evaluación de utilidad para futuros investigadores. Tanto el código de la implementación SA como los protocolos de comparación y evaluación se encuentran disponibles en un repositorio de código presentado más adelante en este documento con la finalidad de ser consultados.
Materia
Bioinformática
Enfriamiento simulado
Metaheurística
Alineamiento múltiple de secuencias
Estrategias de búsqueda (Recuperación)
Bioinformatics
Simulated annealing
Metaheuristic
Multiple sequence alignment
Search structures (Retrieval)
Recozimento simulado
Meta-heurística
Alinhamento múltiplo de sequências
Estruturas de busca
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
RIDAA (UNQ)
Institución
Universidad Nacional de Quilmes
OAI Identificador
oai:ridaa.unq.edu.ar:20.500.11807/4791

id RIDAA_53a0c9f6c9e5747cdf39004e1d5d7030
oai_identifier_str oai:ridaa.unq.edu.ar:20.500.11807/4791
network_acronym_str RIDAA
repository_id_str 4108
network_name_str RIDAA (UNQ)
spelling Efectividad del método de búsqueda metaheurístico enfriamiento simulado en la determinación de una secuencia consenso a partir de múltiples secuenciasDíaz, Adrián GustavoBioinformáticaEnfriamiento simuladoMetaheurísticaAlineamiento múltiple de secuenciasEstrategias de búsqueda (Recuperación)BioinformaticsSimulated annealingMetaheuristicMultiple sequence alignmentSearch structures (Retrieval)Recozimento simuladoMeta-heurísticaAlinhamento múltiplo de sequênciasEstruturas de buscaFil: Díaz, Adrián Gustavo. Universidad Nacional de Quilmes; Argentina.Uno de los eventos que cambia la forma de estudiar y hacer Biología es la capacidad de estudiar los lenguajes que escriben las componentes de la vida. Una vez que comprendimos y entendimos que la información genética está almacenada en las cadenas de ADN a principios de la década de 1950, la velocidad de nuevos descubrimientos avanzó a una velocidad exponencial. A finales de la década de 1970, el científico Sanger pudo secuenciar un fragmento de ADN, abriendo la puerta a conocer el orden de nucleótidos que conforman esa sección de la molécula. Con el paso del tiempo, los métodos fueron mejorando tanto en velocidad como en costos por lectura. La secuenciación, es decir, la lectura y representación de un gen, ARN mensajero o proteína (entre otros) dio paso a una nueva etapa en la Biología. Es inevitable que la Informática se vuelva parte central de los procesos de investigación en la ciencia, y la Biología no es la excepción. De hecho, la Bioinformática surgió como una ciencia que combina entre otras a la Informática con la Biología en pos de extraer información y nuevo conocimiento desde todos los datos extraídos de las muestras biológicas. Este trabajo muestra, a lo largo de su desarrollo, un claro ejemplo de la contribución de la Computación en la Biología. Actualmente hay una cantidad incalculable de datos por ser estudiada, procesada y usada como fuente de entrada de nuevos procesos de investigación, desarrollo y aplicación. En el caso de la secuenciación de entidades biológicas como ADN de genes, ARN mensajeros, aminoácidos de secuencias proteínas, por no hablar de artefactos completos como genomas, proteomas, transcriptomas, entre otros. El análisis de dichas entidades en conjunto permitió caracterizar al conjunto más allá del individuo. Entre los muchos ejemplos, se pueden deducir regiones que han sido conservadas a lo largo de los procesos evolutivos de las diferentes especies estudia-das. El éxito de estos estudios bioinformáticas se ve plasmado en que sea cotidiano realizar alineamientos múltiples de secuencias o caracterizar una familia de proteínas con una secuencia consenso o un logo. Todo esto es posible gracias al trabajo multidisciplinario entre expertos biólogos e informáticos desde hace muchos años. La idea del autor al momento de efectuar este trabajo es aportar una comparación entre herramientas existentes en el ámbito de la construcción de alineamientos múltiples de secuencias y una implementación de la metaheurística “Enfriamiento Simulado” (SA por sus siglas en inglés de Simulated Annealing). Este trabajo describe el camino recorrido al crear un método bioinformática y sentar las bases de comparación y evaluación de utilidad para futuros investigadores. Tanto el código de la implementación SA como los protocolos de comparación y evaluación se encuentran disponibles en un repositorio de código presentado más adelante en este documento con la finalidad de ser consultados.Universidad Nacional de QuilmesMinetti, GabrielaParisi, GustavoFornasari, SilvinaBalatti, Galo2024-10-25info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttp://ridaa.unq.edu.ar/handle/20.500.11807/4791spainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:RIDAA (UNQ)instname:Universidad Nacional de Quilmes2025-09-29T13:40:48Zoai:ridaa.unq.edu.ar:20.500.11807/4791instacron:UNQInstitucionalhttp://ridaa.unq.edu.ar/Universidad públicaNo correspondehttp://ridaa.unq.edu.ar/oai/snrdalejandro@unq.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:41082025-09-29 13:40:48.463RIDAA (UNQ) - Universidad Nacional de Quilmesfalse
dc.title.none.fl_str_mv Efectividad del método de búsqueda metaheurístico enfriamiento simulado en la determinación de una secuencia consenso a partir de múltiples secuencias
title Efectividad del método de búsqueda metaheurístico enfriamiento simulado en la determinación de una secuencia consenso a partir de múltiples secuencias
spellingShingle Efectividad del método de búsqueda metaheurístico enfriamiento simulado en la determinación de una secuencia consenso a partir de múltiples secuencias
Díaz, Adrián Gustavo
Bioinformática
Enfriamiento simulado
Metaheurística
Alineamiento múltiple de secuencias
Estrategias de búsqueda (Recuperación)
Bioinformatics
Simulated annealing
Metaheuristic
Multiple sequence alignment
Search structures (Retrieval)
Recozimento simulado
Meta-heurística
Alinhamento múltiplo de sequências
Estruturas de busca
title_short Efectividad del método de búsqueda metaheurístico enfriamiento simulado en la determinación de una secuencia consenso a partir de múltiples secuencias
title_full Efectividad del método de búsqueda metaheurístico enfriamiento simulado en la determinación de una secuencia consenso a partir de múltiples secuencias
title_fullStr Efectividad del método de búsqueda metaheurístico enfriamiento simulado en la determinación de una secuencia consenso a partir de múltiples secuencias
title_full_unstemmed Efectividad del método de búsqueda metaheurístico enfriamiento simulado en la determinación de una secuencia consenso a partir de múltiples secuencias
title_sort Efectividad del método de búsqueda metaheurístico enfriamiento simulado en la determinación de una secuencia consenso a partir de múltiples secuencias
dc.creator.none.fl_str_mv Díaz, Adrián Gustavo
author Díaz, Adrián Gustavo
author_facet Díaz, Adrián Gustavo
author_role author
dc.contributor.none.fl_str_mv Minetti, Gabriela
Parisi, Gustavo
Fornasari, Silvina
Balatti, Galo
dc.subject.none.fl_str_mv Bioinformática
Enfriamiento simulado
Metaheurística
Alineamiento múltiple de secuencias
Estrategias de búsqueda (Recuperación)
Bioinformatics
Simulated annealing
Metaheuristic
Multiple sequence alignment
Search structures (Retrieval)
Recozimento simulado
Meta-heurística
Alinhamento múltiplo de sequências
Estruturas de busca
topic Bioinformática
Enfriamiento simulado
Metaheurística
Alineamiento múltiple de secuencias
Estrategias de búsqueda (Recuperación)
Bioinformatics
Simulated annealing
Metaheuristic
Multiple sequence alignment
Search structures (Retrieval)
Recozimento simulado
Meta-heurística
Alinhamento múltiplo de sequências
Estruturas de busca
dc.description.none.fl_txt_mv Fil: Díaz, Adrián Gustavo. Universidad Nacional de Quilmes; Argentina.
Uno de los eventos que cambia la forma de estudiar y hacer Biología es la capacidad de estudiar los lenguajes que escriben las componentes de la vida. Una vez que comprendimos y entendimos que la información genética está almacenada en las cadenas de ADN a principios de la década de 1950, la velocidad de nuevos descubrimientos avanzó a una velocidad exponencial. A finales de la década de 1970, el científico Sanger pudo secuenciar un fragmento de ADN, abriendo la puerta a conocer el orden de nucleótidos que conforman esa sección de la molécula. Con el paso del tiempo, los métodos fueron mejorando tanto en velocidad como en costos por lectura. La secuenciación, es decir, la lectura y representación de un gen, ARN mensajero o proteína (entre otros) dio paso a una nueva etapa en la Biología. Es inevitable que la Informática se vuelva parte central de los procesos de investigación en la ciencia, y la Biología no es la excepción. De hecho, la Bioinformática surgió como una ciencia que combina entre otras a la Informática con la Biología en pos de extraer información y nuevo conocimiento desde todos los datos extraídos de las muestras biológicas. Este trabajo muestra, a lo largo de su desarrollo, un claro ejemplo de la contribución de la Computación en la Biología. Actualmente hay una cantidad incalculable de datos por ser estudiada, procesada y usada como fuente de entrada de nuevos procesos de investigación, desarrollo y aplicación. En el caso de la secuenciación de entidades biológicas como ADN de genes, ARN mensajeros, aminoácidos de secuencias proteínas, por no hablar de artefactos completos como genomas, proteomas, transcriptomas, entre otros. El análisis de dichas entidades en conjunto permitió caracterizar al conjunto más allá del individuo. Entre los muchos ejemplos, se pueden deducir regiones que han sido conservadas a lo largo de los procesos evolutivos de las diferentes especies estudia-das. El éxito de estos estudios bioinformáticas se ve plasmado en que sea cotidiano realizar alineamientos múltiples de secuencias o caracterizar una familia de proteínas con una secuencia consenso o un logo. Todo esto es posible gracias al trabajo multidisciplinario entre expertos biólogos e informáticos desde hace muchos años. La idea del autor al momento de efectuar este trabajo es aportar una comparación entre herramientas existentes en el ámbito de la construcción de alineamientos múltiples de secuencias y una implementación de la metaheurística “Enfriamiento Simulado” (SA por sus siglas en inglés de Simulated Annealing). Este trabajo describe el camino recorrido al crear un método bioinformática y sentar las bases de comparación y evaluación de utilidad para futuros investigadores. Tanto el código de la implementación SA como los protocolos de comparación y evaluación se encuentran disponibles en un repositorio de código presentado más adelante en este documento con la finalidad de ser consultados.
description Fil: Díaz, Adrián Gustavo. Universidad Nacional de Quilmes; Argentina.
publishDate 2024
dc.date.none.fl_str_mv 2024-10-25
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/acceptedVersion
http://purl.org/coar/resource_type/c_bdcc
info:ar-repo/semantics/tesisDeMaestria
format masterThesis
status_str acceptedVersion
dc.identifier.none.fl_str_mv http://ridaa.unq.edu.ar/handle/20.500.11807/4791
url http://ridaa.unq.edu.ar/handle/20.500.11807/4791
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional de Quilmes
publisher.none.fl_str_mv Universidad Nacional de Quilmes
dc.source.none.fl_str_mv reponame:RIDAA (UNQ)
instname:Universidad Nacional de Quilmes
reponame_str RIDAA (UNQ)
collection RIDAA (UNQ)
instname_str Universidad Nacional de Quilmes
repository.name.fl_str_mv RIDAA (UNQ) - Universidad Nacional de Quilmes
repository.mail.fl_str_mv alejandro@unq.edu.ar
_version_ 1844618652297461760
score 13.070432