Machine Learning approaches for the identification and exploitation of Sequence Motifs in Immunopeptidomes.

Autores
Alvarez, Bruno
Año de publicación
2021
Idioma
inglés
Tipo de recurso
tesis doctoral
Estado
versión aceptada
Colaborador/a o director/a de tesis
Nielsen, Morten
Descripción
Tesis de Doctorado en Biología Molecular y Biotecnología
Las proteínas son moléculas de primordial importancia en, virtualmente, todos los procesos celulares que sustentan la vida. Su relevancia se debe, principalmente, a su capacidad de ejercer una vasta lista de funcionalidades por medio de la unión y/o interacción selectiva con otras moléculas. Estas interacciones ocurren en interfaces proteína-molécula específicas, de naturaleza tridimensional, y se caracterizan por poseer una dinámica de tipo llave-cerradura. Más allá de que es correcto asumir que dichas interacciones son en esencia complejas, en muchos casos contienen pequeños componentes lineales, y por lo tanto pueden ser aproximadas por medio de una interacción de tipo péptido-proteína. Un caso particular de interacción péptido-proteína es la unión de péptidos al Complejo Mayor de Histocompatibilidad (MHC en inglés). El MHC posee un rol clave en el sistema inmune adaptativo de los vertebrados, principalmente gracias a su capacidad de unión y presentación de péptidos antigénicos al espacio extracelular. Luego de dicha presentación, Linfocitos T pueden interactuar con estos MHCs y, si se satisfacen ciertas condiciones, desencadenar una respuesta inmune. De lo antedicho, se torna evidente que existe una fuerte relación entre la inmunidad de los vertebrados y el conjunto de todos los posibles ligandos de MHC. En los últimos años, a dicho conjunto se lo ha denominado Inmunopeptidoma, y el consecuente desarrollo de herramientas científicas para su muestreo e interpretación ha dado a luz al campo de la Inmunopeptidómica. El trabajo aquí presentado comprende el desarrollo de diversas herramientas computacionales de Inmunopeptidómica, en la forma de algoritmos y procesos de Aprendizaje Automático, capaces de ser implementados en la identificación y explotación de la información contenida en un Inmunopeptidoma de interés.
Proteins are molecules of paramount importance in virtually all cellular processes sustaining life. Their relevance rests, to a high degree, in their capacity of exerting a vast range of functionalities by means of selectively binding to (and/or interacting with) other molecules. These interactions occur in specific three dimensional protein-molecule interfaces, and are characterised by a key-lock type of mechanism. While it is safe to assume that such interactions are complex in nature, in many cases they contain a short linear component, and may be approximated by means of a protein-peptide interaction. A particular case of protein-peptide interactions is the binding of peptides to the Major Histocompatibility Complex (MHC) protein. The MHC is a key player in the adaptive cellular immune system of vertebrates, mostly thanks to its capability of binding and presenting antigenic peptides to the extracellular space. After such presentation, T lymphocytes may interact with the loaded MHCs and, if certain conditions are met, an immune response might be fired. From what is stated above, it becomes clear that a strong bond exists between the immunity of vertebrates and the set of all possible MHC binding peptides. In recent years, such a set has been termed the Immunopeptidome, and the consequential development of scientific tools that enable its sampling and interpretation has given birth to the field of Immunopeptidomics. The work presented in this manuscript comprehends the development of several in-silico scientific tools for Immunopeptidomics, shaped in the form of Machine Learning algorithms and pipelines that can be readily deployed to identify and exploit the information contained within a target Immunopeptidome.
Fil: Alvarez, Bruno. Universidad Nacional de San Martín. Escuela de Bio y Nanotecnologías. Instituto de Investigaciones Biotecnológicas; Buenos Aires, Argentina.
Materia
Machine Learning approaches
Project Selection
Sequential Behavior
Identification of Sequence Motifs
Exploitation of Sequence Motifs
Major Histocompatibility Complex
Key Player
Adaptive Cellular Immune System
Immunity of Vertebrates
Antigenic Peptides
Extracellular Space
Immunopeptidomes
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
Repositorio Institucional (UNSAM)
Institución
Universidad Nacional de General San Martín
OAI Identificador
oai:ri.unsam.edu.ar:123456789/2290

id RIUNSAM_ab4ae6aea0b3ae530f0b5291082a9a00
oai_identifier_str oai:ri.unsam.edu.ar:123456789/2290
network_acronym_str RIUNSAM
repository_id_str s
network_name_str Repositorio Institucional (UNSAM)
spelling Machine Learning approaches for the identification and exploitation of Sequence Motifs in Immunopeptidomes.Herramientas de Aprendizaje Automático para la identificación y explotación de Motivos de Secuencia en Inmunopeptidomas.Alvarez, BrunoMachine Learning approachesProject SelectionSequential BehaviorIdentification of Sequence MotifsExploitation of Sequence MotifsMajor Histocompatibility ComplexKey PlayerAdaptive Cellular Immune SystemImmunity of VertebratesAntigenic PeptidesExtracellular SpaceImmunopeptidomesTesis de Doctorado en Biología Molecular y BiotecnologíaLas proteínas son moléculas de primordial importancia en, virtualmente, todos los procesos celulares que sustentan la vida. Su relevancia se debe, principalmente, a su capacidad de ejercer una vasta lista de funcionalidades por medio de la unión y/o interacción selectiva con otras moléculas. Estas interacciones ocurren en interfaces proteína-molécula específicas, de naturaleza tridimensional, y se caracterizan por poseer una dinámica de tipo llave-cerradura. Más allá de que es correcto asumir que dichas interacciones son en esencia complejas, en muchos casos contienen pequeños componentes lineales, y por lo tanto pueden ser aproximadas por medio de una interacción de tipo péptido-proteína. Un caso particular de interacción péptido-proteína es la unión de péptidos al Complejo Mayor de Histocompatibilidad (MHC en inglés). El MHC posee un rol clave en el sistema inmune adaptativo de los vertebrados, principalmente gracias a su capacidad de unión y presentación de péptidos antigénicos al espacio extracelular. Luego de dicha presentación, Linfocitos T pueden interactuar con estos MHCs y, si se satisfacen ciertas condiciones, desencadenar una respuesta inmune. De lo antedicho, se torna evidente que existe una fuerte relación entre la inmunidad de los vertebrados y el conjunto de todos los posibles ligandos de MHC. En los últimos años, a dicho conjunto se lo ha denominado Inmunopeptidoma, y el consecuente desarrollo de herramientas científicas para su muestreo e interpretación ha dado a luz al campo de la Inmunopeptidómica. El trabajo aquí presentado comprende el desarrollo de diversas herramientas computacionales de Inmunopeptidómica, en la forma de algoritmos y procesos de Aprendizaje Automático, capaces de ser implementados en la identificación y explotación de la información contenida en un Inmunopeptidoma de interés.Proteins are molecules of paramount importance in virtually all cellular processes sustaining life. Their relevance rests, to a high degree, in their capacity of exerting a vast range of functionalities by means of selectively binding to (and/or interacting with) other molecules. These interactions occur in specific three dimensional protein-molecule interfaces, and are characterised by a key-lock type of mechanism. While it is safe to assume that such interactions are complex in nature, in many cases they contain a short linear component, and may be approximated by means of a protein-peptide interaction. A particular case of protein-peptide interactions is the binding of peptides to the Major Histocompatibility Complex (MHC) protein. The MHC is a key player in the adaptive cellular immune system of vertebrates, mostly thanks to its capability of binding and presenting antigenic peptides to the extracellular space. After such presentation, T lymphocytes may interact with the loaded MHCs and, if certain conditions are met, an immune response might be fired. From what is stated above, it becomes clear that a strong bond exists between the immunity of vertebrates and the set of all possible MHC binding peptides. In recent years, such a set has been termed the Immunopeptidome, and the consequential development of scientific tools that enable its sampling and interpretation has given birth to the field of Immunopeptidomics. The work presented in this manuscript comprehends the development of several in-silico scientific tools for Immunopeptidomics, shaped in the form of Machine Learning algorithms and pipelines that can be readily deployed to identify and exploit the information contained within a target Immunopeptidome.Fil: Alvarez, Bruno. Universidad Nacional de San Martín. Escuela de Bio y Nanotecnologías. Instituto de Investigaciones Biotecnológicas; Buenos Aires, Argentina.Universidad Nacional de San Martín. Escuela de Bio y Nanotecnologías. Instituto de Investigaciones Biotecnológicas.Nielsen, Morten2021info:eu-repo/semantics/acceptedVersioninfo:eu-repo/semantics/doctoralThesishttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdf146 p.application/pdfAlvarez, B. (2021) Herramientas de Aprendizaje Automático para la identificación y explotación de Motivos de Secuencia en Inmunopeptidomas. Universidad Nacional de San Martín. Escuela de Bio y Nanotecnologías. Instituto de Investigaciones Biotecnológicas.TDOC EBYN 2021 ABhttp://ri.unsam.edu.ar/handle/123456789/2290engARG2021info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/ar/Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5)reponame:Repositorio Institucional (UNSAM)instname:Universidad Nacional de General San Martín2025-09-29T14:30:59Zoai:ri.unsam.edu.ar:123456789/2290instacron:UNSAMInstitucionalhttp://ri.unsam.edu.arUniversidad públicaNo correspondehttp://ri.unsam.edu.ar/oai/lpastran@unsam.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:s2025-09-29 14:31:19.013Repositorio Institucional (UNSAM) - Universidad Nacional de General San Martínfalse
dc.title.none.fl_str_mv Machine Learning approaches for the identification and exploitation of Sequence Motifs in Immunopeptidomes.
Herramientas de Aprendizaje Automático para la identificación y explotación de Motivos de Secuencia en Inmunopeptidomas.
title Machine Learning approaches for the identification and exploitation of Sequence Motifs in Immunopeptidomes.
spellingShingle Machine Learning approaches for the identification and exploitation of Sequence Motifs in Immunopeptidomes.
Alvarez, Bruno
Machine Learning approaches
Project Selection
Sequential Behavior
Identification of Sequence Motifs
Exploitation of Sequence Motifs
Major Histocompatibility Complex
Key Player
Adaptive Cellular Immune System
Immunity of Vertebrates
Antigenic Peptides
Extracellular Space
Immunopeptidomes
title_short Machine Learning approaches for the identification and exploitation of Sequence Motifs in Immunopeptidomes.
title_full Machine Learning approaches for the identification and exploitation of Sequence Motifs in Immunopeptidomes.
title_fullStr Machine Learning approaches for the identification and exploitation of Sequence Motifs in Immunopeptidomes.
title_full_unstemmed Machine Learning approaches for the identification and exploitation of Sequence Motifs in Immunopeptidomes.
title_sort Machine Learning approaches for the identification and exploitation of Sequence Motifs in Immunopeptidomes.
dc.creator.none.fl_str_mv Alvarez, Bruno
author Alvarez, Bruno
author_facet Alvarez, Bruno
author_role author
dc.contributor.none.fl_str_mv Nielsen, Morten
dc.subject.none.fl_str_mv Machine Learning approaches
Project Selection
Sequential Behavior
Identification of Sequence Motifs
Exploitation of Sequence Motifs
Major Histocompatibility Complex
Key Player
Adaptive Cellular Immune System
Immunity of Vertebrates
Antigenic Peptides
Extracellular Space
Immunopeptidomes
topic Machine Learning approaches
Project Selection
Sequential Behavior
Identification of Sequence Motifs
Exploitation of Sequence Motifs
Major Histocompatibility Complex
Key Player
Adaptive Cellular Immune System
Immunity of Vertebrates
Antigenic Peptides
Extracellular Space
Immunopeptidomes
dc.description.none.fl_txt_mv Tesis de Doctorado en Biología Molecular y Biotecnología
Las proteínas son moléculas de primordial importancia en, virtualmente, todos los procesos celulares que sustentan la vida. Su relevancia se debe, principalmente, a su capacidad de ejercer una vasta lista de funcionalidades por medio de la unión y/o interacción selectiva con otras moléculas. Estas interacciones ocurren en interfaces proteína-molécula específicas, de naturaleza tridimensional, y se caracterizan por poseer una dinámica de tipo llave-cerradura. Más allá de que es correcto asumir que dichas interacciones son en esencia complejas, en muchos casos contienen pequeños componentes lineales, y por lo tanto pueden ser aproximadas por medio de una interacción de tipo péptido-proteína. Un caso particular de interacción péptido-proteína es la unión de péptidos al Complejo Mayor de Histocompatibilidad (MHC en inglés). El MHC posee un rol clave en el sistema inmune adaptativo de los vertebrados, principalmente gracias a su capacidad de unión y presentación de péptidos antigénicos al espacio extracelular. Luego de dicha presentación, Linfocitos T pueden interactuar con estos MHCs y, si se satisfacen ciertas condiciones, desencadenar una respuesta inmune. De lo antedicho, se torna evidente que existe una fuerte relación entre la inmunidad de los vertebrados y el conjunto de todos los posibles ligandos de MHC. En los últimos años, a dicho conjunto se lo ha denominado Inmunopeptidoma, y el consecuente desarrollo de herramientas científicas para su muestreo e interpretación ha dado a luz al campo de la Inmunopeptidómica. El trabajo aquí presentado comprende el desarrollo de diversas herramientas computacionales de Inmunopeptidómica, en la forma de algoritmos y procesos de Aprendizaje Automático, capaces de ser implementados en la identificación y explotación de la información contenida en un Inmunopeptidoma de interés.
Proteins are molecules of paramount importance in virtually all cellular processes sustaining life. Their relevance rests, to a high degree, in their capacity of exerting a vast range of functionalities by means of selectively binding to (and/or interacting with) other molecules. These interactions occur in specific three dimensional protein-molecule interfaces, and are characterised by a key-lock type of mechanism. While it is safe to assume that such interactions are complex in nature, in many cases they contain a short linear component, and may be approximated by means of a protein-peptide interaction. A particular case of protein-peptide interactions is the binding of peptides to the Major Histocompatibility Complex (MHC) protein. The MHC is a key player in the adaptive cellular immune system of vertebrates, mostly thanks to its capability of binding and presenting antigenic peptides to the extracellular space. After such presentation, T lymphocytes may interact with the loaded MHCs and, if certain conditions are met, an immune response might be fired. From what is stated above, it becomes clear that a strong bond exists between the immunity of vertebrates and the set of all possible MHC binding peptides. In recent years, such a set has been termed the Immunopeptidome, and the consequential development of scientific tools that enable its sampling and interpretation has given birth to the field of Immunopeptidomics. The work presented in this manuscript comprehends the development of several in-silico scientific tools for Immunopeptidomics, shaped in the form of Machine Learning algorithms and pipelines that can be readily deployed to identify and exploit the information contained within a target Immunopeptidome.
Fil: Alvarez, Bruno. Universidad Nacional de San Martín. Escuela de Bio y Nanotecnologías. Instituto de Investigaciones Biotecnológicas; Buenos Aires, Argentina.
description Tesis de Doctorado en Biología Molecular y Biotecnología
publishDate 2021
dc.date.none.fl_str_mv 2021
dc.type.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
info:eu-repo/semantics/doctoralThesis
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
status_str acceptedVersion
format doctoralThesis
dc.identifier.none.fl_str_mv Alvarez, B. (2021) Herramientas de Aprendizaje Automático para la identificación y explotación de Motivos de Secuencia en Inmunopeptidomas. Universidad Nacional de San Martín. Escuela de Bio y Nanotecnologías. Instituto de Investigaciones Biotecnológicas.
TDOC EBYN 2021 AB
http://ri.unsam.edu.ar/handle/123456789/2290
identifier_str_mv Alvarez, B. (2021) Herramientas de Aprendizaje Automático para la identificación y explotación de Motivos de Secuencia en Inmunopeptidomas. Universidad Nacional de San Martín. Escuela de Bio y Nanotecnologías. Instituto de Investigaciones Biotecnológicas.
TDOC EBYN 2021 AB
url http://ri.unsam.edu.ar/handle/123456789/2290
dc.language.none.fl_str_mv eng
language eng
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5)
dc.format.none.fl_str_mv application/pdf
146 p.
application/pdf
dc.coverage.none.fl_str_mv ARG
2021
dc.publisher.none.fl_str_mv Universidad Nacional de San Martín. Escuela de Bio y Nanotecnologías. Instituto de Investigaciones Biotecnológicas.
publisher.none.fl_str_mv Universidad Nacional de San Martín. Escuela de Bio y Nanotecnologías. Instituto de Investigaciones Biotecnológicas.
dc.source.none.fl_str_mv reponame:Repositorio Institucional (UNSAM)
instname:Universidad Nacional de General San Martín
reponame_str Repositorio Institucional (UNSAM)
collection Repositorio Institucional (UNSAM)
instname_str Universidad Nacional de General San Martín
repository.name.fl_str_mv Repositorio Institucional (UNSAM) - Universidad Nacional de General San Martín
repository.mail.fl_str_mv lpastran@unsam.edu.ar
_version_ 1844621919080415232
score 12.559606