Selección de características en entornos Big Data : Aplicación en Gene Signatures

Autores
Camele, Genaro
Año de publicación
2020
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
La medicina genómica es aquella que utiliza el conocimiento del genoma humano y de ciencias afines para identificar el riesgo de padecer una enfermedad, diagnosticarla precozmente y tratarla de forma personalizada. La medicina genómica ayuda a entender de forma más precisa por qué enfermamos, y el peso que tiene en una enfermedad la existencia de defectos genómicos frente a factores medioambientales que pueden desencadenar una enfermedad concreta. En el ámbito de la genómica funcional, se destaca el análisis de perfiles de expresión génica; estos tienen como objetivo principal la identificación de un grupo de genes, cuyo patrón de expresión se encuentren asociados a un fenotipo en particular, concepto conocido como gene signature. Estos son un conjunto de genes que se sospecha, podrían ser marcadores de una patología en particular. Para evaluar la eficacia del mismo, se procesa un dataset que consta de pacientes que sufren la patología y la expresión de los genes que están especificados en el gene signature para cada una de estas personas, el tiempo transcurrido desde el último chequeo realizado y el estado vital del paciente. Un objetivo particular de los signatures es su utilidad como biomarcador diagnóstico, pronóstico o predictivo de una patología en estudio. Los biomarcadores con valor pronóstico permiten una mejor estratificación de pacientes según su pronóstico de progresión de enfermedad independientemente de una terapia, abriendo el paso a investigaciones de tratamientos adecuados para cada categoría de paciente definida. Por otro lado, los biomarcadores con valor predictivo permiten predecir si un tratamiento tendrá o no efecto en un paciente, logrando evitar tratamientos en pacientes para los cuales se supone no tendrán efecto positivo. Para llevar a cabo el descubrimiento de nuevos gene signatures es necesario un proceso de automatización que permita encontrar genes candidatos en base al conocimiento del experto. En la actualidad esta tarea es realizada de forma manual. Con la rápida acumulación de datos de expresión génica de diversas tecnologías, es posible aplicar algoritmos automáticos de reducción de dimensiones, con el objetivo de seleccionar aquellas que resulten más representativas del conjunto de características. Los resultados de esta selección podría ser interpretada como un posible gene signature. Numerosos métodos han sido desarrollados para la selección de características en bioinformática. Todavía es un desafío elegir un método apropiado para un problema específico y buscar las características de clasificación más razonable. No obstante, la implementación con algoritmos paralelos no ha sido aún estudiado en profundidad. El objetivo general de este plan de doctorado es el de contribuir con el desarrollo de nuevos algoritmos de extracción de características en entornos Big Data que permitan la identificación y la evaluación de gene signatures de manera eficaz y eficiente.
Facultad de Informática
Instituto de Investigación en Informática
Materia
Ciencias Informáticas
Extraccion de caracteristicas
Selección de caracteristicas
Biomarcadores
Big data
Machine learning
Feature selection
Feature extraction
Gene signatures
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/114316

id SEDICI_90774465a65a54c626960ef9e71ee3d5
oai_identifier_str oai:sedici.unlp.edu.ar:10915/114316
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Selección de características en entornos Big Data : Aplicación en Gene SignaturesFeature selection in Big Data. Application in Gene SignaturesCamele, GenaroCiencias InformáticasExtraccion de caracteristicasSelección de caracteristicasBiomarcadoresBig dataMachine learningFeature selectionFeature extractionGene signaturesLa medicina genómica es aquella que utiliza el conocimiento del genoma humano y de ciencias afines para identificar el riesgo de padecer una enfermedad, diagnosticarla precozmente y tratarla de forma personalizada. La medicina genómica ayuda a entender de forma más precisa por qué enfermamos, y el peso que tiene en una enfermedad la existencia de defectos genómicos frente a factores medioambientales que pueden desencadenar una enfermedad concreta. En el ámbito de la genómica funcional, se destaca el análisis de perfiles de expresión génica; estos tienen como objetivo principal la identificación de un grupo de genes, cuyo patrón de expresión se encuentren asociados a un fenotipo en particular, concepto conocido como gene signature. Estos son un conjunto de genes que se sospecha, podrían ser marcadores de una patología en particular. Para evaluar la eficacia del mismo, se procesa un dataset que consta de pacientes que sufren la patología y la expresión de los genes que están especificados en el gene signature para cada una de estas personas, el tiempo transcurrido desde el último chequeo realizado y el estado vital del paciente. Un objetivo particular de los signatures es su utilidad como biomarcador diagnóstico, pronóstico o predictivo de una patología en estudio. Los biomarcadores con valor pronóstico permiten una mejor estratificación de pacientes según su pronóstico de progresión de enfermedad independientemente de una terapia, abriendo el paso a investigaciones de tratamientos adecuados para cada categoría de paciente definida. Por otro lado, los biomarcadores con valor predictivo permiten predecir si un tratamiento tendrá o no efecto en un paciente, logrando evitar tratamientos en pacientes para los cuales se supone no tendrán efecto positivo. Para llevar a cabo el descubrimiento de nuevos gene signatures es necesario un proceso de automatización que permita encontrar genes candidatos en base al conocimiento del experto. En la actualidad esta tarea es realizada de forma manual. Con la rápida acumulación de datos de expresión génica de diversas tecnologías, es posible aplicar algoritmos automáticos de reducción de dimensiones, con el objetivo de seleccionar aquellas que resulten más representativas del conjunto de características. Los resultados de esta selección podría ser interpretada como un posible gene signature. Numerosos métodos han sido desarrollados para la selección de características en bioinformática. Todavía es un desafío elegir un método apropiado para un problema específico y buscar las características de clasificación más razonable. No obstante, la implementación con algoritmos paralelos no ha sido aún estudiado en profundidad. El objetivo general de este plan de doctorado es el de contribuir con el desarrollo de nuevos algoritmos de extracción de características en entornos Big Data que permitan la identificación y la evaluación de gene signatures de manera eficaz y eficiente.Facultad de InformáticaInstituto de Investigación en Informática2020-11-12info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaimage/pnghttp://sedici.unlp.edu.ar/handle/10915/114316spainfo:eu-repo/semantics/altIdentifier/url/https://congresos.unlp.edu.ar/ebec2020/genaro-cameleinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-03T10:58:47Zoai:sedici.unlp.edu.ar:10915/114316Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-03 10:58:47.53SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Selección de características en entornos Big Data : Aplicación en Gene Signatures
Feature selection in Big Data. Application in Gene Signatures
title Selección de características en entornos Big Data : Aplicación en Gene Signatures
spellingShingle Selección de características en entornos Big Data : Aplicación en Gene Signatures
Camele, Genaro
Ciencias Informáticas
Extraccion de caracteristicas
Selección de caracteristicas
Biomarcadores
Big data
Machine learning
Feature selection
Feature extraction
Gene signatures
title_short Selección de características en entornos Big Data : Aplicación en Gene Signatures
title_full Selección de características en entornos Big Data : Aplicación en Gene Signatures
title_fullStr Selección de características en entornos Big Data : Aplicación en Gene Signatures
title_full_unstemmed Selección de características en entornos Big Data : Aplicación en Gene Signatures
title_sort Selección de características en entornos Big Data : Aplicación en Gene Signatures
dc.creator.none.fl_str_mv Camele, Genaro
author Camele, Genaro
author_facet Camele, Genaro
author_role author
dc.subject.none.fl_str_mv Ciencias Informáticas
Extraccion de caracteristicas
Selección de caracteristicas
Biomarcadores
Big data
Machine learning
Feature selection
Feature extraction
Gene signatures
topic Ciencias Informáticas
Extraccion de caracteristicas
Selección de caracteristicas
Biomarcadores
Big data
Machine learning
Feature selection
Feature extraction
Gene signatures
dc.description.none.fl_txt_mv La medicina genómica es aquella que utiliza el conocimiento del genoma humano y de ciencias afines para identificar el riesgo de padecer una enfermedad, diagnosticarla precozmente y tratarla de forma personalizada. La medicina genómica ayuda a entender de forma más precisa por qué enfermamos, y el peso que tiene en una enfermedad la existencia de defectos genómicos frente a factores medioambientales que pueden desencadenar una enfermedad concreta. En el ámbito de la genómica funcional, se destaca el análisis de perfiles de expresión génica; estos tienen como objetivo principal la identificación de un grupo de genes, cuyo patrón de expresión se encuentren asociados a un fenotipo en particular, concepto conocido como gene signature. Estos son un conjunto de genes que se sospecha, podrían ser marcadores de una patología en particular. Para evaluar la eficacia del mismo, se procesa un dataset que consta de pacientes que sufren la patología y la expresión de los genes que están especificados en el gene signature para cada una de estas personas, el tiempo transcurrido desde el último chequeo realizado y el estado vital del paciente. Un objetivo particular de los signatures es su utilidad como biomarcador diagnóstico, pronóstico o predictivo de una patología en estudio. Los biomarcadores con valor pronóstico permiten una mejor estratificación de pacientes según su pronóstico de progresión de enfermedad independientemente de una terapia, abriendo el paso a investigaciones de tratamientos adecuados para cada categoría de paciente definida. Por otro lado, los biomarcadores con valor predictivo permiten predecir si un tratamiento tendrá o no efecto en un paciente, logrando evitar tratamientos en pacientes para los cuales se supone no tendrán efecto positivo. Para llevar a cabo el descubrimiento de nuevos gene signatures es necesario un proceso de automatización que permita encontrar genes candidatos en base al conocimiento del experto. En la actualidad esta tarea es realizada de forma manual. Con la rápida acumulación de datos de expresión génica de diversas tecnologías, es posible aplicar algoritmos automáticos de reducción de dimensiones, con el objetivo de seleccionar aquellas que resulten más representativas del conjunto de características. Los resultados de esta selección podría ser interpretada como un posible gene signature. Numerosos métodos han sido desarrollados para la selección de características en bioinformática. Todavía es un desafío elegir un método apropiado para un problema específico y buscar las características de clasificación más razonable. No obstante, la implementación con algoritmos paralelos no ha sido aún estudiado en profundidad. El objetivo general de este plan de doctorado es el de contribuir con el desarrollo de nuevos algoritmos de extracción de características en entornos Big Data que permitan la identificación y la evaluación de gene signatures de manera eficaz y eficiente.
Facultad de Informática
Instituto de Investigación en Informática
description La medicina genómica es aquella que utiliza el conocimiento del genoma humano y de ciencias afines para identificar el riesgo de padecer una enfermedad, diagnosticarla precozmente y tratarla de forma personalizada. La medicina genómica ayuda a entender de forma más precisa por qué enfermamos, y el peso que tiene en una enfermedad la existencia de defectos genómicos frente a factores medioambientales que pueden desencadenar una enfermedad concreta. En el ámbito de la genómica funcional, se destaca el análisis de perfiles de expresión génica; estos tienen como objetivo principal la identificación de un grupo de genes, cuyo patrón de expresión se encuentren asociados a un fenotipo en particular, concepto conocido como gene signature. Estos son un conjunto de genes que se sospecha, podrían ser marcadores de una patología en particular. Para evaluar la eficacia del mismo, se procesa un dataset que consta de pacientes que sufren la patología y la expresión de los genes que están especificados en el gene signature para cada una de estas personas, el tiempo transcurrido desde el último chequeo realizado y el estado vital del paciente. Un objetivo particular de los signatures es su utilidad como biomarcador diagnóstico, pronóstico o predictivo de una patología en estudio. Los biomarcadores con valor pronóstico permiten una mejor estratificación de pacientes según su pronóstico de progresión de enfermedad independientemente de una terapia, abriendo el paso a investigaciones de tratamientos adecuados para cada categoría de paciente definida. Por otro lado, los biomarcadores con valor predictivo permiten predecir si un tratamiento tendrá o no efecto en un paciente, logrando evitar tratamientos en pacientes para los cuales se supone no tendrán efecto positivo. Para llevar a cabo el descubrimiento de nuevos gene signatures es necesario un proceso de automatización que permita encontrar genes candidatos en base al conocimiento del experto. En la actualidad esta tarea es realizada de forma manual. Con la rápida acumulación de datos de expresión génica de diversas tecnologías, es posible aplicar algoritmos automáticos de reducción de dimensiones, con el objetivo de seleccionar aquellas que resulten más representativas del conjunto de características. Los resultados de esta selección podría ser interpretada como un posible gene signature. Numerosos métodos han sido desarrollados para la selección de características en bioinformática. Todavía es un desafío elegir un método apropiado para un problema específico y buscar las características de clasificación más razonable. No obstante, la implementación con algoritmos paralelos no ha sido aún estudiado en profundidad. El objetivo general de este plan de doctorado es el de contribuir con el desarrollo de nuevos algoritmos de extracción de características en entornos Big Data que permitan la identificación y la evaluación de gene signatures de manera eficaz y eficiente.
publishDate 2020
dc.date.none.fl_str_mv 2020-11-12
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/114316
url http://sedici.unlp.edu.ar/handle/10915/114316
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://congresos.unlp.edu.ar/ebec2020/genaro-camele
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv image/png
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1842260478854692864
score 13.13397