Selección de atributos en clasificación supervisada. Uso de la entropía condicional.

Autores
Romero, María del Carmen; Di Rienzo, Julio Alejandro; Clausse, Alejandro
Año de publicación
2013
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Ponencia presentada en el IV Encuentro Iberoamericano de Biometría y XVIII Reunión Científica del Grupo Argentino de Biometría. Mar del Plata, Argentina, 25 al 27 de septiembre de 2013
Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina.
Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina.
Las bases de datos de alta dimensionalidad pueden encontrarse en diferentes áreas de conocimiento. Los datos provenientes de microarreglos de ADN son buenos representantes de estos contextos y tienen, además, la particularidad de poseer mayor cantidad de atributos que de observaciones. Si bien, la clasificación supervisada suele ser una de las técnicas más usadas en estos casos, el “ruido” debido a las particularidades expuestas provocan que los clasificadores convencionales tengan resultados inestables. En este trabajo se propone el uso de la entropía condicional como medida para realizar la selección del subconjunto de atributos que distingan entre tratamientos en contextos de microarreglos de ADN. La entropía mide la cantidad media de información que es necesaria proveer para no tener incertidumbre sobre una variable determinada y tiene la ventaja de poder aplicarse a contextos con variables pertenecientes a cualquier escala de medición. Se desarrolló un algoritmo en R y se simularon diferentes escenarios de microarreglos de ADN. Las conclusiones se obtuvieron considerando el tamaño promedio del subconjunto seleccionado y el porcentaje de atributos seleccionados que efectivamente son diferenciales. Entre los resultados preliminares puede mencionarse que: en la mayoría de los casos, la entropía condicional con el subconjunto de atributos seleccionados es 0; a mayor cantidad de réplicas, mayor es el tamaño del subconjunto y mayor el porcentaje de atributos efectivamente diferenciales; y que, a mayor porcentaje de atributos diferenciales, menor es el tamaño del subconjunto de atributos seleccionados y mayor es el porcentaje de atributos efectivamente diferenciales.
Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina.
Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina.
Materia
Alta dimensionalidad
Microarreglos de ADN
Incertidumbre
Simulación
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/16236

id RDUUNC_ab83c90e16ccf28630896ebab775708f
oai_identifier_str oai:rdu.unc.edu.ar:11086/16236
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Selección de atributos en clasificación supervisada. Uso de la entropía condicional.Romero, María del CarmenDi Rienzo, Julio AlejandroClausse, AlejandroAlta dimensionalidadMicroarreglos de ADNIncertidumbreSimulaciónPonencia presentada en el IV Encuentro Iberoamericano de Biometría y XVIII Reunión Científica del Grupo Argentino de Biometría. Mar del Plata, Argentina, 25 al 27 de septiembre de 2013Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina.Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina.Las bases de datos de alta dimensionalidad pueden encontrarse en diferentes áreas de conocimiento. Los datos provenientes de microarreglos de ADN son buenos representantes de estos contextos y tienen, además, la particularidad de poseer mayor cantidad de atributos que de observaciones. Si bien, la clasificación supervisada suele ser una de las técnicas más usadas en estos casos, el “ruido” debido a las particularidades expuestas provocan que los clasificadores convencionales tengan resultados inestables. En este trabajo se propone el uso de la entropía condicional como medida para realizar la selección del subconjunto de atributos que distingan entre tratamientos en contextos de microarreglos de ADN. La entropía mide la cantidad media de información que es necesaria proveer para no tener incertidumbre sobre una variable determinada y tiene la ventaja de poder aplicarse a contextos con variables pertenecientes a cualquier escala de medición. Se desarrolló un algoritmo en R y se simularon diferentes escenarios de microarreglos de ADN. Las conclusiones se obtuvieron considerando el tamaño promedio del subconjunto seleccionado y el porcentaje de atributos seleccionados que efectivamente son diferenciales. Entre los resultados preliminares puede mencionarse que: en la mayoría de los casos, la entropía condicional con el subconjunto de atributos seleccionados es 0; a mayor cantidad de réplicas, mayor es el tamaño del subconjunto y mayor el porcentaje de atributos efectivamente diferenciales; y que, a mayor porcentaje de atributos diferenciales, menor es el tamaño del subconjunto de atributos seleccionados y mayor es el porcentaje de atributos efectivamente diferenciales.Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina.Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina.2013info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://hdl.handle.net/11086/16236spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-29T13:43:33Zoai:rdu.unc.edu.ar:11086/16236Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:43:33.302Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Selección de atributos en clasificación supervisada. Uso de la entropía condicional.
title Selección de atributos en clasificación supervisada. Uso de la entropía condicional.
spellingShingle Selección de atributos en clasificación supervisada. Uso de la entropía condicional.
Romero, María del Carmen
Alta dimensionalidad
Microarreglos de ADN
Incertidumbre
Simulación
title_short Selección de atributos en clasificación supervisada. Uso de la entropía condicional.
title_full Selección de atributos en clasificación supervisada. Uso de la entropía condicional.
title_fullStr Selección de atributos en clasificación supervisada. Uso de la entropía condicional.
title_full_unstemmed Selección de atributos en clasificación supervisada. Uso de la entropía condicional.
title_sort Selección de atributos en clasificación supervisada. Uso de la entropía condicional.
dc.creator.none.fl_str_mv Romero, María del Carmen
Di Rienzo, Julio Alejandro
Clausse, Alejandro
author Romero, María del Carmen
author_facet Romero, María del Carmen
Di Rienzo, Julio Alejandro
Clausse, Alejandro
author_role author
author2 Di Rienzo, Julio Alejandro
Clausse, Alejandro
author2_role author
author
dc.subject.none.fl_str_mv Alta dimensionalidad
Microarreglos de ADN
Incertidumbre
Simulación
topic Alta dimensionalidad
Microarreglos de ADN
Incertidumbre
Simulación
dc.description.none.fl_txt_mv Ponencia presentada en el IV Encuentro Iberoamericano de Biometría y XVIII Reunión Científica del Grupo Argentino de Biometría. Mar del Plata, Argentina, 25 al 27 de septiembre de 2013
Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina.
Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina.
Las bases de datos de alta dimensionalidad pueden encontrarse en diferentes áreas de conocimiento. Los datos provenientes de microarreglos de ADN son buenos representantes de estos contextos y tienen, además, la particularidad de poseer mayor cantidad de atributos que de observaciones. Si bien, la clasificación supervisada suele ser una de las técnicas más usadas en estos casos, el “ruido” debido a las particularidades expuestas provocan que los clasificadores convencionales tengan resultados inestables. En este trabajo se propone el uso de la entropía condicional como medida para realizar la selección del subconjunto de atributos que distingan entre tratamientos en contextos de microarreglos de ADN. La entropía mide la cantidad media de información que es necesaria proveer para no tener incertidumbre sobre una variable determinada y tiene la ventaja de poder aplicarse a contextos con variables pertenecientes a cualquier escala de medición. Se desarrolló un algoritmo en R y se simularon diferentes escenarios de microarreglos de ADN. Las conclusiones se obtuvieron considerando el tamaño promedio del subconjunto seleccionado y el porcentaje de atributos seleccionados que efectivamente son diferenciales. Entre los resultados preliminares puede mencionarse que: en la mayoría de los casos, la entropía condicional con el subconjunto de atributos seleccionados es 0; a mayor cantidad de réplicas, mayor es el tamaño del subconjunto y mayor el porcentaje de atributos efectivamente diferenciales; y que, a mayor porcentaje de atributos diferenciales, menor es el tamaño del subconjunto de atributos seleccionados y mayor es el porcentaje de atributos efectivamente diferenciales.
Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina.
Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina.
description Ponencia presentada en el IV Encuentro Iberoamericano de Biometría y XVIII Reunión Científica del Grupo Argentino de Biometría. Mar del Plata, Argentina, 25 al 27 de septiembre de 2013
publishDate 2013
dc.date.none.fl_str_mv 2013
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/16236
url http://hdl.handle.net/11086/16236
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1844618959037399040
score 13.070432