Selección de atributos en clasificación supervisada. Uso de la entropía condicional.
- Autores
- Romero, María del Carmen; Di Rienzo, Julio Alejandro; Clausse, Alejandro
- Año de publicación
- 2013
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- Ponencia presentada en el IV Encuentro Iberoamericano de Biometría y XVIII Reunión Científica del Grupo Argentino de Biometría. Mar del Plata, Argentina, 25 al 27 de septiembre de 2013
Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina.
Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina.
Las bases de datos de alta dimensionalidad pueden encontrarse en diferentes áreas de conocimiento. Los datos provenientes de microarreglos de ADN son buenos representantes de estos contextos y tienen, además, la particularidad de poseer mayor cantidad de atributos que de observaciones. Si bien, la clasificación supervisada suele ser una de las técnicas más usadas en estos casos, el “ruido” debido a las particularidades expuestas provocan que los clasificadores convencionales tengan resultados inestables. En este trabajo se propone el uso de la entropía condicional como medida para realizar la selección del subconjunto de atributos que distingan entre tratamientos en contextos de microarreglos de ADN. La entropía mide la cantidad media de información que es necesaria proveer para no tener incertidumbre sobre una variable determinada y tiene la ventaja de poder aplicarse a contextos con variables pertenecientes a cualquier escala de medición. Se desarrolló un algoritmo en R y se simularon diferentes escenarios de microarreglos de ADN. Las conclusiones se obtuvieron considerando el tamaño promedio del subconjunto seleccionado y el porcentaje de atributos seleccionados que efectivamente son diferenciales. Entre los resultados preliminares puede mencionarse que: en la mayoría de los casos, la entropía condicional con el subconjunto de atributos seleccionados es 0; a mayor cantidad de réplicas, mayor es el tamaño del subconjunto y mayor el porcentaje de atributos efectivamente diferenciales; y que, a mayor porcentaje de atributos diferenciales, menor es el tamaño del subconjunto de atributos seleccionados y mayor es el porcentaje de atributos efectivamente diferenciales.
Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina.
Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.
Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina. - Materia
-
Alta dimensionalidad
Microarreglos de ADN
Incertidumbre
Simulación - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- Repositorio
- Institución
- Universidad Nacional de Córdoba
- OAI Identificador
- oai:rdu.unc.edu.ar:11086/16236
Ver los metadatos del registro completo
id |
RDUUNC_ab83c90e16ccf28630896ebab775708f |
---|---|
oai_identifier_str |
oai:rdu.unc.edu.ar:11086/16236 |
network_acronym_str |
RDUUNC |
repository_id_str |
2572 |
network_name_str |
Repositorio Digital Universitario (UNC) |
spelling |
Selección de atributos en clasificación supervisada. Uso de la entropía condicional.Romero, María del CarmenDi Rienzo, Julio AlejandroClausse, AlejandroAlta dimensionalidadMicroarreglos de ADNIncertidumbreSimulaciónPonencia presentada en el IV Encuentro Iberoamericano de Biometría y XVIII Reunión Científica del Grupo Argentino de Biometría. Mar del Plata, Argentina, 25 al 27 de septiembre de 2013Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina.Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina.Las bases de datos de alta dimensionalidad pueden encontrarse en diferentes áreas de conocimiento. Los datos provenientes de microarreglos de ADN son buenos representantes de estos contextos y tienen, además, la particularidad de poseer mayor cantidad de atributos que de observaciones. Si bien, la clasificación supervisada suele ser una de las técnicas más usadas en estos casos, el “ruido” debido a las particularidades expuestas provocan que los clasificadores convencionales tengan resultados inestables. En este trabajo se propone el uso de la entropía condicional como medida para realizar la selección del subconjunto de atributos que distingan entre tratamientos en contextos de microarreglos de ADN. La entropía mide la cantidad media de información que es necesaria proveer para no tener incertidumbre sobre una variable determinada y tiene la ventaja de poder aplicarse a contextos con variables pertenecientes a cualquier escala de medición. Se desarrolló un algoritmo en R y se simularon diferentes escenarios de microarreglos de ADN. Las conclusiones se obtuvieron considerando el tamaño promedio del subconjunto seleccionado y el porcentaje de atributos seleccionados que efectivamente son diferenciales. Entre los resultados preliminares puede mencionarse que: en la mayoría de los casos, la entropía condicional con el subconjunto de atributos seleccionados es 0; a mayor cantidad de réplicas, mayor es el tamaño del subconjunto y mayor el porcentaje de atributos efectivamente diferenciales; y que, a mayor porcentaje de atributos diferenciales, menor es el tamaño del subconjunto de atributos seleccionados y mayor es el porcentaje de atributos efectivamente diferenciales.Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina.Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina.Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina.2013info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://hdl.handle.net/11086/16236spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-29T13:43:33Zoai:rdu.unc.edu.ar:11086/16236Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:43:33.302Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse |
dc.title.none.fl_str_mv |
Selección de atributos en clasificación supervisada. Uso de la entropía condicional. |
title |
Selección de atributos en clasificación supervisada. Uso de la entropía condicional. |
spellingShingle |
Selección de atributos en clasificación supervisada. Uso de la entropía condicional. Romero, María del Carmen Alta dimensionalidad Microarreglos de ADN Incertidumbre Simulación |
title_short |
Selección de atributos en clasificación supervisada. Uso de la entropía condicional. |
title_full |
Selección de atributos en clasificación supervisada. Uso de la entropía condicional. |
title_fullStr |
Selección de atributos en clasificación supervisada. Uso de la entropía condicional. |
title_full_unstemmed |
Selección de atributos en clasificación supervisada. Uso de la entropía condicional. |
title_sort |
Selección de atributos en clasificación supervisada. Uso de la entropía condicional. |
dc.creator.none.fl_str_mv |
Romero, María del Carmen Di Rienzo, Julio Alejandro Clausse, Alejandro |
author |
Romero, María del Carmen |
author_facet |
Romero, María del Carmen Di Rienzo, Julio Alejandro Clausse, Alejandro |
author_role |
author |
author2 |
Di Rienzo, Julio Alejandro Clausse, Alejandro |
author2_role |
author author |
dc.subject.none.fl_str_mv |
Alta dimensionalidad Microarreglos de ADN Incertidumbre Simulación |
topic |
Alta dimensionalidad Microarreglos de ADN Incertidumbre Simulación |
dc.description.none.fl_txt_mv |
Ponencia presentada en el IV Encuentro Iberoamericano de Biometría y XVIII Reunión Científica del Grupo Argentino de Biometría. Mar del Plata, Argentina, 25 al 27 de septiembre de 2013 Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina. Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina. Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina. Las bases de datos de alta dimensionalidad pueden encontrarse en diferentes áreas de conocimiento. Los datos provenientes de microarreglos de ADN son buenos representantes de estos contextos y tienen, además, la particularidad de poseer mayor cantidad de atributos que de observaciones. Si bien, la clasificación supervisada suele ser una de las técnicas más usadas en estos casos, el “ruido” debido a las particularidades expuestas provocan que los clasificadores convencionales tengan resultados inestables. En este trabajo se propone el uso de la entropía condicional como medida para realizar la selección del subconjunto de atributos que distingan entre tratamientos en contextos de microarreglos de ADN. La entropía mide la cantidad media de información que es necesaria proveer para no tener incertidumbre sobre una variable determinada y tiene la ventaja de poder aplicarse a contextos con variables pertenecientes a cualquier escala de medición. Se desarrolló un algoritmo en R y se simularon diferentes escenarios de microarreglos de ADN. Las conclusiones se obtuvieron considerando el tamaño promedio del subconjunto seleccionado y el porcentaje de atributos seleccionados que efectivamente son diferenciales. Entre los resultados preliminares puede mencionarse que: en la mayoría de los casos, la entropía condicional con el subconjunto de atributos seleccionados es 0; a mayor cantidad de réplicas, mayor es el tamaño del subconjunto y mayor el porcentaje de atributos efectivamente diferenciales; y que, a mayor porcentaje de atributos diferenciales, menor es el tamaño del subconjunto de atributos seleccionados y mayor es el porcentaje de atributos efectivamente diferenciales. Fil: Romero, María del Carmen. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Económicas; Argentina. Fil: Di Rienzo, Julio Alejandro. Universidad Nacional de Córdoba. Facultad de Ciencias Agropecuarias. Cátedra de Estadística y Biometría; Argentina. Fil: Clausse, Alejandro. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas. Instituto de Plasmas Densos Magnetizados (PLADEMA); Argentina. |
description |
Ponencia presentada en el IV Encuentro Iberoamericano de Biometría y XVIII Reunión Científica del Grupo Argentino de Biometría. Mar del Plata, Argentina, 25 al 27 de septiembre de 2013 |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11086/16236 |
url |
http://hdl.handle.net/11086/16236 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC |
reponame_str |
Repositorio Digital Universitario (UNC) |
collection |
Repositorio Digital Universitario (UNC) |
instname_str |
Universidad Nacional de Córdoba |
instacron_str |
UNC |
institution |
UNC |
repository.name.fl_str_mv |
Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba |
repository.mail.fl_str_mv |
oca.unc@gmail.com |
_version_ |
1844618959037399040 |
score |
13.070432 |