Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos
- Autores
- Kovalevski, Leandro
- Año de publicación
- 2016
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- Uno de los retos más importantes del análisis estadístico en esos grandes volúmenes de datos es detectar cuál es la información valiosa. Las regresiones regularizadas, tales como Lasso o SCAD son alternativas usua-les cuando los métodos usuales de selección de variables en los modelos linea-les resultan no apropiados o no aplicables. El objetivo de este trabajo es comparar el desempeño de las regresiones Lasso y SCAD en escenarios donde el número de variables importantes esté próximo al número de observaciones. Se simularon distintos conjuntos de datos en los cuales las variables respuestas son funciones lineales de varios predictores independientes y errores que se si-mulan con distribución normal. Las regresiones LASSO y SCAD se ofrecen como una alternativa válida para selección de variables con gran número de predictores, aunque pueden no ser las más adecuadas cuando la cantidad de efectos significativos se aproxima al número de observaciones.
Sociedad Argentina de Informática e Investigación Operativa (SADIO) - Materia
-
Ciencias Informáticas
regresiones regularizadas
LASSO
SCAD
selección de predictores - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-sa/3.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/56848
Ver los metadatos del registro completo
id |
SEDICI_ebdab13781d80217af027a10bf65fbac |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/56848 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Selección de variables mediante regresiones penalizadas en grandes volúmenes de datosKovalevski, LeandroCiencias Informáticasregresiones regularizadasLASSOSCADselección de predictoresUno de los retos más importantes del análisis estadístico en esos grandes volúmenes de datos es detectar cuál es la información valiosa. Las regresiones regularizadas, tales como Lasso o SCAD son alternativas usua-les cuando los métodos usuales de selección de variables en los modelos linea-les resultan no apropiados o no aplicables. El objetivo de este trabajo es comparar el desempeño de las regresiones Lasso y SCAD en escenarios donde el número de variables importantes esté próximo al número de observaciones. Se simularon distintos conjuntos de datos en los cuales las variables respuestas son funciones lineales de varios predictores independientes y errores que se si-mulan con distribución normal. Las regresiones LASSO y SCAD se ofrecen como una alternativa válida para selección de variables con gran número de predictores, aunque pueden no ser las más adecuadas cuando la cantidad de efectos significativos se aproxima al número de observaciones.Sociedad Argentina de Informática e Investigación Operativa (SADIO)2016-09info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf128-131http://sedici.unlp.edu.ar/handle/10915/56848spainfo:eu-repo/semantics/altIdentifier/url/http://45jaiio.sadio.org.ar/sites/default/files/AGRANDA-14.pdfinfo:eu-repo/semantics/altIdentifier/issn/2451-7569info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-sa/3.0/Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-15T10:58:42Zoai:sedici.unlp.edu.ar:10915/56848Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-15 10:58:42.435SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos |
title |
Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos |
spellingShingle |
Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos Kovalevski, Leandro Ciencias Informáticas regresiones regularizadas LASSO SCAD selección de predictores |
title_short |
Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos |
title_full |
Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos |
title_fullStr |
Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos |
title_full_unstemmed |
Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos |
title_sort |
Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos |
dc.creator.none.fl_str_mv |
Kovalevski, Leandro |
author |
Kovalevski, Leandro |
author_facet |
Kovalevski, Leandro |
author_role |
author |
dc.subject.none.fl_str_mv |
Ciencias Informáticas regresiones regularizadas LASSO SCAD selección de predictores |
topic |
Ciencias Informáticas regresiones regularizadas LASSO SCAD selección de predictores |
dc.description.none.fl_txt_mv |
Uno de los retos más importantes del análisis estadístico en esos grandes volúmenes de datos es detectar cuál es la información valiosa. Las regresiones regularizadas, tales como Lasso o SCAD son alternativas usua-les cuando los métodos usuales de selección de variables en los modelos linea-les resultan no apropiados o no aplicables. El objetivo de este trabajo es comparar el desempeño de las regresiones Lasso y SCAD en escenarios donde el número de variables importantes esté próximo al número de observaciones. Se simularon distintos conjuntos de datos en los cuales las variables respuestas son funciones lineales de varios predictores independientes y errores que se si-mulan con distribución normal. Las regresiones LASSO y SCAD se ofrecen como una alternativa válida para selección de variables con gran número de predictores, aunque pueden no ser las más adecuadas cuando la cantidad de efectos significativos se aproxima al número de observaciones. Sociedad Argentina de Informática e Investigación Operativa (SADIO) |
description |
Uno de los retos más importantes del análisis estadístico en esos grandes volúmenes de datos es detectar cuál es la información valiosa. Las regresiones regularizadas, tales como Lasso o SCAD son alternativas usua-les cuando los métodos usuales de selección de variables en los modelos linea-les resultan no apropiados o no aplicables. El objetivo de este trabajo es comparar el desempeño de las regresiones Lasso y SCAD en escenarios donde el número de variables importantes esté próximo al número de observaciones. Se simularon distintos conjuntos de datos en los cuales las variables respuestas son funciones lineales de varios predictores independientes y errores que se si-mulan con distribución normal. Las regresiones LASSO y SCAD se ofrecen como una alternativa válida para selección de variables con gran número de predictores, aunque pueden no ser las más adecuadas cuando la cantidad de efectos significativos se aproxima al número de observaciones. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-09 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/56848 |
url |
http://sedici.unlp.edu.ar/handle/10915/56848 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/url/http://45jaiio.sadio.org.ar/sites/default/files/AGRANDA-14.pdf info:eu-repo/semantics/altIdentifier/issn/2451-7569 |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-sa/3.0/ Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-sa/3.0/ Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0) |
dc.format.none.fl_str_mv |
application/pdf 128-131 |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1846064034508439552 |
score |
13.22299 |