Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos

Autores
Kovalevski, Leandro
Año de publicación
2016
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Uno de los retos más importantes del análisis estadístico en esos grandes volúmenes de datos es detectar cuál es la información valiosa. Las regresiones regularizadas, tales como Lasso o SCAD son alternativas usua-les cuando los métodos usuales de selección de variables en los modelos linea-les resultan no apropiados o no aplicables. El objetivo de este trabajo es comparar el desempeño de las regresiones Lasso y SCAD en escenarios donde el número de variables importantes esté próximo al número de observaciones. Se simularon distintos conjuntos de datos en los cuales las variables respuestas son funciones lineales de varios predictores independientes y errores que se si-mulan con distribución normal. Las regresiones LASSO y SCAD se ofrecen como una alternativa válida para selección de variables con gran número de predictores, aunque pueden no ser las más adecuadas cuando la cantidad de efectos significativos se aproxima al número de observaciones.
Sociedad Argentina de Informática e Investigación Operativa (SADIO)
Materia
Ciencias Informáticas
regresiones regularizadas
LASSO
SCAD
selección de predictores
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-sa/3.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/56848

id SEDICI_ebdab13781d80217af027a10bf65fbac
oai_identifier_str oai:sedici.unlp.edu.ar:10915/56848
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Selección de variables mediante regresiones penalizadas en grandes volúmenes de datosKovalevski, LeandroCiencias Informáticasregresiones regularizadasLASSOSCADselección de predictoresUno de los retos más importantes del análisis estadístico en esos grandes volúmenes de datos es detectar cuál es la información valiosa. Las regresiones regularizadas, tales como Lasso o SCAD son alternativas usua-les cuando los métodos usuales de selección de variables en los modelos linea-les resultan no apropiados o no aplicables. El objetivo de este trabajo es comparar el desempeño de las regresiones Lasso y SCAD en escenarios donde el número de variables importantes esté próximo al número de observaciones. Se simularon distintos conjuntos de datos en los cuales las variables respuestas son funciones lineales de varios predictores independientes y errores que se si-mulan con distribución normal. Las regresiones LASSO y SCAD se ofrecen como una alternativa válida para selección de variables con gran número de predictores, aunque pueden no ser las más adecuadas cuando la cantidad de efectos significativos se aproxima al número de observaciones.Sociedad Argentina de Informática e Investigación Operativa (SADIO)2016-09info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf128-131http://sedici.unlp.edu.ar/handle/10915/56848spainfo:eu-repo/semantics/altIdentifier/url/http://45jaiio.sadio.org.ar/sites/default/files/AGRANDA-14.pdfinfo:eu-repo/semantics/altIdentifier/issn/2451-7569info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-sa/3.0/Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-15T10:58:42Zoai:sedici.unlp.edu.ar:10915/56848Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-15 10:58:42.435SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos
title Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos
spellingShingle Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos
Kovalevski, Leandro
Ciencias Informáticas
regresiones regularizadas
LASSO
SCAD
selección de predictores
title_short Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos
title_full Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos
title_fullStr Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos
title_full_unstemmed Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos
title_sort Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos
dc.creator.none.fl_str_mv Kovalevski, Leandro
author Kovalevski, Leandro
author_facet Kovalevski, Leandro
author_role author
dc.subject.none.fl_str_mv Ciencias Informáticas
regresiones regularizadas
LASSO
SCAD
selección de predictores
topic Ciencias Informáticas
regresiones regularizadas
LASSO
SCAD
selección de predictores
dc.description.none.fl_txt_mv Uno de los retos más importantes del análisis estadístico en esos grandes volúmenes de datos es detectar cuál es la información valiosa. Las regresiones regularizadas, tales como Lasso o SCAD son alternativas usua-les cuando los métodos usuales de selección de variables en los modelos linea-les resultan no apropiados o no aplicables. El objetivo de este trabajo es comparar el desempeño de las regresiones Lasso y SCAD en escenarios donde el número de variables importantes esté próximo al número de observaciones. Se simularon distintos conjuntos de datos en los cuales las variables respuestas son funciones lineales de varios predictores independientes y errores que se si-mulan con distribución normal. Las regresiones LASSO y SCAD se ofrecen como una alternativa válida para selección de variables con gran número de predictores, aunque pueden no ser las más adecuadas cuando la cantidad de efectos significativos se aproxima al número de observaciones.
Sociedad Argentina de Informática e Investigación Operativa (SADIO)
description Uno de los retos más importantes del análisis estadístico en esos grandes volúmenes de datos es detectar cuál es la información valiosa. Las regresiones regularizadas, tales como Lasso o SCAD son alternativas usua-les cuando los métodos usuales de selección de variables en los modelos linea-les resultan no apropiados o no aplicables. El objetivo de este trabajo es comparar el desempeño de las regresiones Lasso y SCAD en escenarios donde el número de variables importantes esté próximo al número de observaciones. Se simularon distintos conjuntos de datos en los cuales las variables respuestas son funciones lineales de varios predictores independientes y errores que se si-mulan con distribución normal. Las regresiones LASSO y SCAD se ofrecen como una alternativa válida para selección de variables con gran número de predictores, aunque pueden no ser las más adecuadas cuando la cantidad de efectos significativos se aproxima al número de observaciones.
publishDate 2016
dc.date.none.fl_str_mv 2016-09
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/56848
url http://sedici.unlp.edu.ar/handle/10915/56848
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/http://45jaiio.sadio.org.ar/sites/default/files/AGRANDA-14.pdf
info:eu-repo/semantics/altIdentifier/issn/2451-7569
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-sa/3.0/
Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-sa/3.0/
Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0)
dc.format.none.fl_str_mv application/pdf
128-131
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1846064034508439552
score 13.22299