Clasificación de datos desbalanceados : Su aplicación en la predicción de bajas de beneficiarios de un servicio de salud privado
- Autores
- Martinelli, Jonatan Emanuel
- Año de publicación
- 2022
- Idioma
- español castellano
- Tipo de recurso
- tesis de maestría
- Estado
- versión aceptada
- Colaborador/a o director/a de tesis
- Hasperué, Waldo
Giandini, Roxana Silvia
Ronchetti, Franco
Bria, Oscar N. - Descripción
- El problema de las distribuciones de datos no balanceados entre clases ha recibido una atención considerable en disciplinas como el Aprendizaje Automático y Minería de Datos. En el contexto de problemas de clasificación un conjunto de datos no está balanceado si una de las clases -mayoritaria- está sensiblemente más representada que el resto. Por tanto, se puede conducir a aprendizajes sesgados en perjuicio de la clase minoritaria, que usualmente, contiene los casos de mayor interés. Por ello, este trabajo pretende estudiar diversas estrategias de balanceo de clases las cuales se aplicarán a la baja de beneficiarios de un servicio de cobertura médica. Cada estrategia dará lugar a diferentes versiones del conjunto de datos original para la misma representación; luego, para cada variante del set de datos, se aplicarán las mismas técnicas predictivas. De esta forma se obtendrán diversos modelos y se analizarán sus rendimientos mediante las métricas precision, recall, accuracy y F-Measure.
Especialista en Inteligencia de Datos orientada a Big Data
Universidad Nacional de La Plata
Facultad de Informática - Materia
-
Informática
Desbalance de clases
Métodos de balanceo de clases
Clasificación
Machine Learning - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/147410
Ver los metadatos del registro completo
id |
SEDICI_2625df5ecd8c39405878f3f2cfbd28ae |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/147410 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Clasificación de datos desbalanceados : Su aplicación en la predicción de bajas de beneficiarios de un servicio de salud privadoMartinelli, Jonatan EmanuelInformáticaDesbalance de clasesMétodos de balanceo de clasesClasificaciónMachine LearningEl problema de las distribuciones de datos no balanceados entre clases ha recibido una atención considerable en disciplinas como el Aprendizaje Automático y Minería de Datos. En el contexto de problemas de clasificación un conjunto de datos no está balanceado si una de las clases -mayoritaria- está sensiblemente más representada que el resto. Por tanto, se puede conducir a aprendizajes sesgados en perjuicio de la clase minoritaria, que usualmente, contiene los casos de mayor interés. Por ello, este trabajo pretende estudiar diversas estrategias de balanceo de clases las cuales se aplicarán a la baja de beneficiarios de un servicio de cobertura médica. Cada estrategia dará lugar a diferentes versiones del conjunto de datos original para la misma representación; luego, para cada variante del set de datos, se aplicarán las mismas técnicas predictivas. De esta forma se obtendrán diversos modelos y se analizarán sus rendimientos mediante las métricas precision, recall, accuracy y F-Measure.Especialista en Inteligencia de Datos orientada a Big DataUniversidad Nacional de La PlataFacultad de InformáticaHasperué, WaldoGiandini, Roxana SilviaRonchetti, FrancoBria, Oscar N.2022-05-11info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTrabajo de especializacionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/147410spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-03T11:09:44Zoai:sedici.unlp.edu.ar:10915/147410Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-03 11:09:44.427SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Clasificación de datos desbalanceados : Su aplicación en la predicción de bajas de beneficiarios de un servicio de salud privado |
title |
Clasificación de datos desbalanceados : Su aplicación en la predicción de bajas de beneficiarios de un servicio de salud privado |
spellingShingle |
Clasificación de datos desbalanceados : Su aplicación en la predicción de bajas de beneficiarios de un servicio de salud privado Martinelli, Jonatan Emanuel Informática Desbalance de clases Métodos de balanceo de clases Clasificación Machine Learning |
title_short |
Clasificación de datos desbalanceados : Su aplicación en la predicción de bajas de beneficiarios de un servicio de salud privado |
title_full |
Clasificación de datos desbalanceados : Su aplicación en la predicción de bajas de beneficiarios de un servicio de salud privado |
title_fullStr |
Clasificación de datos desbalanceados : Su aplicación en la predicción de bajas de beneficiarios de un servicio de salud privado |
title_full_unstemmed |
Clasificación de datos desbalanceados : Su aplicación en la predicción de bajas de beneficiarios de un servicio de salud privado |
title_sort |
Clasificación de datos desbalanceados : Su aplicación en la predicción de bajas de beneficiarios de un servicio de salud privado |
dc.creator.none.fl_str_mv |
Martinelli, Jonatan Emanuel |
author |
Martinelli, Jonatan Emanuel |
author_facet |
Martinelli, Jonatan Emanuel |
author_role |
author |
dc.contributor.none.fl_str_mv |
Hasperué, Waldo Giandini, Roxana Silvia Ronchetti, Franco Bria, Oscar N. |
dc.subject.none.fl_str_mv |
Informática Desbalance de clases Métodos de balanceo de clases Clasificación Machine Learning |
topic |
Informática Desbalance de clases Métodos de balanceo de clases Clasificación Machine Learning |
dc.description.none.fl_txt_mv |
El problema de las distribuciones de datos no balanceados entre clases ha recibido una atención considerable en disciplinas como el Aprendizaje Automático y Minería de Datos. En el contexto de problemas de clasificación un conjunto de datos no está balanceado si una de las clases -mayoritaria- está sensiblemente más representada que el resto. Por tanto, se puede conducir a aprendizajes sesgados en perjuicio de la clase minoritaria, que usualmente, contiene los casos de mayor interés. Por ello, este trabajo pretende estudiar diversas estrategias de balanceo de clases las cuales se aplicarán a la baja de beneficiarios de un servicio de cobertura médica. Cada estrategia dará lugar a diferentes versiones del conjunto de datos original para la misma representación; luego, para cada variante del set de datos, se aplicarán las mismas técnicas predictivas. De esta forma se obtendrán diversos modelos y se analizarán sus rendimientos mediante las métricas precision, recall, accuracy y F-Measure. Especialista en Inteligencia de Datos orientada a Big Data Universidad Nacional de La Plata Facultad de Informática |
description |
El problema de las distribuciones de datos no balanceados entre clases ha recibido una atención considerable en disciplinas como el Aprendizaje Automático y Minería de Datos. En el contexto de problemas de clasificación un conjunto de datos no está balanceado si una de las clases -mayoritaria- está sensiblemente más representada que el resto. Por tanto, se puede conducir a aprendizajes sesgados en perjuicio de la clase minoritaria, que usualmente, contiene los casos de mayor interés. Por ello, este trabajo pretende estudiar diversas estrategias de balanceo de clases las cuales se aplicarán a la baja de beneficiarios de un servicio de cobertura médica. Cada estrategia dará lugar a diferentes versiones del conjunto de datos original para la misma representación; luego, para cada variante del set de datos, se aplicarán las mismas técnicas predictivas. De esta forma se obtendrán diversos modelos y se analizarán sus rendimientos mediante las métricas precision, recall, accuracy y F-Measure. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-05-11 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis info:eu-repo/semantics/acceptedVersion Trabajo de especializacion http://purl.org/coar/resource_type/c_bdcc info:ar-repo/semantics/tesisDeMaestria |
format |
masterThesis |
status_str |
acceptedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/147410 |
url |
http://sedici.unlp.edu.ar/handle/10915/147410 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1842260600007163904 |
score |
13.13397 |