SMOTE, algoritmo para balanceo de clases en un estudio aplicado a la ganadería

Autores
Spositto, Osvaldo Mario; Blanco, Gabriel Esteban; Matteo, Lorena; Levi, Marcelo; Bossero, Julio
Año de publicación
2020
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
En el estudio de los algoritmos de Minería de Datos del tipo supervisados surge el problema del desbalance de clases, que implica que la información no se encuentre distribuida equitativamente entre todas las clases que la componen, por lo que se generan efectos no deseados en el proceso de clasificación. Este trabajo considera el caso de conjuntos de datos que solamente tiene dos clases y una de ellas cuenta con una mayor cantidad de ejemplos que la otra. El interés principal del trabajo es la aplicación de la técnica de balanceo de clases SMOTE (Synthetic Minority Oversampling Technique), que con algoritmos de interpolación incrementa en forma “sintética” los ejemplos de la clase minoritaria. Los resultados experimentales muestran que algunas técnicas, en el proceso de entrenamiento, obtienen mejores porcentajes de clasificación, cuando se usan estos datos artificiales. El dataset utilizado registra la Diferencia Esperada entre Progenie de animales de la raza Aberdeen Angus.
Workshop: WBDMD – Bases de Datos y Minería de Datos
Red de Universidades con Carreras en Informática
Materia
Ciencias Informáticas
Desbalance de clases
SMOTE
Algoritmos supervisados
Weka
DEP
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/114339

id SEDICI_75d2ce36a62beaf81e158e4b3b2f93c8
oai_identifier_str oai:sedici.unlp.edu.ar:10915/114339
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling SMOTE, algoritmo para balanceo de clases en un estudio aplicado a la ganaderíaSpositto, Osvaldo MarioBlanco, Gabriel EstebanMatteo, LorenaLevi, MarceloBossero, JulioCiencias InformáticasDesbalance de clasesSMOTEAlgoritmos supervisadosWekaDEPEn el estudio de los algoritmos de Minería de Datos del tipo supervisados surge el problema del desbalance de clases, que implica que la información no se encuentre distribuida equitativamente entre todas las clases que la componen, por lo que se generan efectos no deseados en el proceso de clasificación. Este trabajo considera el caso de conjuntos de datos que solamente tiene dos clases y una de ellas cuenta con una mayor cantidad de ejemplos que la otra. El interés principal del trabajo es la aplicación de la técnica de balanceo de clases SMOTE (Synthetic Minority Oversampling Technique), que con algoritmos de interpolación incrementa en forma “sintética” los ejemplos de la clase minoritaria. Los resultados experimentales muestran que algunas técnicas, en el proceso de entrenamiento, obtienen mejores porcentajes de clasificación, cuando se usan estos datos artificiales. El dataset utilizado registra la Diferencia Esperada entre Progenie de animales de la raza Aberdeen Angus.Workshop: WBDMD – Bases de Datos y Minería de DatosRed de Universidades con Carreras en Informática2020-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf289-298http://sedici.unlp.edu.ar/handle/10915/114339spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-4417-90-9info:eu-repo/semantics/reference/hdl/10915/113243info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-11-05T13:05:57Zoai:sedici.unlp.edu.ar:10915/114339Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-11-05 13:05:58.042SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv SMOTE, algoritmo para balanceo de clases en un estudio aplicado a la ganadería
title SMOTE, algoritmo para balanceo de clases en un estudio aplicado a la ganadería
spellingShingle SMOTE, algoritmo para balanceo de clases en un estudio aplicado a la ganadería
Spositto, Osvaldo Mario
Ciencias Informáticas
Desbalance de clases
SMOTE
Algoritmos supervisados
Weka
DEP
title_short SMOTE, algoritmo para balanceo de clases en un estudio aplicado a la ganadería
title_full SMOTE, algoritmo para balanceo de clases en un estudio aplicado a la ganadería
title_fullStr SMOTE, algoritmo para balanceo de clases en un estudio aplicado a la ganadería
title_full_unstemmed SMOTE, algoritmo para balanceo de clases en un estudio aplicado a la ganadería
title_sort SMOTE, algoritmo para balanceo de clases en un estudio aplicado a la ganadería
dc.creator.none.fl_str_mv Spositto, Osvaldo Mario
Blanco, Gabriel Esteban
Matteo, Lorena
Levi, Marcelo
Bossero, Julio
author Spositto, Osvaldo Mario
author_facet Spositto, Osvaldo Mario
Blanco, Gabriel Esteban
Matteo, Lorena
Levi, Marcelo
Bossero, Julio
author_role author
author2 Blanco, Gabriel Esteban
Matteo, Lorena
Levi, Marcelo
Bossero, Julio
author2_role author
author
author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Desbalance de clases
SMOTE
Algoritmos supervisados
Weka
DEP
topic Ciencias Informáticas
Desbalance de clases
SMOTE
Algoritmos supervisados
Weka
DEP
dc.description.none.fl_txt_mv En el estudio de los algoritmos de Minería de Datos del tipo supervisados surge el problema del desbalance de clases, que implica que la información no se encuentre distribuida equitativamente entre todas las clases que la componen, por lo que se generan efectos no deseados en el proceso de clasificación. Este trabajo considera el caso de conjuntos de datos que solamente tiene dos clases y una de ellas cuenta con una mayor cantidad de ejemplos que la otra. El interés principal del trabajo es la aplicación de la técnica de balanceo de clases SMOTE (Synthetic Minority Oversampling Technique), que con algoritmos de interpolación incrementa en forma “sintética” los ejemplos de la clase minoritaria. Los resultados experimentales muestran que algunas técnicas, en el proceso de entrenamiento, obtienen mejores porcentajes de clasificación, cuando se usan estos datos artificiales. El dataset utilizado registra la Diferencia Esperada entre Progenie de animales de la raza Aberdeen Angus.
Workshop: WBDMD – Bases de Datos y Minería de Datos
Red de Universidades con Carreras en Informática
description En el estudio de los algoritmos de Minería de Datos del tipo supervisados surge el problema del desbalance de clases, que implica que la información no se encuentre distribuida equitativamente entre todas las clases que la componen, por lo que se generan efectos no deseados en el proceso de clasificación. Este trabajo considera el caso de conjuntos de datos que solamente tiene dos clases y una de ellas cuenta con una mayor cantidad de ejemplos que la otra. El interés principal del trabajo es la aplicación de la técnica de balanceo de clases SMOTE (Synthetic Minority Oversampling Technique), que con algoritmos de interpolación incrementa en forma “sintética” los ejemplos de la clase minoritaria. Los resultados experimentales muestran que algunas técnicas, en el proceso de entrenamiento, obtienen mejores porcentajes de clasificación, cuando se usan estos datos artificiales. El dataset utilizado registra la Diferencia Esperada entre Progenie de animales de la raza Aberdeen Angus.
publishDate 2020
dc.date.none.fl_str_mv 2020-10
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/114339
url http://sedici.unlp.edu.ar/handle/10915/114339
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/isbn/978-987-4417-90-9
info:eu-repo/semantics/reference/hdl/10915/113243
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
289-298
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1847978705750589440
score 13.087074