Estudos empíricos dos métodos de balanceamento para a classificação

Autores
Lara, Daiany Francisca; Ramirez Pozo, Aurora Trinidad; Garcia, Léo Manoel Lopes da Silva; Perez, Cláudia Alves; Antunes, Franciano
Año de publicación
2017
Idioma
portugués
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
A classificação tem o objetivo de rotular eventos ou objetos de acordo com classes pré-estabelecidas. No entanto, a maioria dos algoritmos perdem a capacidade de predição, quando o conjunto de dados possui uma distribuição desbalanceada entre suas classes. Para tentar resolver esse problema diversos métodos tęm sido propostos na literatura. O presente estudo tem como objetivo analisar e comparar os métodos mais conhecidos que se propõem a resolver o problema de classificação com bases desbalanceadas. Para isto, os métodos foram testados usando cinco classificadores tradicionais, e 13 bases provenientes do UCI Machine Learning Repository. Os resultados demonstram que é possível melhorar a taxa de classificação, mas é difícil dizer o método que se comporta melhor, pois tudo depende de como o algoritmo de classificação generaliza a base.
Sociedad Argentina de Informática e Investigación Operativa
Materia
Ciencias Informáticas
bases desbalanceadas
classificação
métodos
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/65949

id SEDICI_72df5f413aa6ac410b39bd3e8c20ff18
oai_identifier_str oai:sedici.unlp.edu.ar:10915/65949
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Estudos empíricos dos métodos de balanceamento para a classificaçãoLara, Daiany FranciscaRamirez Pozo, Aurora TrinidadGarcia, Léo Manoel Lopes da SilvaPerez, Cláudia AlvesAntunes, FrancianoCiencias Informáticasbases desbalanceadasclassificaçãométodosA classificação tem o objetivo de rotular eventos ou objetos de acordo com classes pré-estabelecidas. No entanto, a maioria dos algoritmos perdem a capacidade de predição, quando o conjunto de dados possui uma distribuição desbalanceada entre suas classes. Para tentar resolver esse problema diversos métodos tęm sido propostos na literatura. O presente estudo tem como objetivo analisar e comparar os métodos mais conhecidos que se propõem a resolver o problema de classificação com bases desbalanceadas. Para isto, os métodos foram testados usando cinco classificadores tradicionais, e 13 bases provenientes do UCI Machine Learning Repository. Os resultados demonstram que é possível melhorar a taxa de classificação, mas é difícil dizer o método que se comporta melhor, pois tudo depende de como o algoritmo de classificação generaliza a base.Sociedad Argentina de Informática e Investigación Operativa2017-09info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf100-109http://sedici.unlp.edu.ar/handle/10915/65949info:eu-repo/semantics/altIdentifier/url/http://www.clei2017-46jaiio.sadio.org.ar/sites/default/files/Mem/ASAI/asai-13.pdfinfo:eu-repo/semantics/altIdentifier/issn/2451-7585info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-sa/4.0/Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)porreponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-03T10:41:47Zoai:sedici.unlp.edu.ar:10915/65949Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-03 10:41:47.35SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Estudos empíricos dos métodos de balanceamento para a classificação
title Estudos empíricos dos métodos de balanceamento para a classificação
spellingShingle Estudos empíricos dos métodos de balanceamento para a classificação
Lara, Daiany Francisca
Ciencias Informáticas
bases desbalanceadas
classificação
métodos
title_short Estudos empíricos dos métodos de balanceamento para a classificação
title_full Estudos empíricos dos métodos de balanceamento para a classificação
title_fullStr Estudos empíricos dos métodos de balanceamento para a classificação
title_full_unstemmed Estudos empíricos dos métodos de balanceamento para a classificação
title_sort Estudos empíricos dos métodos de balanceamento para a classificação
dc.creator.none.fl_str_mv Lara, Daiany Francisca
Ramirez Pozo, Aurora Trinidad
Garcia, Léo Manoel Lopes da Silva
Perez, Cláudia Alves
Antunes, Franciano
author Lara, Daiany Francisca
author_facet Lara, Daiany Francisca
Ramirez Pozo, Aurora Trinidad
Garcia, Léo Manoel Lopes da Silva
Perez, Cláudia Alves
Antunes, Franciano
author_role author
author2 Ramirez Pozo, Aurora Trinidad
Garcia, Léo Manoel Lopes da Silva
Perez, Cláudia Alves
Antunes, Franciano
author2_role author
author
author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
bases desbalanceadas
classificação
métodos
topic Ciencias Informáticas
bases desbalanceadas
classificação
métodos
dc.description.none.fl_txt_mv A classificação tem o objetivo de rotular eventos ou objetos de acordo com classes pré-estabelecidas. No entanto, a maioria dos algoritmos perdem a capacidade de predição, quando o conjunto de dados possui uma distribuição desbalanceada entre suas classes. Para tentar resolver esse problema diversos métodos tęm sido propostos na literatura. O presente estudo tem como objetivo analisar e comparar os métodos mais conhecidos que se propõem a resolver o problema de classificação com bases desbalanceadas. Para isto, os métodos foram testados usando cinco classificadores tradicionais, e 13 bases provenientes do UCI Machine Learning Repository. Os resultados demonstram que é possível melhorar a taxa de classificação, mas é difícil dizer o método que se comporta melhor, pois tudo depende de como o algoritmo de classificação generaliza a base.
Sociedad Argentina de Informática e Investigación Operativa
description A classificação tem o objetivo de rotular eventos ou objetos de acordo com classes pré-estabelecidas. No entanto, a maioria dos algoritmos perdem a capacidade de predição, quando o conjunto de dados possui uma distribuição desbalanceada entre suas classes. Para tentar resolver esse problema diversos métodos tęm sido propostos na literatura. O presente estudo tem como objetivo analisar e comparar os métodos mais conhecidos que se propõem a resolver o problema de classificação com bases desbalanceadas. Para isto, os métodos foram testados usando cinco classificadores tradicionais, e 13 bases provenientes do UCI Machine Learning Repository. Os resultados demonstram que é possível melhorar a taxa de classificação, mas é difícil dizer o método que se comporta melhor, pois tudo depende de como o algoritmo de classificação generaliza a base.
publishDate 2017
dc.date.none.fl_str_mv 2017-09
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/65949
url http://sedici.unlp.edu.ar/handle/10915/65949
dc.language.none.fl_str_mv por
language por
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/http://www.clei2017-46jaiio.sadio.org.ar/sites/default/files/Mem/ASAI/asai-13.pdf
info:eu-repo/semantics/altIdentifier/issn/2451-7585
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-sa/4.0/
Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-sa/4.0/
Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
dc.format.none.fl_str_mv application/pdf
100-109
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1842260284962504704
score 13.13397