Índices de validación para algoritmos de agrupamiento

Autores
Campo, David Nazareno
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión aceptada
Colaborador/a o director/a de tesis
Stegmayer, Georgina
Vignolo, Leandro Daniel
Chiotti, Omar
Murillo, Javier Iván
Schiaffino, Silvia
Milone, Diego Humberto
Descripción
Fil: Campo, David Nazareno. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.
External validation indexes allow similarities between two clustering solutions to be quantified. With classical external indexes, it is possible to quantify how similar two disjoint clustering solutions are, where each object can only belong to a single cluster. However, in practical applications, it is common for an object to have more than one label, thereby belonging to overlapped clusters; for example, subjects that belong to multiple communities in social networks. In this thesis, we propose a new index based on an intuitive probabilistic approach that is applicable to overlapped clusters. Given that recently there has been a remarkable increase in the analysis of data with naturally overlapped clusters, this new index allows to comparing clustering algorithms correctly. After presenting the new index, experiments with artificial and real datasets are shown and analyzed. Results over a real social network are also presented and discussed. The results indicate that the new index can correctly measure the similarity between two partitions of the dataset when there are different levels of overlap in the analyzed clusters.
Los índices de validación externa permiten medir y cuantificar la similaridad entre soluciones de agrupamiento. Con la ayuda de los índices clásicos de validación externa, es posible medir que tan similares son dos soluciones de agrupamiento con grupos disjuntos, donde cada objeto pertenece a un único grupo. Sin embargo, en situaciones prácticas, es común que un objeto pertenezca a más de un grupo, perteneciendo así a grupos solapados. Por ejemplo, personas que pertenezcan a varias comunidades en una red social. En ésta tesis, se propone un nuevo índice basado en una idea intuitiva para estimar la probabilidad de pertenencia de un objeto a un grupo, aplicable a grupos solapados. Dado que recientemente ha habido un incremento notable en el análisis de datos con grupos naturalmente solapados, éste nuevo índice permite comparar soluciones de agrupamiento de manera correcta. Luego de presentar el índice, se muestran y analizan experimentos con conjuntos de datos reales y artificiales. Además se analiza y discute la aplicación del índice al agrupamiento de una red social. Los resultados indican que el nuevo índice puede medir correctamente la similitud entre dos soluciones de agrupamiento cuando existen distintos niveles de solapamiento entre los grupos.
Universidad Nacional del Litoral
Agencia Nacional de Promoción Científica y Tecnológica
Universidad Tecnológica Nacional
Consejo Nacional de Investigaciones Científicas y Técnicas
Materia
Overlapped clusters
External validation
Validation indexes
Cluster perturbation
Grupos solapados
Validación externa
Índices de validación
Perturbación de grupos
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
Repositorio
Biblioteca Virtual (UNL)
Institución
Universidad Nacional del Litoral
OAI Identificador
oai:https://bibliotecavirtual.unl.edu.ar:11185/1204

id UNLBT_db00b4b5c36e7748760a073d58c89774
oai_identifier_str oai:https://bibliotecavirtual.unl.edu.ar:11185/1204
network_acronym_str UNLBT
repository_id_str 2187
network_name_str Biblioteca Virtual (UNL)
spelling Índices de validación para algoritmos de agrupamientoValidation indexes for clustering algorithmsCampo, David NazarenoOverlapped clustersExternal validationValidation indexesCluster perturbationGrupos solapadosValidación externaÍndices de validaciónPerturbación de gruposFil: Campo, David Nazareno. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.External validation indexes allow similarities between two clustering solutions to be quantified. With classical external indexes, it is possible to quantify how similar two disjoint clustering solutions are, where each object can only belong to a single cluster. However, in practical applications, it is common for an object to have more than one label, thereby belonging to overlapped clusters; for example, subjects that belong to multiple communities in social networks. In this thesis, we propose a new index based on an intuitive probabilistic approach that is applicable to overlapped clusters. Given that recently there has been a remarkable increase in the analysis of data with naturally overlapped clusters, this new index allows to comparing clustering algorithms correctly. After presenting the new index, experiments with artificial and real datasets are shown and analyzed. Results over a real social network are also presented and discussed. The results indicate that the new index can correctly measure the similarity between two partitions of the dataset when there are different levels of overlap in the analyzed clusters.Los índices de validación externa permiten medir y cuantificar la similaridad entre soluciones de agrupamiento. Con la ayuda de los índices clásicos de validación externa, es posible medir que tan similares son dos soluciones de agrupamiento con grupos disjuntos, donde cada objeto pertenece a un único grupo. Sin embargo, en situaciones prácticas, es común que un objeto pertenezca a más de un grupo, perteneciendo así a grupos solapados. Por ejemplo, personas que pertenezcan a varias comunidades en una red social. En ésta tesis, se propone un nuevo índice basado en una idea intuitiva para estimar la probabilidad de pertenencia de un objeto a un grupo, aplicable a grupos solapados. Dado que recientemente ha habido un incremento notable en el análisis de datos con grupos naturalmente solapados, éste nuevo índice permite comparar soluciones de agrupamiento de manera correcta. Luego de presentar el índice, se muestran y analizan experimentos con conjuntos de datos reales y artificiales. Además se analiza y discute la aplicación del índice al agrupamiento de una red social. Los resultados indican que el nuevo índice puede medir correctamente la similitud entre dos soluciones de agrupamiento cuando existen distintos niveles de solapamiento entre los grupos.Universidad Nacional del LitoralAgencia Nacional de Promoción Científica y TecnológicaUniversidad Tecnológica NacionalConsejo Nacional de Investigaciones Científicas y TécnicasStegmayer, GeorginaVignolo, Leandro DanielChiotti, OmarMurillo, Javier IvánSchiaffino, SilviaMilone, Diego Humberto2019-05-302019-04-29info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionSNRDhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttp://hdl.handle.net/11185/1204spaspainfo:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)http://creativecommons.org/licenses/by-nc-nd/4.0/deed.esreponame:Biblioteca Virtual (UNL)instname:Universidad Nacional del Litoralinstacron:UNL2025-09-29T14:30:08Zoai:https://bibliotecavirtual.unl.edu.ar:11185/1204Institucionalhttp://bibliotecavirtual.unl.edu.ar/Universidad públicaNo correspondeajdeba@unl.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:21872025-09-29 14:30:09.01Biblioteca Virtual (UNL) - Universidad Nacional del Litoralfalse
dc.title.none.fl_str_mv Índices de validación para algoritmos de agrupamiento
Validation indexes for clustering algorithms
title Índices de validación para algoritmos de agrupamiento
spellingShingle Índices de validación para algoritmos de agrupamiento
Campo, David Nazareno
Overlapped clusters
External validation
Validation indexes
Cluster perturbation
Grupos solapados
Validación externa
Índices de validación
Perturbación de grupos
title_short Índices de validación para algoritmos de agrupamiento
title_full Índices de validación para algoritmos de agrupamiento
title_fullStr Índices de validación para algoritmos de agrupamiento
title_full_unstemmed Índices de validación para algoritmos de agrupamiento
title_sort Índices de validación para algoritmos de agrupamiento
dc.creator.none.fl_str_mv Campo, David Nazareno
author Campo, David Nazareno
author_facet Campo, David Nazareno
author_role author
dc.contributor.none.fl_str_mv Stegmayer, Georgina
Vignolo, Leandro Daniel
Chiotti, Omar
Murillo, Javier Iván
Schiaffino, Silvia
Milone, Diego Humberto
dc.subject.none.fl_str_mv Overlapped clusters
External validation
Validation indexes
Cluster perturbation
Grupos solapados
Validación externa
Índices de validación
Perturbación de grupos
topic Overlapped clusters
External validation
Validation indexes
Cluster perturbation
Grupos solapados
Validación externa
Índices de validación
Perturbación de grupos
dc.description.none.fl_txt_mv Fil: Campo, David Nazareno. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.
External validation indexes allow similarities between two clustering solutions to be quantified. With classical external indexes, it is possible to quantify how similar two disjoint clustering solutions are, where each object can only belong to a single cluster. However, in practical applications, it is common for an object to have more than one label, thereby belonging to overlapped clusters; for example, subjects that belong to multiple communities in social networks. In this thesis, we propose a new index based on an intuitive probabilistic approach that is applicable to overlapped clusters. Given that recently there has been a remarkable increase in the analysis of data with naturally overlapped clusters, this new index allows to comparing clustering algorithms correctly. After presenting the new index, experiments with artificial and real datasets are shown and analyzed. Results over a real social network are also presented and discussed. The results indicate that the new index can correctly measure the similarity between two partitions of the dataset when there are different levels of overlap in the analyzed clusters.
Los índices de validación externa permiten medir y cuantificar la similaridad entre soluciones de agrupamiento. Con la ayuda de los índices clásicos de validación externa, es posible medir que tan similares son dos soluciones de agrupamiento con grupos disjuntos, donde cada objeto pertenece a un único grupo. Sin embargo, en situaciones prácticas, es común que un objeto pertenezca a más de un grupo, perteneciendo así a grupos solapados. Por ejemplo, personas que pertenezcan a varias comunidades en una red social. En ésta tesis, se propone un nuevo índice basado en una idea intuitiva para estimar la probabilidad de pertenencia de un objeto a un grupo, aplicable a grupos solapados. Dado que recientemente ha habido un incremento notable en el análisis de datos con grupos naturalmente solapados, éste nuevo índice permite comparar soluciones de agrupamiento de manera correcta. Luego de presentar el índice, se muestran y analizan experimentos con conjuntos de datos reales y artificiales. Además se analiza y discute la aplicación del índice al agrupamiento de una red social. Los resultados indican que el nuevo índice puede medir correctamente la similitud entre dos soluciones de agrupamiento cuando existen distintos niveles de solapamiento entre los grupos.
Universidad Nacional del Litoral
Agencia Nacional de Promoción Científica y Tecnológica
Universidad Tecnológica Nacional
Consejo Nacional de Investigaciones Científicas y Técnicas
description Fil: Campo, David Nazareno. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.
publishDate 2019
dc.date.none.fl_str_mv 2019-05-30
2019-04-29
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/acceptedVersion
SNRD
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str acceptedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11185/1204
url http://hdl.handle.net/11185/1204
dc.language.none.fl_str_mv spa
spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
eu_rights_str_mv openAccess
rights_invalid_str_mv Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Virtual (UNL)
instname:Universidad Nacional del Litoral
instacron:UNL
reponame_str Biblioteca Virtual (UNL)
collection Biblioteca Virtual (UNL)
instname_str Universidad Nacional del Litoral
instacron_str UNL
institution UNL
repository.name.fl_str_mv Biblioteca Virtual (UNL) - Universidad Nacional del Litoral
repository.mail.fl_str_mv jdeba@unl.edu.ar
_version_ 1844621939344146432
score 12.559606