Índices de validación para algoritmos de agrupamiento
- Autores
- Campo, David Nazareno
- Año de publicación
- 2019
- Idioma
- español castellano
- Tipo de recurso
- tesis doctoral
- Estado
- versión aceptada
- Colaborador/a o director/a de tesis
- Stegmayer, Georgina
Vignolo, Leandro Daniel
Chiotti, Omar
Murillo, Javier Iván
Schiaffino, Silvia
Milone, Diego Humberto - Descripción
- Fil: Campo, David Nazareno. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.
External validation indexes allow similarities between two clustering solutions to be quantified. With classical external indexes, it is possible to quantify how similar two disjoint clustering solutions are, where each object can only belong to a single cluster. However, in practical applications, it is common for an object to have more than one label, thereby belonging to overlapped clusters; for example, subjects that belong to multiple communities in social networks. In this thesis, we propose a new index based on an intuitive probabilistic approach that is applicable to overlapped clusters. Given that recently there has been a remarkable increase in the analysis of data with naturally overlapped clusters, this new index allows to comparing clustering algorithms correctly. After presenting the new index, experiments with artificial and real datasets are shown and analyzed. Results over a real social network are also presented and discussed. The results indicate that the new index can correctly measure the similarity between two partitions of the dataset when there are different levels of overlap in the analyzed clusters.
Los índices de validación externa permiten medir y cuantificar la similaridad entre soluciones de agrupamiento. Con la ayuda de los índices clásicos de validación externa, es posible medir que tan similares son dos soluciones de agrupamiento con grupos disjuntos, donde cada objeto pertenece a un único grupo. Sin embargo, en situaciones prácticas, es común que un objeto pertenezca a más de un grupo, perteneciendo así a grupos solapados. Por ejemplo, personas que pertenezcan a varias comunidades en una red social. En ésta tesis, se propone un nuevo índice basado en una idea intuitiva para estimar la probabilidad de pertenencia de un objeto a un grupo, aplicable a grupos solapados. Dado que recientemente ha habido un incremento notable en el análisis de datos con grupos naturalmente solapados, éste nuevo índice permite comparar soluciones de agrupamiento de manera correcta. Luego de presentar el índice, se muestran y analizan experimentos con conjuntos de datos reales y artificiales. Además se analiza y discute la aplicación del índice al agrupamiento de una red social. Los resultados indican que el nuevo índice puede medir correctamente la similitud entre dos soluciones de agrupamiento cuando existen distintos niveles de solapamiento entre los grupos.
Universidad Nacional del Litoral
Agencia Nacional de Promoción Científica y Tecnológica
Universidad Tecnológica Nacional
Consejo Nacional de Investigaciones Científicas y Técnicas - Materia
-
Overlapped clusters
External validation
Validation indexes
Cluster perturbation
Grupos solapados
Validación externa
Índices de validación
Perturbación de grupos - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
- Repositorio
- Institución
- Universidad Nacional del Litoral
- OAI Identificador
- oai:https://bibliotecavirtual.unl.edu.ar:11185/1204
Ver los metadatos del registro completo
id |
UNLBT_db00b4b5c36e7748760a073d58c89774 |
---|---|
oai_identifier_str |
oai:https://bibliotecavirtual.unl.edu.ar:11185/1204 |
network_acronym_str |
UNLBT |
repository_id_str |
2187 |
network_name_str |
Biblioteca Virtual (UNL) |
spelling |
Índices de validación para algoritmos de agrupamientoValidation indexes for clustering algorithmsCampo, David NazarenoOverlapped clustersExternal validationValidation indexesCluster perturbationGrupos solapadosValidación externaÍndices de validaciónPerturbación de gruposFil: Campo, David Nazareno. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.External validation indexes allow similarities between two clustering solutions to be quantified. With classical external indexes, it is possible to quantify how similar two disjoint clustering solutions are, where each object can only belong to a single cluster. However, in practical applications, it is common for an object to have more than one label, thereby belonging to overlapped clusters; for example, subjects that belong to multiple communities in social networks. In this thesis, we propose a new index based on an intuitive probabilistic approach that is applicable to overlapped clusters. Given that recently there has been a remarkable increase in the analysis of data with naturally overlapped clusters, this new index allows to comparing clustering algorithms correctly. After presenting the new index, experiments with artificial and real datasets are shown and analyzed. Results over a real social network are also presented and discussed. The results indicate that the new index can correctly measure the similarity between two partitions of the dataset when there are different levels of overlap in the analyzed clusters.Los índices de validación externa permiten medir y cuantificar la similaridad entre soluciones de agrupamiento. Con la ayuda de los índices clásicos de validación externa, es posible medir que tan similares son dos soluciones de agrupamiento con grupos disjuntos, donde cada objeto pertenece a un único grupo. Sin embargo, en situaciones prácticas, es común que un objeto pertenezca a más de un grupo, perteneciendo así a grupos solapados. Por ejemplo, personas que pertenezcan a varias comunidades en una red social. En ésta tesis, se propone un nuevo índice basado en una idea intuitiva para estimar la probabilidad de pertenencia de un objeto a un grupo, aplicable a grupos solapados. Dado que recientemente ha habido un incremento notable en el análisis de datos con grupos naturalmente solapados, éste nuevo índice permite comparar soluciones de agrupamiento de manera correcta. Luego de presentar el índice, se muestran y analizan experimentos con conjuntos de datos reales y artificiales. Además se analiza y discute la aplicación del índice al agrupamiento de una red social. Los resultados indican que el nuevo índice puede medir correctamente la similitud entre dos soluciones de agrupamiento cuando existen distintos niveles de solapamiento entre los grupos.Universidad Nacional del LitoralAgencia Nacional de Promoción Científica y TecnológicaUniversidad Tecnológica NacionalConsejo Nacional de Investigaciones Científicas y TécnicasStegmayer, GeorginaVignolo, Leandro DanielChiotti, OmarMurillo, Javier IvánSchiaffino, SilviaMilone, Diego Humberto2019-05-302019-04-29info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionSNRDhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttp://hdl.handle.net/11185/1204spaspainfo:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)http://creativecommons.org/licenses/by-nc-nd/4.0/deed.esreponame:Biblioteca Virtual (UNL)instname:Universidad Nacional del Litoralinstacron:UNL2025-09-29T14:30:08Zoai:https://bibliotecavirtual.unl.edu.ar:11185/1204Institucionalhttp://bibliotecavirtual.unl.edu.ar/Universidad públicaNo correspondeajdeba@unl.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:21872025-09-29 14:30:09.01Biblioteca Virtual (UNL) - Universidad Nacional del Litoralfalse |
dc.title.none.fl_str_mv |
Índices de validación para algoritmos de agrupamiento Validation indexes for clustering algorithms |
title |
Índices de validación para algoritmos de agrupamiento |
spellingShingle |
Índices de validación para algoritmos de agrupamiento Campo, David Nazareno Overlapped clusters External validation Validation indexes Cluster perturbation Grupos solapados Validación externa Índices de validación Perturbación de grupos |
title_short |
Índices de validación para algoritmos de agrupamiento |
title_full |
Índices de validación para algoritmos de agrupamiento |
title_fullStr |
Índices de validación para algoritmos de agrupamiento |
title_full_unstemmed |
Índices de validación para algoritmos de agrupamiento |
title_sort |
Índices de validación para algoritmos de agrupamiento |
dc.creator.none.fl_str_mv |
Campo, David Nazareno |
author |
Campo, David Nazareno |
author_facet |
Campo, David Nazareno |
author_role |
author |
dc.contributor.none.fl_str_mv |
Stegmayer, Georgina Vignolo, Leandro Daniel Chiotti, Omar Murillo, Javier Iván Schiaffino, Silvia Milone, Diego Humberto |
dc.subject.none.fl_str_mv |
Overlapped clusters External validation Validation indexes Cluster perturbation Grupos solapados Validación externa Índices de validación Perturbación de grupos |
topic |
Overlapped clusters External validation Validation indexes Cluster perturbation Grupos solapados Validación externa Índices de validación Perturbación de grupos |
dc.description.none.fl_txt_mv |
Fil: Campo, David Nazareno. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina. External validation indexes allow similarities between two clustering solutions to be quantified. With classical external indexes, it is possible to quantify how similar two disjoint clustering solutions are, where each object can only belong to a single cluster. However, in practical applications, it is common for an object to have more than one label, thereby belonging to overlapped clusters; for example, subjects that belong to multiple communities in social networks. In this thesis, we propose a new index based on an intuitive probabilistic approach that is applicable to overlapped clusters. Given that recently there has been a remarkable increase in the analysis of data with naturally overlapped clusters, this new index allows to comparing clustering algorithms correctly. After presenting the new index, experiments with artificial and real datasets are shown and analyzed. Results over a real social network are also presented and discussed. The results indicate that the new index can correctly measure the similarity between two partitions of the dataset when there are different levels of overlap in the analyzed clusters. Los índices de validación externa permiten medir y cuantificar la similaridad entre soluciones de agrupamiento. Con la ayuda de los índices clásicos de validación externa, es posible medir que tan similares son dos soluciones de agrupamiento con grupos disjuntos, donde cada objeto pertenece a un único grupo. Sin embargo, en situaciones prácticas, es común que un objeto pertenezca a más de un grupo, perteneciendo así a grupos solapados. Por ejemplo, personas que pertenezcan a varias comunidades en una red social. En ésta tesis, se propone un nuevo índice basado en una idea intuitiva para estimar la probabilidad de pertenencia de un objeto a un grupo, aplicable a grupos solapados. Dado que recientemente ha habido un incremento notable en el análisis de datos con grupos naturalmente solapados, éste nuevo índice permite comparar soluciones de agrupamiento de manera correcta. Luego de presentar el índice, se muestran y analizan experimentos con conjuntos de datos reales y artificiales. Además se analiza y discute la aplicación del índice al agrupamiento de una red social. Los resultados indican que el nuevo índice puede medir correctamente la similitud entre dos soluciones de agrupamiento cuando existen distintos niveles de solapamiento entre los grupos. Universidad Nacional del Litoral Agencia Nacional de Promoción Científica y Tecnológica Universidad Tecnológica Nacional Consejo Nacional de Investigaciones Científicas y Técnicas |
description |
Fil: Campo, David Nazareno. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-05-30 2019-04-29 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/doctoralThesis info:eu-repo/semantics/acceptedVersion SNRD http://purl.org/coar/resource_type/c_db06 info:ar-repo/semantics/tesisDoctoral |
format |
doctoralThesis |
status_str |
acceptedVersion |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11185/1204 |
url |
http://hdl.handle.net/11185/1204 |
dc.language.none.fl_str_mv |
spa spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Virtual (UNL) instname:Universidad Nacional del Litoral instacron:UNL |
reponame_str |
Biblioteca Virtual (UNL) |
collection |
Biblioteca Virtual (UNL) |
instname_str |
Universidad Nacional del Litoral |
instacron_str |
UNL |
institution |
UNL |
repository.name.fl_str_mv |
Biblioteca Virtual (UNL) - Universidad Nacional del Litoral |
repository.mail.fl_str_mv |
jdeba@unl.edu.ar |
_version_ |
1844621939344146432 |
score |
12.559606 |