Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador

Autores: Srpositto, Osvaldo Mario; Bossero, Julio; Ledesma, Viviana; Matteo, Lorena; Quevedo, Sebastián
Año de publicación: 2024
Idioma: español castellano
Tipo de recurso: documento de conferencia
Estado: versión publicada
Descripción: El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba.
Red de Universidades con Carreras en Informática
Materia: Ciencias Informáticas
Agrupación
Coeficiente Silhouette
Centroides
Nivel de accesibilidad: acceso abierto
Condiciones de uso: http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
Institución: Universidad Nacional de La Plata
OAI Identificador: oai:sedici.unlp.edu.ar:10915/176252

Acceder

id	SEDICI_a132ff4fad6a44c37e8246b448435b50
oai_identifier_str	oai:sedici.unlp.edu.ar:10915/176252
network_acronym_str	SEDICI
repository_id_str	1329
network_name_str	SEDICI (UNLP)
spelling	Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simuladorSrpositto, Osvaldo MarioBossero, JulioLedesma, VivianaMatteo, LorenaQuevedo, SebastiánCiencias InformáticasAgrupaciónCoeficiente SilhouetteCentroidesEl presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba.Red de Universidades con Carreras en Informática2024-04info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf169-174http://sedici.unlp.edu.ar/handle/10915/176252spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-8352-57-2info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/173603info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-05-13T12:53:48Zoai:sedici.unlp.edu.ar:10915/176252Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-05-13 12:53:48.714SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv	Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
title	Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
spellingShingle	Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador Srpositto, Osvaldo Mario Ciencias Informáticas Agrupación Coeficiente Silhouette Centroides
title_short	Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
title_full	Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
title_fullStr	Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
title_full_unstemmed	Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
title_sort	Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
dc.creator.none.fl_str_mv	Srpositto, Osvaldo Mario Bossero, Julio Ledesma, Viviana Matteo, Lorena Quevedo, Sebastián
author	Srpositto, Osvaldo Mario
author_facet	Srpositto, Osvaldo Mario Bossero, Julio Ledesma, Viviana Matteo, Lorena Quevedo, Sebastián
author_role	author
author2	Bossero, Julio Ledesma, Viviana Matteo, Lorena Quevedo, Sebastián
author2_role	author author author author
dc.subject.none.fl_str_mv	Ciencias Informáticas Agrupación Coeficiente Silhouette Centroides
topic	Ciencias Informáticas Agrupación Coeficiente Silhouette Centroides
dc.description.none.fl_txt_mv	El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba. Red de Universidades con Carreras en Informática
description	El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba.
publishDate	2024
dc.date.none.fl_str_mv	2024-04
dc.type.none.fl_str_mv	info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia
format	conferenceObject
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://sedici.unlp.edu.ar/handle/10915/176252
url	http://sedici.unlp.edu.ar/handle/10915/176252
dc.language.none.fl_str_mv	spa
language	spa
dc.relation.none.fl_str_mv	info:eu-repo/semantics/altIdentifier/isbn/978-987-8352-57-2 info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/173603
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv	openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv	application/pdf 169-174
dc.source.none.fl_str_mv	reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP
reponame_str	SEDICI (UNLP)
collection	SEDICI (UNLP)
instname_str	Universidad Nacional de La Plata
instacron_str	UNLP
institution	UNLP
repository.name.fl_str_mv	SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv	alira@sedici.unlp.edu.ar
_version_	1865172352339279872
score	13.115601

Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador

Publicaciones similares