Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
- Autores
- Srpositto, Osvaldo Mario; Bossero, Julio; Ledesma, Viviana; Matteo, Lorena; Quevedo, Sebastián
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba.
Red de Universidades con Carreras en Informática - Materia
-
Ciencias Informáticas
Agrupación
Coeficiente Silhouette
Centroides - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/176252
Ver los metadatos del registro completo
id |
SEDICI_a132ff4fad6a44c37e8246b448435b50 |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/176252 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simuladorSrpositto, Osvaldo MarioBossero, JulioLedesma, VivianaMatteo, LorenaQuevedo, SebastiánCiencias InformáticasAgrupaciónCoeficiente SilhouetteCentroidesEl presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba.Red de Universidades con Carreras en Informática2024-04info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf169-174http://sedici.unlp.edu.ar/handle/10915/176252spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-8352-57-2info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/173603info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:47:28Zoai:sedici.unlp.edu.ar:10915/176252Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:47:28.647SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
title |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
spellingShingle |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador Srpositto, Osvaldo Mario Ciencias Informáticas Agrupación Coeficiente Silhouette Centroides |
title_short |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
title_full |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
title_fullStr |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
title_full_unstemmed |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
title_sort |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
dc.creator.none.fl_str_mv |
Srpositto, Osvaldo Mario Bossero, Julio Ledesma, Viviana Matteo, Lorena Quevedo, Sebastián |
author |
Srpositto, Osvaldo Mario |
author_facet |
Srpositto, Osvaldo Mario Bossero, Julio Ledesma, Viviana Matteo, Lorena Quevedo, Sebastián |
author_role |
author |
author2 |
Bossero, Julio Ledesma, Viviana Matteo, Lorena Quevedo, Sebastián |
author2_role |
author author author author |
dc.subject.none.fl_str_mv |
Ciencias Informáticas Agrupación Coeficiente Silhouette Centroides |
topic |
Ciencias Informáticas Agrupación Coeficiente Silhouette Centroides |
dc.description.none.fl_txt_mv |
El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba. Red de Universidades con Carreras en Informática |
description |
El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-04 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/176252 |
url |
http://sedici.unlp.edu.ar/handle/10915/176252 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/isbn/978-987-8352-57-2 info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/173603 |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
dc.format.none.fl_str_mv |
application/pdf 169-174 |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1844616338016829440 |
score |
13.070432 |