Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos

Autores
Spositto, Osvaldo Mario; Bossero, Julio; Quevedo, Sebastián; Ledesma, Viviana; Matteo, Lorena
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Este trabajo presenta una evaluación exhaustiva de un método mejorado del algoritmo K-Means, aplicado a un sistema de recuperación de documentos. Los algoritmos de agrupamiento, o clustering, se utilizan para organizar documentos similares en grupos, basándose en características comunes como el contenido textual, la frecuencia de palabras y otros atributos relevantes. El método mejorado evaluado en este estudio introduce optimizaciones que reducen significativamente el tiempo de procesamiento necesario para asignar cada documento a un clúster. Esto se logra mediante una combinación de técnicas de preprocesamiento y ajustes en los criterios de convergencia del algoritmo, resultando en una menor cantidad de iteraciones y operaciones computacionales. Para evaluar el método mejorado, se llevaron a cabo una serie de experimentos utilizando un prototipo propio que construye artificialmente un conjunto de datos de documentos. En la fase de experimentación, se aplicaron tanto el algoritmo KMeans estándar como el método mejorado estudiado. La comparación se realizó en términos de tiempo de procesamiento, número de iteraciones y precisión en la agrupación de documentos. Para evaluar la calidad del agrupamiento, se empleó el coeficiente de silueta o silhouette como métrica. Los resultados mostraron que, además de reducir el tiempo de procesamiento, el método mejorado mantiene una calidad de agrupamiento equivalente a la obtenida con el K-Means clásico. Esto sugiere que las optimizaciones introducidas no comprometen la precisión del agrupamiento, sino que, por el contrario, ofrecen un rendimiento más eficiente sin sacrificar la efectividad en la clasificación de documentos.
Red de Universidades con Carreras en Informática
Materia
Ciencias Informáticas
Agrupamiento
K-Means
Inicialización
Coeficiente de Silueta
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/176490

id SEDICI_7285191cd449f031bbbfe740a1b110e6
oai_identifier_str oai:sedici.unlp.edu.ar:10915/176490
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de DocumentosSpositto, Osvaldo MarioBossero, JulioQuevedo, SebastiánLedesma, VivianaMatteo, LorenaCiencias InformáticasAgrupamientoK-MeansInicializaciónCoeficiente de SiluetaEste trabajo presenta una evaluación exhaustiva de un método mejorado del algoritmo K-Means, aplicado a un sistema de recuperación de documentos. Los algoritmos de agrupamiento, o clustering, se utilizan para organizar documentos similares en grupos, basándose en características comunes como el contenido textual, la frecuencia de palabras y otros atributos relevantes. El método mejorado evaluado en este estudio introduce optimizaciones que reducen significativamente el tiempo de procesamiento necesario para asignar cada documento a un clúster. Esto se logra mediante una combinación de técnicas de preprocesamiento y ajustes en los criterios de convergencia del algoritmo, resultando en una menor cantidad de iteraciones y operaciones computacionales. Para evaluar el método mejorado, se llevaron a cabo una serie de experimentos utilizando un prototipo propio que construye artificialmente un conjunto de datos de documentos. En la fase de experimentación, se aplicaron tanto el algoritmo KMeans estándar como el método mejorado estudiado. La comparación se realizó en términos de tiempo de procesamiento, número de iteraciones y precisión en la agrupación de documentos. Para evaluar la calidad del agrupamiento, se empleó el coeficiente de silueta o silhouette como métrica. Los resultados mostraron que, además de reducir el tiempo de procesamiento, el método mejorado mantiene una calidad de agrupamiento equivalente a la obtenida con el K-Means clásico. Esto sugiere que las optimizaciones introducidas no comprometen la precisión del agrupamiento, sino que, por el contrario, ofrecen un rendimiento más eficiente sin sacrificar la efectividad en la clasificación de documentos.Red de Universidades con Carreras en Informática2024-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf570-580http://sedici.unlp.edu.ar/handle/10915/176490spainfo:eu-repo/semantics/altIdentifier/isbn/978-950-34-2428-5info:eu-repo/semantics/reference/hdl/10915/172755info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-22T17:28:23Zoai:sedici.unlp.edu.ar:10915/176490Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-22 17:28:23.403SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
title Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
spellingShingle Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
Spositto, Osvaldo Mario
Ciencias Informáticas
Agrupamiento
K-Means
Inicialización
Coeficiente de Silueta
title_short Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
title_full Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
title_fullStr Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
title_full_unstemmed Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
title_sort Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
dc.creator.none.fl_str_mv Spositto, Osvaldo Mario
Bossero, Julio
Quevedo, Sebastián
Ledesma, Viviana
Matteo, Lorena
author Spositto, Osvaldo Mario
author_facet Spositto, Osvaldo Mario
Bossero, Julio
Quevedo, Sebastián
Ledesma, Viviana
Matteo, Lorena
author_role author
author2 Bossero, Julio
Quevedo, Sebastián
Ledesma, Viviana
Matteo, Lorena
author2_role author
author
author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Agrupamiento
K-Means
Inicialización
Coeficiente de Silueta
topic Ciencias Informáticas
Agrupamiento
K-Means
Inicialización
Coeficiente de Silueta
dc.description.none.fl_txt_mv Este trabajo presenta una evaluación exhaustiva de un método mejorado del algoritmo K-Means, aplicado a un sistema de recuperación de documentos. Los algoritmos de agrupamiento, o clustering, se utilizan para organizar documentos similares en grupos, basándose en características comunes como el contenido textual, la frecuencia de palabras y otros atributos relevantes. El método mejorado evaluado en este estudio introduce optimizaciones que reducen significativamente el tiempo de procesamiento necesario para asignar cada documento a un clúster. Esto se logra mediante una combinación de técnicas de preprocesamiento y ajustes en los criterios de convergencia del algoritmo, resultando en una menor cantidad de iteraciones y operaciones computacionales. Para evaluar el método mejorado, se llevaron a cabo una serie de experimentos utilizando un prototipo propio que construye artificialmente un conjunto de datos de documentos. En la fase de experimentación, se aplicaron tanto el algoritmo KMeans estándar como el método mejorado estudiado. La comparación se realizó en términos de tiempo de procesamiento, número de iteraciones y precisión en la agrupación de documentos. Para evaluar la calidad del agrupamiento, se empleó el coeficiente de silueta o silhouette como métrica. Los resultados mostraron que, además de reducir el tiempo de procesamiento, el método mejorado mantiene una calidad de agrupamiento equivalente a la obtenida con el K-Means clásico. Esto sugiere que las optimizaciones introducidas no comprometen la precisión del agrupamiento, sino que, por el contrario, ofrecen un rendimiento más eficiente sin sacrificar la efectividad en la clasificación de documentos.
Red de Universidades con Carreras en Informática
description Este trabajo presenta una evaluación exhaustiva de un método mejorado del algoritmo K-Means, aplicado a un sistema de recuperación de documentos. Los algoritmos de agrupamiento, o clustering, se utilizan para organizar documentos similares en grupos, basándose en características comunes como el contenido textual, la frecuencia de palabras y otros atributos relevantes. El método mejorado evaluado en este estudio introduce optimizaciones que reducen significativamente el tiempo de procesamiento necesario para asignar cada documento a un clúster. Esto se logra mediante una combinación de técnicas de preprocesamiento y ajustes en los criterios de convergencia del algoritmo, resultando en una menor cantidad de iteraciones y operaciones computacionales. Para evaluar el método mejorado, se llevaron a cabo una serie de experimentos utilizando un prototipo propio que construye artificialmente un conjunto de datos de documentos. En la fase de experimentación, se aplicaron tanto el algoritmo KMeans estándar como el método mejorado estudiado. La comparación se realizó en términos de tiempo de procesamiento, número de iteraciones y precisión en la agrupación de documentos. Para evaluar la calidad del agrupamiento, se empleó el coeficiente de silueta o silhouette como métrica. Los resultados mostraron que, además de reducir el tiempo de procesamiento, el método mejorado mantiene una calidad de agrupamiento equivalente a la obtenida con el K-Means clásico. Esto sugiere que las optimizaciones introducidas no comprometen la precisión del agrupamiento, sino que, por el contrario, ofrecen un rendimiento más eficiente sin sacrificar la efectividad en la clasificación de documentos.
publishDate 2024
dc.date.none.fl_str_mv 2024-10
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/176490
url http://sedici.unlp.edu.ar/handle/10915/176490
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/isbn/978-950-34-2428-5
info:eu-repo/semantics/reference/hdl/10915/172755
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
570-580
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1846783767298965504
score 12.982451