Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
- Autores
- Spositto, Osvaldo Mario; Bossero, Julio; Quevedo, Sebastián; Ledesma, Viviana; Matteo, Lorena
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- Este trabajo presenta una evaluación exhaustiva de un método mejorado del algoritmo K-Means, aplicado a un sistema de recuperación de documentos. Los algoritmos de agrupamiento, o clustering, se utilizan para organizar documentos similares en grupos, basándose en características comunes como el contenido textual, la frecuencia de palabras y otros atributos relevantes. El método mejorado evaluado en este estudio introduce optimizaciones que reducen significativamente el tiempo de procesamiento necesario para asignar cada documento a un clúster. Esto se logra mediante una combinación de técnicas de preprocesamiento y ajustes en los criterios de convergencia del algoritmo, resultando en una menor cantidad de iteraciones y operaciones computacionales. Para evaluar el método mejorado, se llevaron a cabo una serie de experimentos utilizando un prototipo propio que construye artificialmente un conjunto de datos de documentos. En la fase de experimentación, se aplicaron tanto el algoritmo KMeans estándar como el método mejorado estudiado. La comparación se realizó en términos de tiempo de procesamiento, número de iteraciones y precisión en la agrupación de documentos. Para evaluar la calidad del agrupamiento, se empleó el coeficiente de silueta o silhouette como métrica. Los resultados mostraron que, además de reducir el tiempo de procesamiento, el método mejorado mantiene una calidad de agrupamiento equivalente a la obtenida con el K-Means clásico. Esto sugiere que las optimizaciones introducidas no comprometen la precisión del agrupamiento, sino que, por el contrario, ofrecen un rendimiento más eficiente sin sacrificar la efectividad en la clasificación de documentos.
Red de Universidades con Carreras en Informática - Materia
-
Ciencias Informáticas
Agrupamiento
K-Means
Inicialización
Coeficiente de Silueta - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/176490
Ver los metadatos del registro completo
| id |
SEDICI_7285191cd449f031bbbfe740a1b110e6 |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/176490 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de DocumentosSpositto, Osvaldo MarioBossero, JulioQuevedo, SebastiánLedesma, VivianaMatteo, LorenaCiencias InformáticasAgrupamientoK-MeansInicializaciónCoeficiente de SiluetaEste trabajo presenta una evaluación exhaustiva de un método mejorado del algoritmo K-Means, aplicado a un sistema de recuperación de documentos. Los algoritmos de agrupamiento, o clustering, se utilizan para organizar documentos similares en grupos, basándose en características comunes como el contenido textual, la frecuencia de palabras y otros atributos relevantes. El método mejorado evaluado en este estudio introduce optimizaciones que reducen significativamente el tiempo de procesamiento necesario para asignar cada documento a un clúster. Esto se logra mediante una combinación de técnicas de preprocesamiento y ajustes en los criterios de convergencia del algoritmo, resultando en una menor cantidad de iteraciones y operaciones computacionales. Para evaluar el método mejorado, se llevaron a cabo una serie de experimentos utilizando un prototipo propio que construye artificialmente un conjunto de datos de documentos. En la fase de experimentación, se aplicaron tanto el algoritmo KMeans estándar como el método mejorado estudiado. La comparación se realizó en términos de tiempo de procesamiento, número de iteraciones y precisión en la agrupación de documentos. Para evaluar la calidad del agrupamiento, se empleó el coeficiente de silueta o silhouette como métrica. Los resultados mostraron que, además de reducir el tiempo de procesamiento, el método mejorado mantiene una calidad de agrupamiento equivalente a la obtenida con el K-Means clásico. Esto sugiere que las optimizaciones introducidas no comprometen la precisión del agrupamiento, sino que, por el contrario, ofrecen un rendimiento más eficiente sin sacrificar la efectividad en la clasificación de documentos.Red de Universidades con Carreras en Informática2024-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf570-580http://sedici.unlp.edu.ar/handle/10915/176490spainfo:eu-repo/semantics/altIdentifier/isbn/978-950-34-2428-5info:eu-repo/semantics/reference/hdl/10915/172755info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-22T17:28:23Zoai:sedici.unlp.edu.ar:10915/176490Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-22 17:28:23.403SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos |
| title |
Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos |
| spellingShingle |
Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos Spositto, Osvaldo Mario Ciencias Informáticas Agrupamiento K-Means Inicialización Coeficiente de Silueta |
| title_short |
Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos |
| title_full |
Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos |
| title_fullStr |
Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos |
| title_full_unstemmed |
Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos |
| title_sort |
Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos |
| dc.creator.none.fl_str_mv |
Spositto, Osvaldo Mario Bossero, Julio Quevedo, Sebastián Ledesma, Viviana Matteo, Lorena |
| author |
Spositto, Osvaldo Mario |
| author_facet |
Spositto, Osvaldo Mario Bossero, Julio Quevedo, Sebastián Ledesma, Viviana Matteo, Lorena |
| author_role |
author |
| author2 |
Bossero, Julio Quevedo, Sebastián Ledesma, Viviana Matteo, Lorena |
| author2_role |
author author author author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas Agrupamiento K-Means Inicialización Coeficiente de Silueta |
| topic |
Ciencias Informáticas Agrupamiento K-Means Inicialización Coeficiente de Silueta |
| dc.description.none.fl_txt_mv |
Este trabajo presenta una evaluación exhaustiva de un método mejorado del algoritmo K-Means, aplicado a un sistema de recuperación de documentos. Los algoritmos de agrupamiento, o clustering, se utilizan para organizar documentos similares en grupos, basándose en características comunes como el contenido textual, la frecuencia de palabras y otros atributos relevantes. El método mejorado evaluado en este estudio introduce optimizaciones que reducen significativamente el tiempo de procesamiento necesario para asignar cada documento a un clúster. Esto se logra mediante una combinación de técnicas de preprocesamiento y ajustes en los criterios de convergencia del algoritmo, resultando en una menor cantidad de iteraciones y operaciones computacionales. Para evaluar el método mejorado, se llevaron a cabo una serie de experimentos utilizando un prototipo propio que construye artificialmente un conjunto de datos de documentos. En la fase de experimentación, se aplicaron tanto el algoritmo KMeans estándar como el método mejorado estudiado. La comparación se realizó en términos de tiempo de procesamiento, número de iteraciones y precisión en la agrupación de documentos. Para evaluar la calidad del agrupamiento, se empleó el coeficiente de silueta o silhouette como métrica. Los resultados mostraron que, además de reducir el tiempo de procesamiento, el método mejorado mantiene una calidad de agrupamiento equivalente a la obtenida con el K-Means clásico. Esto sugiere que las optimizaciones introducidas no comprometen la precisión del agrupamiento, sino que, por el contrario, ofrecen un rendimiento más eficiente sin sacrificar la efectividad en la clasificación de documentos. Red de Universidades con Carreras en Informática |
| description |
Este trabajo presenta una evaluación exhaustiva de un método mejorado del algoritmo K-Means, aplicado a un sistema de recuperación de documentos. Los algoritmos de agrupamiento, o clustering, se utilizan para organizar documentos similares en grupos, basándose en características comunes como el contenido textual, la frecuencia de palabras y otros atributos relevantes. El método mejorado evaluado en este estudio introduce optimizaciones que reducen significativamente el tiempo de procesamiento necesario para asignar cada documento a un clúster. Esto se logra mediante una combinación de técnicas de preprocesamiento y ajustes en los criterios de convergencia del algoritmo, resultando en una menor cantidad de iteraciones y operaciones computacionales. Para evaluar el método mejorado, se llevaron a cabo una serie de experimentos utilizando un prototipo propio que construye artificialmente un conjunto de datos de documentos. En la fase de experimentación, se aplicaron tanto el algoritmo KMeans estándar como el método mejorado estudiado. La comparación se realizó en términos de tiempo de procesamiento, número de iteraciones y precisión en la agrupación de documentos. Para evaluar la calidad del agrupamiento, se empleó el coeficiente de silueta o silhouette como métrica. Los resultados mostraron que, además de reducir el tiempo de procesamiento, el método mejorado mantiene una calidad de agrupamiento equivalente a la obtenida con el K-Means clásico. Esto sugiere que las optimizaciones introducidas no comprometen la precisión del agrupamiento, sino que, por el contrario, ofrecen un rendimiento más eficiente sin sacrificar la efectividad en la clasificación de documentos. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-10 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
| format |
conferenceObject |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/176490 |
| url |
http://sedici.unlp.edu.ar/handle/10915/176490 |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/isbn/978-950-34-2428-5 info:eu-repo/semantics/reference/hdl/10915/172755 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf 570-580 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1846783767298965504 |
| score |
12.982451 |