Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales

Autores
Román y Zubeldia, Alfonso
Año de publicación
2017
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión aceptada
Colaborador/a o director/a de tesis
Wainschenker, Rubén
Curti, Hugo
Descripción
Los algoritmos de agrupamiento permiten agrupar un conjunto de datos en un conjunto de subclases, denominados clusters. El objetivo principal de los mismos es agrupar, en dichos clusters, instancias de datos similares entre sí. Cada instancia de datos suele ser representada en un espacio de características en donde cada característica queda presentada como una dimensión de dicho espacio. Es común, entonces, el uso de espacios de muchas dimensiones en esta representación. Una de las medidas de similitud más usadas para realizar el agrupamiento es la distancia euclidiana. La motivación principal de éste trabajo es brindar asistencia en la implementación y prueba de una hipótesis sobre el uso de la métrica de distancia euclidiana como medida de similitud en los algoritmos de agrupamiento. En la hipótesis se plantea la posibilidad de que, en espacios multidimensionales, la distancia euclidiana puede conducir a un agrupamiento erróneo en ciertas ocasiones. Es decir, puede ocurrir que se agrupen instancias en una clase cuando en realidad pertenecen a otra. Numerosos estudios han determinado que las métricas de distancia suelen tener comportamientos erráticos en altas dimensiones. Sin embargo no existen muchos trabajos que profundicen demasiado en ésta temática debido a que el problema es naturalmente complejo. Los espacios n-dimensionales grandes (con n > 3) no pueden ser gra cados en su totalidad, y nuestra intuición falla en ellos. Se ha mostrado que, en algoritmos de agrupamiento particionales como K- Means, el uso de diferentes métricas de distancia puede impactar fuertemente en los resultados. Por lo tanto, la elección de la métrica debe hacerse con cuidado.
Fil: Román y Zubeldia, Alfonso. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.
Fil: Wainschenker, Rubén. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.
Fil: Curti, Hugo. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.
Materia
Ingeniería de sistemas
Métrica de distancia euclidiana
Algoritmos de agrupamiento
Clusters
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc/2.5/ar/
Repositorio
RIDAA (UNICEN)
Institución
Universidad Nacional del Centro de la Provincia de Buenos Aires
OAI Identificador
oai:ridaa.unicen.edu.ar:123456789/1564

id RIDUNICEN_d469de354b7a6cd4320ee8ca9e5be037
oai_identifier_str oai:ridaa.unicen.edu.ar:123456789/1564
network_acronym_str RIDUNICEN
repository_id_str a
network_name_str RIDAA (UNICEN)
spelling Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionalesRomán y Zubeldia, AlfonsoIngeniería de sistemasMétrica de distancia euclidianaAlgoritmos de agrupamientoClustersLos algoritmos de agrupamiento permiten agrupar un conjunto de datos en un conjunto de subclases, denominados clusters. El objetivo principal de los mismos es agrupar, en dichos clusters, instancias de datos similares entre sí. Cada instancia de datos suele ser representada en un espacio de características en donde cada característica queda presentada como una dimensión de dicho espacio. Es común, entonces, el uso de espacios de muchas dimensiones en esta representación. Una de las medidas de similitud más usadas para realizar el agrupamiento es la distancia euclidiana. La motivación principal de éste trabajo es brindar asistencia en la implementación y prueba de una hipótesis sobre el uso de la métrica de distancia euclidiana como medida de similitud en los algoritmos de agrupamiento. En la hipótesis se plantea la posibilidad de que, en espacios multidimensionales, la distancia euclidiana puede conducir a un agrupamiento erróneo en ciertas ocasiones. Es decir, puede ocurrir que se agrupen instancias en una clase cuando en realidad pertenecen a otra. Numerosos estudios han determinado que las métricas de distancia suelen tener comportamientos erráticos en altas dimensiones. Sin embargo no existen muchos trabajos que profundicen demasiado en ésta temática debido a que el problema es naturalmente complejo. Los espacios n-dimensionales grandes (con n > 3) no pueden ser gra cados en su totalidad, y nuestra intuición falla en ellos. Se ha mostrado que, en algoritmos de agrupamiento particionales como K- Means, el uso de diferentes métricas de distancia puede impactar fuertemente en los resultados. Por lo tanto, la elección de la métrica debe hacerse con cuidado.Fil: Román y Zubeldia, Alfonso. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.Fil: Wainschenker, Rubén. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.Fil: Curti, Hugo. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias ExactasWainschenker, RubénCurti, Hugo2017-122018-03-19T13:59:25Zinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfapplication/pdfhttp://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1564https://www.ridaa.unicen.edu.ar/handle/123456789/1564spahttp://creativecommons.org/licenses/by-nc/2.5/ar/info:eu-repo/semantics/openAccessreponame:RIDAA (UNICEN)instname:Universidad Nacional del Centro de la Provincia de Buenos Aires2025-09-29T13:41:18Zoai:ridaa.unicen.edu.ar:123456789/1564instacron:UNICENInstitucionalhttps://www.ridaa.unicen.edu.ar/Universidad públicaNo correspondehttps://www.ridaa.unicen.edu.ar/oailleiboff@rec.unicen.edu.ar;gimeroni@rec.unicen.edu.ar;lvarela@rec.unicen.edu.ar ;ArgentinaNo correspondeNo correspondeNo correspondeopendoar:a2025-09-29 13:41:18.865RIDAA (UNICEN) - Universidad Nacional del Centro de la Provincia de Buenos Airesfalse
dc.title.none.fl_str_mv Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales
title Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales
spellingShingle Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales
Román y Zubeldia, Alfonso
Ingeniería de sistemas
Métrica de distancia euclidiana
Algoritmos de agrupamiento
Clusters
title_short Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales
title_full Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales
title_fullStr Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales
title_full_unstemmed Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales
title_sort Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales
dc.creator.none.fl_str_mv Román y Zubeldia, Alfonso
author Román y Zubeldia, Alfonso
author_facet Román y Zubeldia, Alfonso
author_role author
dc.contributor.none.fl_str_mv Wainschenker, Rubén
Curti, Hugo
dc.subject.none.fl_str_mv Ingeniería de sistemas
Métrica de distancia euclidiana
Algoritmos de agrupamiento
Clusters
topic Ingeniería de sistemas
Métrica de distancia euclidiana
Algoritmos de agrupamiento
Clusters
dc.description.none.fl_txt_mv Los algoritmos de agrupamiento permiten agrupar un conjunto de datos en un conjunto de subclases, denominados clusters. El objetivo principal de los mismos es agrupar, en dichos clusters, instancias de datos similares entre sí. Cada instancia de datos suele ser representada en un espacio de características en donde cada característica queda presentada como una dimensión de dicho espacio. Es común, entonces, el uso de espacios de muchas dimensiones en esta representación. Una de las medidas de similitud más usadas para realizar el agrupamiento es la distancia euclidiana. La motivación principal de éste trabajo es brindar asistencia en la implementación y prueba de una hipótesis sobre el uso de la métrica de distancia euclidiana como medida de similitud en los algoritmos de agrupamiento. En la hipótesis se plantea la posibilidad de que, en espacios multidimensionales, la distancia euclidiana puede conducir a un agrupamiento erróneo en ciertas ocasiones. Es decir, puede ocurrir que se agrupen instancias en una clase cuando en realidad pertenecen a otra. Numerosos estudios han determinado que las métricas de distancia suelen tener comportamientos erráticos en altas dimensiones. Sin embargo no existen muchos trabajos que profundicen demasiado en ésta temática debido a que el problema es naturalmente complejo. Los espacios n-dimensionales grandes (con n > 3) no pueden ser gra cados en su totalidad, y nuestra intuición falla en ellos. Se ha mostrado que, en algoritmos de agrupamiento particionales como K- Means, el uso de diferentes métricas de distancia puede impactar fuertemente en los resultados. Por lo tanto, la elección de la métrica debe hacerse con cuidado.
Fil: Román y Zubeldia, Alfonso. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.
Fil: Wainschenker, Rubén. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.
Fil: Curti, Hugo. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.
description Los algoritmos de agrupamiento permiten agrupar un conjunto de datos en un conjunto de subclases, denominados clusters. El objetivo principal de los mismos es agrupar, en dichos clusters, instancias de datos similares entre sí. Cada instancia de datos suele ser representada en un espacio de características en donde cada característica queda presentada como una dimensión de dicho espacio. Es común, entonces, el uso de espacios de muchas dimensiones en esta representación. Una de las medidas de similitud más usadas para realizar el agrupamiento es la distancia euclidiana. La motivación principal de éste trabajo es brindar asistencia en la implementación y prueba de una hipótesis sobre el uso de la métrica de distancia euclidiana como medida de similitud en los algoritmos de agrupamiento. En la hipótesis se plantea la posibilidad de que, en espacios multidimensionales, la distancia euclidiana puede conducir a un agrupamiento erróneo en ciertas ocasiones. Es decir, puede ocurrir que se agrupen instancias en una clase cuando en realidad pertenecen a otra. Numerosos estudios han determinado que las métricas de distancia suelen tener comportamientos erráticos en altas dimensiones. Sin embargo no existen muchos trabajos que profundicen demasiado en ésta temática debido a que el problema es naturalmente complejo. Los espacios n-dimensionales grandes (con n > 3) no pueden ser gra cados en su totalidad, y nuestra intuición falla en ellos. Se ha mostrado que, en algoritmos de agrupamiento particionales como K- Means, el uso de diferentes métricas de distancia puede impactar fuertemente en los resultados. Por lo tanto, la elección de la métrica debe hacerse con cuidado.
publishDate 2017
dc.date.none.fl_str_mv 2017-12
2018-03-19T13:59:25Z
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/acceptedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str acceptedVersion
dc.identifier.none.fl_str_mv http://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1564
https://www.ridaa.unicen.edu.ar/handle/123456789/1564
url http://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1564
https://www.ridaa.unicen.edu.ar/handle/123456789/1564
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv http://creativecommons.org/licenses/by-nc/2.5/ar/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/2.5/ar/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas
publisher.none.fl_str_mv Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas
dc.source.none.fl_str_mv reponame:RIDAA (UNICEN)
instname:Universidad Nacional del Centro de la Provincia de Buenos Aires
reponame_str RIDAA (UNICEN)
collection RIDAA (UNICEN)
instname_str Universidad Nacional del Centro de la Provincia de Buenos Aires
repository.name.fl_str_mv RIDAA (UNICEN) - Universidad Nacional del Centro de la Provincia de Buenos Aires
repository.mail.fl_str_mv lleiboff@rec.unicen.edu.ar;gimeroni@rec.unicen.edu.ar;lvarela@rec.unicen.edu.ar ;
_version_ 1844619026132631552
score 12.559606