Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales
- Autores
- Román y Zubeldia, Alfonso
- Año de publicación
- 2017
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión aceptada
- Colaborador/a o director/a de tesis
- Wainschenker, Rubén
Curti, Hugo - Descripción
- Los algoritmos de agrupamiento permiten agrupar un conjunto de datos en un conjunto de subclases, denominados clusters. El objetivo principal de los mismos es agrupar, en dichos clusters, instancias de datos similares entre sí. Cada instancia de datos suele ser representada en un espacio de características en donde cada característica queda presentada como una dimensión de dicho espacio. Es común, entonces, el uso de espacios de muchas dimensiones en esta representación. Una de las medidas de similitud más usadas para realizar el agrupamiento es la distancia euclidiana. La motivación principal de éste trabajo es brindar asistencia en la implementación y prueba de una hipótesis sobre el uso de la métrica de distancia euclidiana como medida de similitud en los algoritmos de agrupamiento. En la hipótesis se plantea la posibilidad de que, en espacios multidimensionales, la distancia euclidiana puede conducir a un agrupamiento erróneo en ciertas ocasiones. Es decir, puede ocurrir que se agrupen instancias en una clase cuando en realidad pertenecen a otra. Numerosos estudios han determinado que las métricas de distancia suelen tener comportamientos erráticos en altas dimensiones. Sin embargo no existen muchos trabajos que profundicen demasiado en ésta temática debido a que el problema es naturalmente complejo. Los espacios n-dimensionales grandes (con n > 3) no pueden ser gra cados en su totalidad, y nuestra intuición falla en ellos. Se ha mostrado que, en algoritmos de agrupamiento particionales como K- Means, el uso de diferentes métricas de distancia puede impactar fuertemente en los resultados. Por lo tanto, la elección de la métrica debe hacerse con cuidado.
Fil: Román y Zubeldia, Alfonso. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.
Fil: Wainschenker, Rubén. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.
Fil: Curti, Hugo. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. - Materia
-
Ingeniería de sistemas
Métrica de distancia euclidiana
Algoritmos de agrupamiento
Clusters - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc/2.5/ar/
- Repositorio
- Institución
- Universidad Nacional del Centro de la Provincia de Buenos Aires
- OAI Identificador
- oai:ridaa.unicen.edu.ar:123456789/1564
Ver los metadatos del registro completo
id |
RIDUNICEN_d469de354b7a6cd4320ee8ca9e5be037 |
---|---|
oai_identifier_str |
oai:ridaa.unicen.edu.ar:123456789/1564 |
network_acronym_str |
RIDUNICEN |
repository_id_str |
a |
network_name_str |
RIDAA (UNICEN) |
spelling |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionalesRomán y Zubeldia, AlfonsoIngeniería de sistemasMétrica de distancia euclidianaAlgoritmos de agrupamientoClustersLos algoritmos de agrupamiento permiten agrupar un conjunto de datos en un conjunto de subclases, denominados clusters. El objetivo principal de los mismos es agrupar, en dichos clusters, instancias de datos similares entre sí. Cada instancia de datos suele ser representada en un espacio de características en donde cada característica queda presentada como una dimensión de dicho espacio. Es común, entonces, el uso de espacios de muchas dimensiones en esta representación. Una de las medidas de similitud más usadas para realizar el agrupamiento es la distancia euclidiana. La motivación principal de éste trabajo es brindar asistencia en la implementación y prueba de una hipótesis sobre el uso de la métrica de distancia euclidiana como medida de similitud en los algoritmos de agrupamiento. En la hipótesis se plantea la posibilidad de que, en espacios multidimensionales, la distancia euclidiana puede conducir a un agrupamiento erróneo en ciertas ocasiones. Es decir, puede ocurrir que se agrupen instancias en una clase cuando en realidad pertenecen a otra. Numerosos estudios han determinado que las métricas de distancia suelen tener comportamientos erráticos en altas dimensiones. Sin embargo no existen muchos trabajos que profundicen demasiado en ésta temática debido a que el problema es naturalmente complejo. Los espacios n-dimensionales grandes (con n > 3) no pueden ser gra cados en su totalidad, y nuestra intuición falla en ellos. Se ha mostrado que, en algoritmos de agrupamiento particionales como K- Means, el uso de diferentes métricas de distancia puede impactar fuertemente en los resultados. Por lo tanto, la elección de la métrica debe hacerse con cuidado.Fil: Román y Zubeldia, Alfonso. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.Fil: Wainschenker, Rubén. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.Fil: Curti, Hugo. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina.Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias ExactasWainschenker, RubénCurti, Hugo2017-122018-03-19T13:59:25Zinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfapplication/pdfhttp://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1564https://www.ridaa.unicen.edu.ar/handle/123456789/1564spahttp://creativecommons.org/licenses/by-nc/2.5/ar/info:eu-repo/semantics/openAccessreponame:RIDAA (UNICEN)instname:Universidad Nacional del Centro de la Provincia de Buenos Aires2025-09-29T13:41:18Zoai:ridaa.unicen.edu.ar:123456789/1564instacron:UNICENInstitucionalhttps://www.ridaa.unicen.edu.ar/Universidad públicaNo correspondehttps://www.ridaa.unicen.edu.ar/oailleiboff@rec.unicen.edu.ar;gimeroni@rec.unicen.edu.ar;lvarela@rec.unicen.edu.ar ;ArgentinaNo correspondeNo correspondeNo correspondeopendoar:a2025-09-29 13:41:18.865RIDAA (UNICEN) - Universidad Nacional del Centro de la Provincia de Buenos Airesfalse |
dc.title.none.fl_str_mv |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
title |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
spellingShingle |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales Román y Zubeldia, Alfonso Ingeniería de sistemas Métrica de distancia euclidiana Algoritmos de agrupamiento Clusters |
title_short |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
title_full |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
title_fullStr |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
title_full_unstemmed |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
title_sort |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
dc.creator.none.fl_str_mv |
Román y Zubeldia, Alfonso |
author |
Román y Zubeldia, Alfonso |
author_facet |
Román y Zubeldia, Alfonso |
author_role |
author |
dc.contributor.none.fl_str_mv |
Wainschenker, Rubén Curti, Hugo |
dc.subject.none.fl_str_mv |
Ingeniería de sistemas Métrica de distancia euclidiana Algoritmos de agrupamiento Clusters |
topic |
Ingeniería de sistemas Métrica de distancia euclidiana Algoritmos de agrupamiento Clusters |
dc.description.none.fl_txt_mv |
Los algoritmos de agrupamiento permiten agrupar un conjunto de datos en un conjunto de subclases, denominados clusters. El objetivo principal de los mismos es agrupar, en dichos clusters, instancias de datos similares entre sí. Cada instancia de datos suele ser representada en un espacio de características en donde cada característica queda presentada como una dimensión de dicho espacio. Es común, entonces, el uso de espacios de muchas dimensiones en esta representación. Una de las medidas de similitud más usadas para realizar el agrupamiento es la distancia euclidiana. La motivación principal de éste trabajo es brindar asistencia en la implementación y prueba de una hipótesis sobre el uso de la métrica de distancia euclidiana como medida de similitud en los algoritmos de agrupamiento. En la hipótesis se plantea la posibilidad de que, en espacios multidimensionales, la distancia euclidiana puede conducir a un agrupamiento erróneo en ciertas ocasiones. Es decir, puede ocurrir que se agrupen instancias en una clase cuando en realidad pertenecen a otra. Numerosos estudios han determinado que las métricas de distancia suelen tener comportamientos erráticos en altas dimensiones. Sin embargo no existen muchos trabajos que profundicen demasiado en ésta temática debido a que el problema es naturalmente complejo. Los espacios n-dimensionales grandes (con n > 3) no pueden ser gra cados en su totalidad, y nuestra intuición falla en ellos. Se ha mostrado que, en algoritmos de agrupamiento particionales como K- Means, el uso de diferentes métricas de distancia puede impactar fuertemente en los resultados. Por lo tanto, la elección de la métrica debe hacerse con cuidado. Fil: Román y Zubeldia, Alfonso. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. Fil: Wainschenker, Rubén. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. Fil: Curti, Hugo. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. |
description |
Los algoritmos de agrupamiento permiten agrupar un conjunto de datos en un conjunto de subclases, denominados clusters. El objetivo principal de los mismos es agrupar, en dichos clusters, instancias de datos similares entre sí. Cada instancia de datos suele ser representada en un espacio de características en donde cada característica queda presentada como una dimensión de dicho espacio. Es común, entonces, el uso de espacios de muchas dimensiones en esta representación. Una de las medidas de similitud más usadas para realizar el agrupamiento es la distancia euclidiana. La motivación principal de éste trabajo es brindar asistencia en la implementación y prueba de una hipótesis sobre el uso de la métrica de distancia euclidiana como medida de similitud en los algoritmos de agrupamiento. En la hipótesis se plantea la posibilidad de que, en espacios multidimensionales, la distancia euclidiana puede conducir a un agrupamiento erróneo en ciertas ocasiones. Es decir, puede ocurrir que se agrupen instancias en una clase cuando en realidad pertenecen a otra. Numerosos estudios han determinado que las métricas de distancia suelen tener comportamientos erráticos en altas dimensiones. Sin embargo no existen muchos trabajos que profundicen demasiado en ésta temática debido a que el problema es naturalmente complejo. Los espacios n-dimensionales grandes (con n > 3) no pueden ser gra cados en su totalidad, y nuestra intuición falla en ellos. Se ha mostrado que, en algoritmos de agrupamiento particionales como K- Means, el uso de diferentes métricas de distancia puede impactar fuertemente en los resultados. Por lo tanto, la elección de la métrica debe hacerse con cuidado. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-12 2018-03-19T13:59:25Z |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/acceptedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
acceptedVersion |
dc.identifier.none.fl_str_mv |
http://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1564 https://www.ridaa.unicen.edu.ar/handle/123456789/1564 |
url |
http://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1564 https://www.ridaa.unicen.edu.ar/handle/123456789/1564 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc/2.5/ar/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc/2.5/ar/ |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf application/pdf |
dc.publisher.none.fl_str_mv |
Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas |
publisher.none.fl_str_mv |
Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas |
dc.source.none.fl_str_mv |
reponame:RIDAA (UNICEN) instname:Universidad Nacional del Centro de la Provincia de Buenos Aires |
reponame_str |
RIDAA (UNICEN) |
collection |
RIDAA (UNICEN) |
instname_str |
Universidad Nacional del Centro de la Provincia de Buenos Aires |
repository.name.fl_str_mv |
RIDAA (UNICEN) - Universidad Nacional del Centro de la Provincia de Buenos Aires |
repository.mail.fl_str_mv |
lleiboff@rec.unicen.edu.ar;gimeroni@rec.unicen.edu.ar;lvarela@rec.unicen.edu.ar ; |
_version_ |
1844619026132631552 |
score |
12.559606 |