Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina

Autores
Prado, Patricia Elizabeth
Año de publicación
2022
Idioma
español castellano
Tipo de recurso
tesis de maestría
Estado
versión aceptada
Colaborador/a o director/a de tesis
Hasperué, Waldo
Lanzarini, Laura Cristina
Bazán, Patricia Alejandra
Ronchetti, Franco
Descripción
En dominios donde el volumen de los datos crece exponencialmente y la enorme abundancia de estos desborda la capacidad humana para comprenderlos, existe una necesidad apremiante de desarrollar soluciones para aprovechar esta riqueza de datos utilizando métodos estadísticos. El agrupamiento es la tarea descriptiva por excelencia, consiste en obtener grupos naturales a partir de los datos para luego poder describirlos de manera concisa. Ya sea para la comprensión o el resumen, el análisis de agrupamiento ha desempeñado durante mucho tiempo un papel importante en una amplia variedad de campos como psicología, ciencias sociales, biología, estadísticas, reconocimiento de patrones y recuperación de información. El presente estudio pretende analizar diferentes técnicas de agrupamiento en el entorno distribuido Spark, que permitan describir de forma novedosa el seguimiento de casos de COVID-19 en Argentina a partir de la aplicación de modelos de agrupamiento adecuados para el desarrollo de aplicaciones de aprendizaje automático a gran escala.
Especialista en Inteligencia de Datos orientada a Big Data
Universidad Nacional de La Plata
Facultad de Informática
Materia
Ciencias Informáticas
Clustering
Spark
K-Means
Bisecting K-Means
Gaussian Mixture Model
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/145268

id SEDICI_245ffa01a5af47fe3e37fad276c5c5cd
oai_identifier_str oai:sedici.unlp.edu.ar:10915/145268
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República ArgentinaPrado, Patricia ElizabethCiencias InformáticasClusteringSparkK-MeansBisecting K-MeansGaussian Mixture ModelEn dominios donde el volumen de los datos crece exponencialmente y la enorme abundancia de estos desborda la capacidad humana para comprenderlos, existe una necesidad apremiante de desarrollar soluciones para aprovechar esta riqueza de datos utilizando métodos estadísticos. El agrupamiento es la tarea descriptiva por excelencia, consiste en obtener grupos naturales a partir de los datos para luego poder describirlos de manera concisa. Ya sea para la comprensión o el resumen, el análisis de agrupamiento ha desempeñado durante mucho tiempo un papel importante en una amplia variedad de campos como psicología, ciencias sociales, biología, estadísticas, reconocimiento de patrones y recuperación de información. El presente estudio pretende analizar diferentes técnicas de agrupamiento en el entorno distribuido Spark, que permitan describir de forma novedosa el seguimiento de casos de COVID-19 en Argentina a partir de la aplicación de modelos de agrupamiento adecuados para el desarrollo de aplicaciones de aprendizaje automático a gran escala.Especialista en Inteligencia de Datos orientada a Big DataUniversidad Nacional de La PlataFacultad de InformáticaHasperué, WaldoLanzarini, Laura CristinaBazán, Patricia AlejandraRonchetti, Franco2022-10-11info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTrabajo de especializacionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/145268spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/4.0/Creative Commons Attribution 4.0 International (CC BY 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:37:02Zoai:sedici.unlp.edu.ar:10915/145268Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:37:03.013SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
title Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
spellingShingle Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
Prado, Patricia Elizabeth
Ciencias Informáticas
Clustering
Spark
K-Means
Bisecting K-Means
Gaussian Mixture Model
title_short Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
title_full Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
title_fullStr Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
title_full_unstemmed Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
title_sort Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
dc.creator.none.fl_str_mv Prado, Patricia Elizabeth
author Prado, Patricia Elizabeth
author_facet Prado, Patricia Elizabeth
author_role author
dc.contributor.none.fl_str_mv Hasperué, Waldo
Lanzarini, Laura Cristina
Bazán, Patricia Alejandra
Ronchetti, Franco
dc.subject.none.fl_str_mv Ciencias Informáticas
Clustering
Spark
K-Means
Bisecting K-Means
Gaussian Mixture Model
topic Ciencias Informáticas
Clustering
Spark
K-Means
Bisecting K-Means
Gaussian Mixture Model
dc.description.none.fl_txt_mv En dominios donde el volumen de los datos crece exponencialmente y la enorme abundancia de estos desborda la capacidad humana para comprenderlos, existe una necesidad apremiante de desarrollar soluciones para aprovechar esta riqueza de datos utilizando métodos estadísticos. El agrupamiento es la tarea descriptiva por excelencia, consiste en obtener grupos naturales a partir de los datos para luego poder describirlos de manera concisa. Ya sea para la comprensión o el resumen, el análisis de agrupamiento ha desempeñado durante mucho tiempo un papel importante en una amplia variedad de campos como psicología, ciencias sociales, biología, estadísticas, reconocimiento de patrones y recuperación de información. El presente estudio pretende analizar diferentes técnicas de agrupamiento en el entorno distribuido Spark, que permitan describir de forma novedosa el seguimiento de casos de COVID-19 en Argentina a partir de la aplicación de modelos de agrupamiento adecuados para el desarrollo de aplicaciones de aprendizaje automático a gran escala.
Especialista en Inteligencia de Datos orientada a Big Data
Universidad Nacional de La Plata
Facultad de Informática
description En dominios donde el volumen de los datos crece exponencialmente y la enorme abundancia de estos desborda la capacidad humana para comprenderlos, existe una necesidad apremiante de desarrollar soluciones para aprovechar esta riqueza de datos utilizando métodos estadísticos. El agrupamiento es la tarea descriptiva por excelencia, consiste en obtener grupos naturales a partir de los datos para luego poder describirlos de manera concisa. Ya sea para la comprensión o el resumen, el análisis de agrupamiento ha desempeñado durante mucho tiempo un papel importante en una amplia variedad de campos como psicología, ciencias sociales, biología, estadísticas, reconocimiento de patrones y recuperación de información. El presente estudio pretende analizar diferentes técnicas de agrupamiento en el entorno distribuido Spark, que permitan describir de forma novedosa el seguimiento de casos de COVID-19 en Argentina a partir de la aplicación de modelos de agrupamiento adecuados para el desarrollo de aplicaciones de aprendizaje automático a gran escala.
publishDate 2022
dc.date.none.fl_str_mv 2022-10-11
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/acceptedVersion
Trabajo de especializacion
http://purl.org/coar/resource_type/c_bdcc
info:ar-repo/semantics/tesisDeMaestria
format masterThesis
status_str acceptedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/145268
url http://sedici.unlp.edu.ar/handle/10915/145268
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by/4.0/
Creative Commons Attribution 4.0 International (CC BY 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
Creative Commons Attribution 4.0 International (CC BY 4.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844616247743873024
score 13.070432