Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
- Autores
- Prado, Patricia Elizabeth
- Año de publicación
- 2022
- Idioma
- español castellano
- Tipo de recurso
- tesis de maestría
- Estado
- versión aceptada
- Colaborador/a o director/a de tesis
- Hasperué, Waldo
Lanzarini, Laura Cristina
Bazán, Patricia Alejandra
Ronchetti, Franco - Descripción
- En dominios donde el volumen de los datos crece exponencialmente y la enorme abundancia de estos desborda la capacidad humana para comprenderlos, existe una necesidad apremiante de desarrollar soluciones para aprovechar esta riqueza de datos utilizando métodos estadísticos. El agrupamiento es la tarea descriptiva por excelencia, consiste en obtener grupos naturales a partir de los datos para luego poder describirlos de manera concisa. Ya sea para la comprensión o el resumen, el análisis de agrupamiento ha desempeñado durante mucho tiempo un papel importante en una amplia variedad de campos como psicología, ciencias sociales, biología, estadísticas, reconocimiento de patrones y recuperación de información. El presente estudio pretende analizar diferentes técnicas de agrupamiento en el entorno distribuido Spark, que permitan describir de forma novedosa el seguimiento de casos de COVID-19 en Argentina a partir de la aplicación de modelos de agrupamiento adecuados para el desarrollo de aplicaciones de aprendizaje automático a gran escala.
Especialista en Inteligencia de Datos orientada a Big Data
Universidad Nacional de La Plata
Facultad de Informática - Materia
-
Ciencias Informáticas
Clustering
Spark
K-Means
Bisecting K-Means
Gaussian Mixture Model - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/145268
Ver los metadatos del registro completo
id |
SEDICI_245ffa01a5af47fe3e37fad276c5c5cd |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/145268 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República ArgentinaPrado, Patricia ElizabethCiencias InformáticasClusteringSparkK-MeansBisecting K-MeansGaussian Mixture ModelEn dominios donde el volumen de los datos crece exponencialmente y la enorme abundancia de estos desborda la capacidad humana para comprenderlos, existe una necesidad apremiante de desarrollar soluciones para aprovechar esta riqueza de datos utilizando métodos estadísticos. El agrupamiento es la tarea descriptiva por excelencia, consiste en obtener grupos naturales a partir de los datos para luego poder describirlos de manera concisa. Ya sea para la comprensión o el resumen, el análisis de agrupamiento ha desempeñado durante mucho tiempo un papel importante en una amplia variedad de campos como psicología, ciencias sociales, biología, estadísticas, reconocimiento de patrones y recuperación de información. El presente estudio pretende analizar diferentes técnicas de agrupamiento en el entorno distribuido Spark, que permitan describir de forma novedosa el seguimiento de casos de COVID-19 en Argentina a partir de la aplicación de modelos de agrupamiento adecuados para el desarrollo de aplicaciones de aprendizaje automático a gran escala.Especialista en Inteligencia de Datos orientada a Big DataUniversidad Nacional de La PlataFacultad de InformáticaHasperué, WaldoLanzarini, Laura CristinaBazán, Patricia AlejandraRonchetti, Franco2022-10-11info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/acceptedVersionTrabajo de especializacionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/145268spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/4.0/Creative Commons Attribution 4.0 International (CC BY 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:37:02Zoai:sedici.unlp.edu.ar:10915/145268Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:37:03.013SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina |
title |
Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina |
spellingShingle |
Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina Prado, Patricia Elizabeth Ciencias Informáticas Clustering Spark K-Means Bisecting K-Means Gaussian Mixture Model |
title_short |
Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina |
title_full |
Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina |
title_fullStr |
Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina |
title_full_unstemmed |
Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina |
title_sort |
Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina |
dc.creator.none.fl_str_mv |
Prado, Patricia Elizabeth |
author |
Prado, Patricia Elizabeth |
author_facet |
Prado, Patricia Elizabeth |
author_role |
author |
dc.contributor.none.fl_str_mv |
Hasperué, Waldo Lanzarini, Laura Cristina Bazán, Patricia Alejandra Ronchetti, Franco |
dc.subject.none.fl_str_mv |
Ciencias Informáticas Clustering Spark K-Means Bisecting K-Means Gaussian Mixture Model |
topic |
Ciencias Informáticas Clustering Spark K-Means Bisecting K-Means Gaussian Mixture Model |
dc.description.none.fl_txt_mv |
En dominios donde el volumen de los datos crece exponencialmente y la enorme abundancia de estos desborda la capacidad humana para comprenderlos, existe una necesidad apremiante de desarrollar soluciones para aprovechar esta riqueza de datos utilizando métodos estadísticos. El agrupamiento es la tarea descriptiva por excelencia, consiste en obtener grupos naturales a partir de los datos para luego poder describirlos de manera concisa. Ya sea para la comprensión o el resumen, el análisis de agrupamiento ha desempeñado durante mucho tiempo un papel importante en una amplia variedad de campos como psicología, ciencias sociales, biología, estadísticas, reconocimiento de patrones y recuperación de información. El presente estudio pretende analizar diferentes técnicas de agrupamiento en el entorno distribuido Spark, que permitan describir de forma novedosa el seguimiento de casos de COVID-19 en Argentina a partir de la aplicación de modelos de agrupamiento adecuados para el desarrollo de aplicaciones de aprendizaje automático a gran escala. Especialista en Inteligencia de Datos orientada a Big Data Universidad Nacional de La Plata Facultad de Informática |
description |
En dominios donde el volumen de los datos crece exponencialmente y la enorme abundancia de estos desborda la capacidad humana para comprenderlos, existe una necesidad apremiante de desarrollar soluciones para aprovechar esta riqueza de datos utilizando métodos estadísticos. El agrupamiento es la tarea descriptiva por excelencia, consiste en obtener grupos naturales a partir de los datos para luego poder describirlos de manera concisa. Ya sea para la comprensión o el resumen, el análisis de agrupamiento ha desempeñado durante mucho tiempo un papel importante en una amplia variedad de campos como psicología, ciencias sociales, biología, estadísticas, reconocimiento de patrones y recuperación de información. El presente estudio pretende analizar diferentes técnicas de agrupamiento en el entorno distribuido Spark, que permitan describir de forma novedosa el seguimiento de casos de COVID-19 en Argentina a partir de la aplicación de modelos de agrupamiento adecuados para el desarrollo de aplicaciones de aprendizaje automático a gran escala. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-10-11 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis info:eu-repo/semantics/acceptedVersion Trabajo de especializacion http://purl.org/coar/resource_type/c_bdcc info:ar-repo/semantics/tesisDeMaestria |
format |
masterThesis |
status_str |
acceptedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/145268 |
url |
http://sedici.unlp.edu.ar/handle/10915/145268 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by/4.0/ Creative Commons Attribution 4.0 International (CC BY 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by/4.0/ Creative Commons Attribution 4.0 International (CC BY 4.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1844616247743873024 |
score |
13.070432 |