Benchmark de Big Data utilizando software libre y hardware de bajo costo

Autores
Estol, Marcelo Gastón
Año de publicación
2016
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Di Pasquale, Ricardo
Descripción
Fil: Estol, Marcelo Gastón. Pontificia Universidad Católica Argentina. Facultad de Ciencias Fisicomatemáticas e Ingeniería; Argentina
Fil: Di Pasquale, Ricardo. Pontificia Universidad Católica Argentina. Facultad de Ciencias Fisicomatemáticas e Ingeniería; Argentina
Resumen: El campo de la computación distribuida ha tenido una gran influencia sobre los sistemas actuales. La capacidad de realizar procesamientos complejos bajo el marco de la computación distribuida sobre grandes cantidades de datos, en lo que se llamaría “Big Data”, ha dado un nuevo valor a los datos, solucionado algunas problemáticas comúnmente encontradas en sistemas con gran cantidad de flujo de datos online. El área de la computación denominada “Big Data” está cobrando un gran auge en los sistemas actuales, por esa razón parece oportuno realizar una investigación de las diferente tecnologías comúnmente usadas y sus oportunidades de aplicación. Este trabajo se concentra en tomar un algoritmo y llevarlo a un programa funcional bajo distintos softwares de Apache, en concreto Hadoop y Spark. Estos sistemas son usados comúnmente por organizaciones con plataformas online para realizar pruebas de aceptación de usuarios, realizar consultas no estructuradas de forma ágil y eficaz, montar motores de bases de datos sobre registros del sistema y otros archivos no estructurados, entre otras áreas de aplicación. Se investigaron otras tecnologías diferentes a Spark y Hadoop, pero se ha decidido no incluir las mismas en este documento. Entre ellas se puede mencionar Hbase, Titan DB, Amazon MapReduce (entre otros servicios), Spatial and Graph.
Fuente
Tesis de Licenciatura. Pontificia Universidad Católica Argentina, 2016
Materia
BIG DATA
COMPUTACION DISTRIBUIDA
ANALISIS DE DATOS
PROCESAMIENTO DE DATOS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
Repositorio Institucional (UCA)
Institución
Pontificia Universidad Católica Argentina
OAI Identificador
oai:ucacris:123456789/13409

id RIUCA_a2c48f41dfef5659297c3a71f02a0c64
oai_identifier_str oai:ucacris:123456789/13409
network_acronym_str RIUCA
repository_id_str 2585
network_name_str Repositorio Institucional (UCA)
spelling Benchmark de Big Data utilizando software libre y hardware de bajo costoEstol, Marcelo GastónBIG DATACOMPUTACION DISTRIBUIDAANALISIS DE DATOSPROCESAMIENTO DE DATOSFil: Estol, Marcelo Gastón. Pontificia Universidad Católica Argentina. Facultad de Ciencias Fisicomatemáticas e Ingeniería; ArgentinaFil: Di Pasquale, Ricardo. Pontificia Universidad Católica Argentina. Facultad de Ciencias Fisicomatemáticas e Ingeniería; ArgentinaResumen: El campo de la computación distribuida ha tenido una gran influencia sobre los sistemas actuales. La capacidad de realizar procesamientos complejos bajo el marco de la computación distribuida sobre grandes cantidades de datos, en lo que se llamaría “Big Data”, ha dado un nuevo valor a los datos, solucionado algunas problemáticas comúnmente encontradas en sistemas con gran cantidad de flujo de datos online. El área de la computación denominada “Big Data” está cobrando un gran auge en los sistemas actuales, por esa razón parece oportuno realizar una investigación de las diferente tecnologías comúnmente usadas y sus oportunidades de aplicación. Este trabajo se concentra en tomar un algoritmo y llevarlo a un programa funcional bajo distintos softwares de Apache, en concreto Hadoop y Spark. Estos sistemas son usados comúnmente por organizaciones con plataformas online para realizar pruebas de aceptación de usuarios, realizar consultas no estructuradas de forma ágil y eficaz, montar motores de bases de datos sobre registros del sistema y otros archivos no estructurados, entre otras áreas de aplicación. Se investigaron otras tecnologías diferentes a Spark y Hadoop, pero se ha decidido no incluir las mismas en este documento. Entre ellas se puede mencionar Hbase, Titan DB, Amazon MapReduce (entre otros servicios), Spatial and Graph.Di Pasquale, Ricardo2016info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://repositorio.uca.edu.ar/handle/123456789/13409Estol, M.G. Benchmark de Big Data utilizando software libre y hardware de bajo costo [en línea]. Tesis de Licenciatura. Pontificia Universidad Católica Argentina, 2016 Disponible en: https://repositorio.uca.edu.ar/handle/123456789/13409Tesis de Licenciatura. Pontificia Universidad Católica Argentina, 2016reponame:Repositorio Institucional (UCA)instname:Pontificia Universidad Católica Argentinaspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/2025-07-03T10:58:24Zoai:ucacris:123456789/13409instacron:UCAInstitucionalhttps://repositorio.uca.edu.ar/Universidad privadaNo correspondehttps://repositorio.uca.edu.ar/oaiclaudia_fernandez@uca.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:25852025-07-03 10:58:25.228Repositorio Institucional (UCA) - Pontificia Universidad Católica Argentinafalse
dc.title.none.fl_str_mv Benchmark de Big Data utilizando software libre y hardware de bajo costo
title Benchmark de Big Data utilizando software libre y hardware de bajo costo
spellingShingle Benchmark de Big Data utilizando software libre y hardware de bajo costo
Estol, Marcelo Gastón
BIG DATA
COMPUTACION DISTRIBUIDA
ANALISIS DE DATOS
PROCESAMIENTO DE DATOS
title_short Benchmark de Big Data utilizando software libre y hardware de bajo costo
title_full Benchmark de Big Data utilizando software libre y hardware de bajo costo
title_fullStr Benchmark de Big Data utilizando software libre y hardware de bajo costo
title_full_unstemmed Benchmark de Big Data utilizando software libre y hardware de bajo costo
title_sort Benchmark de Big Data utilizando software libre y hardware de bajo costo
dc.creator.none.fl_str_mv Estol, Marcelo Gastón
author Estol, Marcelo Gastón
author_facet Estol, Marcelo Gastón
author_role author
dc.contributor.none.fl_str_mv Di Pasquale, Ricardo
dc.subject.none.fl_str_mv BIG DATA
COMPUTACION DISTRIBUIDA
ANALISIS DE DATOS
PROCESAMIENTO DE DATOS
topic BIG DATA
COMPUTACION DISTRIBUIDA
ANALISIS DE DATOS
PROCESAMIENTO DE DATOS
dc.description.none.fl_txt_mv Fil: Estol, Marcelo Gastón. Pontificia Universidad Católica Argentina. Facultad de Ciencias Fisicomatemáticas e Ingeniería; Argentina
Fil: Di Pasquale, Ricardo. Pontificia Universidad Católica Argentina. Facultad de Ciencias Fisicomatemáticas e Ingeniería; Argentina
Resumen: El campo de la computación distribuida ha tenido una gran influencia sobre los sistemas actuales. La capacidad de realizar procesamientos complejos bajo el marco de la computación distribuida sobre grandes cantidades de datos, en lo que se llamaría “Big Data”, ha dado un nuevo valor a los datos, solucionado algunas problemáticas comúnmente encontradas en sistemas con gran cantidad de flujo de datos online. El área de la computación denominada “Big Data” está cobrando un gran auge en los sistemas actuales, por esa razón parece oportuno realizar una investigación de las diferente tecnologías comúnmente usadas y sus oportunidades de aplicación. Este trabajo se concentra en tomar un algoritmo y llevarlo a un programa funcional bajo distintos softwares de Apache, en concreto Hadoop y Spark. Estos sistemas son usados comúnmente por organizaciones con plataformas online para realizar pruebas de aceptación de usuarios, realizar consultas no estructuradas de forma ágil y eficaz, montar motores de bases de datos sobre registros del sistema y otros archivos no estructurados, entre otras áreas de aplicación. Se investigaron otras tecnologías diferentes a Spark y Hadoop, pero se ha decidido no incluir las mismas en este documento. Entre ellas se puede mencionar Hbase, Titan DB, Amazon MapReduce (entre otros servicios), Spatial and Graph.
description Fil: Estol, Marcelo Gastón. Pontificia Universidad Católica Argentina. Facultad de Ciencias Fisicomatemáticas e Ingeniería; Argentina
publishDate 2016
dc.date.none.fl_str_mv 2016
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://repositorio.uca.edu.ar/handle/123456789/13409
Estol, M.G. Benchmark de Big Data utilizando software libre y hardware de bajo costo [en línea]. Tesis de Licenciatura. Pontificia Universidad Católica Argentina, 2016 Disponible en: https://repositorio.uca.edu.ar/handle/123456789/13409
url https://repositorio.uca.edu.ar/handle/123456789/13409
identifier_str_mv Estol, M.G. Benchmark de Big Data utilizando software libre y hardware de bajo costo [en línea]. Tesis de Licenciatura. Pontificia Universidad Católica Argentina, 2016 Disponible en: https://repositorio.uca.edu.ar/handle/123456789/13409
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv Tesis de Licenciatura. Pontificia Universidad Católica Argentina, 2016
reponame:Repositorio Institucional (UCA)
instname:Pontificia Universidad Católica Argentina
reponame_str Repositorio Institucional (UCA)
collection Repositorio Institucional (UCA)
instname_str Pontificia Universidad Católica Argentina
repository.name.fl_str_mv Repositorio Institucional (UCA) - Pontificia Universidad Católica Argentina
repository.mail.fl_str_mv claudia_fernandez@uca.edu.ar
_version_ 1836638360415764480
score 12.982451