Normalización e identificación de objetos duplicados sobre contenido extraído de la web

Autores: Mastronardi, Gonzalo
Año de publicación: 2024
Idioma: español castellano
Tipo de recurso: tesis de grado
Estado: versión aceptada
Colaborador/a o director/a de tesis: Fernández, Alejandro
Descripción: La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas.
Codirector: Sergio Firmenich
Licenciado en Sistemas
Universidad Nacional de La Plata
Facultad de Informática
Materia: Informática
Web semántica
Información
Extracción de objetos
Calidad de datos
Framework
Normalización de objetos
Identificación de duplicados
Dbpedia
Nivel de accesibilidad: acceso abierto
Condiciones de uso: http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
Institución: Universidad Nacional de La Plata
OAI Identificador: oai:sedici.unlp.edu.ar:10915/165308

Acceder

id	SEDICI_27a94344c88d40935ab7f8645f4464ac
oai_identifier_str	oai:sedici.unlp.edu.ar:10915/165308
network_acronym_str	SEDICI
repository_id_str	1329
network_name_str	SEDICI (UNLP)
spelling	Normalización e identificación de objetos duplicados sobre contenido extraído de la webMastronardi, GonzaloInformáticaWeb semánticaInformaciónExtracción de objetosCalidad de datosFrameworkNormalización de objetosIdentificación de duplicadosDbpediaLa web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas.Codirector: Sergio FirmenichLicenciado en SistemasUniversidad Nacional de La PlataFacultad de InformáticaFernández, Alejandro2024-04-18info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionTesis de gradohttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/165308spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-05-13T12:50:21Zoai:sedici.unlp.edu.ar:10915/165308Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-05-13 12:50:22.322SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv	Normalización e identificación de objetos duplicados sobre contenido extraído de la web
title	Normalización e identificación de objetos duplicados sobre contenido extraído de la web
spellingShingle	Normalización e identificación de objetos duplicados sobre contenido extraído de la web Mastronardi, Gonzalo Informática Web semántica Información Extracción de objetos Calidad de datos Framework Normalización de objetos Identificación de duplicados Dbpedia
title_short	Normalización e identificación de objetos duplicados sobre contenido extraído de la web
title_full	Normalización e identificación de objetos duplicados sobre contenido extraído de la web
title_fullStr	Normalización e identificación de objetos duplicados sobre contenido extraído de la web
title_full_unstemmed	Normalización e identificación de objetos duplicados sobre contenido extraído de la web
title_sort	Normalización e identificación de objetos duplicados sobre contenido extraído de la web
dc.creator.none.fl_str_mv	Mastronardi, Gonzalo
author	Mastronardi, Gonzalo
author_facet	Mastronardi, Gonzalo
author_role	author
dc.contributor.none.fl_str_mv	Fernández, Alejandro
dc.subject.none.fl_str_mv	Informática Web semántica Información Extracción de objetos Calidad de datos Framework Normalización de objetos Identificación de duplicados Dbpedia
topic	Informática Web semántica Información Extracción de objetos Calidad de datos Framework Normalización de objetos Identificación de duplicados Dbpedia
dc.description.none.fl_txt_mv	La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas. Codirector: Sergio Firmenich Licenciado en Sistemas Universidad Nacional de La Plata Facultad de Informática
description	La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas.
publishDate	2024
dc.date.none.fl_str_mv	2024-04-18
dc.type.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/acceptedVersion Tesis de grado http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado
format	bachelorThesis
status_str	acceptedVersion
dc.identifier.none.fl_str_mv	http://sedici.unlp.edu.ar/handle/10915/165308
url	http://sedici.unlp.edu.ar/handle/10915/165308
dc.language.none.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv	openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP
reponame_str	SEDICI (UNLP)
collection	SEDICI (UNLP)
instname_str	Universidad Nacional de La Plata
instacron_str	UNLP
institution	UNLP
repository.name.fl_str_mv	SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv	alira@sedici.unlp.edu.ar
_version_	1865172256424984576
score	13.115601

Normalización e identificación de objetos duplicados sobre contenido extraído de la web

Publicaciones similares