Normalización e identificación de objetos duplicados sobre contenido extraído de la web
- Autores
- Mastronardi, Gonzalo
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión aceptada
- Colaborador/a o director/a de tesis
- Fernández, Alejandro
- Descripción
- La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas.
Codirector: Sergio Firmenich
Licenciado en Sistemas
Universidad Nacional de La Plata
Facultad de Informática - Materia
-
Informática
Web semántica
Información
Extracción de objetos
Calidad de datos
Framework
Normalización de objetos
Identificación de duplicados
Dbpedia - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/165308
Ver los metadatos del registro completo
id |
SEDICI_27a94344c88d40935ab7f8645f4464ac |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/165308 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Normalización e identificación de objetos duplicados sobre contenido extraído de la webMastronardi, GonzaloInformáticaWeb semánticaInformaciónExtracción de objetosCalidad de datosFrameworkNormalización de objetosIdentificación de duplicadosDbpediaLa web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas.Codirector: Sergio FirmenichLicenciado en SistemasUniversidad Nacional de La PlataFacultad de InformáticaFernández, Alejandro2024-04-18info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionTesis de gradohttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/165308spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-15T11:35:37Zoai:sedici.unlp.edu.ar:10915/165308Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-15 11:35:37.296SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
title |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
spellingShingle |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web Mastronardi, Gonzalo Informática Web semántica Información Extracción de objetos Calidad de datos Framework Normalización de objetos Identificación de duplicados Dbpedia |
title_short |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
title_full |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
title_fullStr |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
title_full_unstemmed |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
title_sort |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
dc.creator.none.fl_str_mv |
Mastronardi, Gonzalo |
author |
Mastronardi, Gonzalo |
author_facet |
Mastronardi, Gonzalo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Fernández, Alejandro |
dc.subject.none.fl_str_mv |
Informática Web semántica Información Extracción de objetos Calidad de datos Framework Normalización de objetos Identificación de duplicados Dbpedia |
topic |
Informática Web semántica Información Extracción de objetos Calidad de datos Framework Normalización de objetos Identificación de duplicados Dbpedia |
dc.description.none.fl_txt_mv |
La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas. Codirector: Sergio Firmenich Licenciado en Sistemas Universidad Nacional de La Plata Facultad de Informática |
description |
La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-04-18 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/acceptedVersion Tesis de grado http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
acceptedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/165308 |
url |
http://sedici.unlp.edu.ar/handle/10915/165308 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1846064380799614976 |
score |
13.22299 |