Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios

Autores
Dioguardi, Felipe
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión aceptada
Colaborador/a o director/a de tesis
Torres, Diego
Antonelli, Rubén Leandro
Descripción
Este trabajo es una contribución al proyecto "Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano", cuyo objetivo es tener una herramienta que sirva para analizar el mercado inmobiliario en la provincia de Buenos Aires y así desarrollar políticas públicas de urbanización más efectivas. Esta investigación se enfoca en identificar entidades duplicadas en un grafo de conocimiento sobre el sector inmobiliario que servirá como base de datos principal de la herramienta. El grafo está estructurado mediante una ontología del dominio inmobiliario, y poblado mediante el uso de web scraping sobre distintas páginas de avisos inmobiliarios. La construcción del grafo se describe en este trabajo para contextualizar sobre el origen de la existencia de los duplicados. Dado que la existencia de entidades duplicadas puede obstaculizar el análisis estadístico de la información debido a las inconsistencias que generan, este trabajo propone una solución basada en un enfoque bayesiano y evaluada sobre un conjunto de los datos reales curado a mano por los expertos en el dominio.
Director profesional: Juan Pablo del Río
Programa de Apoyo al Egreso para Alumnos con Práctica Profesional Supervisada
Licenciado en Informática
Universidad Nacional de La Plata
Facultad de Informática
Materia
Informática
Detección de duplicados
grafo de conocimiento
avisos inmobiliarios
clasificador bayesiano
web scraping
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/167230

id SEDICI_55019c55b7ec3991c66f8c88b384f045
oai_identifier_str oai:sedici.unlp.edu.ar:10915/167230
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Detección de duplicados sobre grafos de conocimiento de avisos inmobiliariosDioguardi, FelipeInformáticaDetección de duplicadosgrafo de conocimientoavisos inmobiliariosclasificador bayesianoweb scrapingEste trabajo es una contribución al proyecto "Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano", cuyo objetivo es tener una herramienta que sirva para analizar el mercado inmobiliario en la provincia de Buenos Aires y así desarrollar políticas públicas de urbanización más efectivas. Esta investigación se enfoca en identificar entidades duplicadas en un grafo de conocimiento sobre el sector inmobiliario que servirá como base de datos principal de la herramienta. El grafo está estructurado mediante una ontología del dominio inmobiliario, y poblado mediante el uso de web scraping sobre distintas páginas de avisos inmobiliarios. La construcción del grafo se describe en este trabajo para contextualizar sobre el origen de la existencia de los duplicados. Dado que la existencia de entidades duplicadas puede obstaculizar el análisis estadístico de la información debido a las inconsistencias que generan, este trabajo propone una solución basada en un enfoque bayesiano y evaluada sobre un conjunto de los datos reales curado a mano por los expertos en el dominio.Director profesional: Juan Pablo del RíoPrograma de Apoyo al Egreso para Alumnos con Práctica Profesional SupervisadaLicenciado en InformáticaUniversidad Nacional de La PlataFacultad de InformáticaTorres, DiegoAntonelli, Rubén Leandro2024-06-11info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionTesis de gradohttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/167230spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-15T11:36:20Zoai:sedici.unlp.edu.ar:10915/167230Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-15 11:36:20.583SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios
title Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios
spellingShingle Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios
Dioguardi, Felipe
Informática
Detección de duplicados
grafo de conocimiento
avisos inmobiliarios
clasificador bayesiano
web scraping
title_short Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios
title_full Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios
title_fullStr Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios
title_full_unstemmed Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios
title_sort Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios
dc.creator.none.fl_str_mv Dioguardi, Felipe
author Dioguardi, Felipe
author_facet Dioguardi, Felipe
author_role author
dc.contributor.none.fl_str_mv Torres, Diego
Antonelli, Rubén Leandro
dc.subject.none.fl_str_mv Informática
Detección de duplicados
grafo de conocimiento
avisos inmobiliarios
clasificador bayesiano
web scraping
topic Informática
Detección de duplicados
grafo de conocimiento
avisos inmobiliarios
clasificador bayesiano
web scraping
dc.description.none.fl_txt_mv Este trabajo es una contribución al proyecto "Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano", cuyo objetivo es tener una herramienta que sirva para analizar el mercado inmobiliario en la provincia de Buenos Aires y así desarrollar políticas públicas de urbanización más efectivas. Esta investigación se enfoca en identificar entidades duplicadas en un grafo de conocimiento sobre el sector inmobiliario que servirá como base de datos principal de la herramienta. El grafo está estructurado mediante una ontología del dominio inmobiliario, y poblado mediante el uso de web scraping sobre distintas páginas de avisos inmobiliarios. La construcción del grafo se describe en este trabajo para contextualizar sobre el origen de la existencia de los duplicados. Dado que la existencia de entidades duplicadas puede obstaculizar el análisis estadístico de la información debido a las inconsistencias que generan, este trabajo propone una solución basada en un enfoque bayesiano y evaluada sobre un conjunto de los datos reales curado a mano por los expertos en el dominio.
Director profesional: Juan Pablo del Río
Programa de Apoyo al Egreso para Alumnos con Práctica Profesional Supervisada
Licenciado en Informática
Universidad Nacional de La Plata
Facultad de Informática
description Este trabajo es una contribución al proyecto "Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano", cuyo objetivo es tener una herramienta que sirva para analizar el mercado inmobiliario en la provincia de Buenos Aires y así desarrollar políticas públicas de urbanización más efectivas. Esta investigación se enfoca en identificar entidades duplicadas en un grafo de conocimiento sobre el sector inmobiliario que servirá como base de datos principal de la herramienta. El grafo está estructurado mediante una ontología del dominio inmobiliario, y poblado mediante el uso de web scraping sobre distintas páginas de avisos inmobiliarios. La construcción del grafo se describe en este trabajo para contextualizar sobre el origen de la existencia de los duplicados. Dado que la existencia de entidades duplicadas puede obstaculizar el análisis estadístico de la información debido a las inconsistencias que generan, este trabajo propone una solución basada en un enfoque bayesiano y evaluada sobre un conjunto de los datos reales curado a mano por los expertos en el dominio.
publishDate 2024
dc.date.none.fl_str_mv 2024-06-11
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/acceptedVersion
Tesis de grado
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str acceptedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/167230
url http://sedici.unlp.edu.ar/handle/10915/167230
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1846064386059272192
score 13.22299