Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios
- Autores
- Dioguardi, Felipe
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión aceptada
- Colaborador/a o director/a de tesis
- Torres, Diego
Antonelli, Rubén Leandro - Descripción
- Este trabajo es una contribución al proyecto "Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano", cuyo objetivo es tener una herramienta que sirva para analizar el mercado inmobiliario en la provincia de Buenos Aires y así desarrollar políticas públicas de urbanización más efectivas. Esta investigación se enfoca en identificar entidades duplicadas en un grafo de conocimiento sobre el sector inmobiliario que servirá como base de datos principal de la herramienta. El grafo está estructurado mediante una ontología del dominio inmobiliario, y poblado mediante el uso de web scraping sobre distintas páginas de avisos inmobiliarios. La construcción del grafo se describe en este trabajo para contextualizar sobre el origen de la existencia de los duplicados. Dado que la existencia de entidades duplicadas puede obstaculizar el análisis estadístico de la información debido a las inconsistencias que generan, este trabajo propone una solución basada en un enfoque bayesiano y evaluada sobre un conjunto de los datos reales curado a mano por los expertos en el dominio.
Director profesional: Juan Pablo del Río
Programa de Apoyo al Egreso para Alumnos con Práctica Profesional Supervisada
Licenciado en Informática
Universidad Nacional de La Plata
Facultad de Informática - Materia
-
Informática
Detección de duplicados
grafo de conocimiento
avisos inmobiliarios
clasificador bayesiano
web scraping - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/167230
Ver los metadatos del registro completo
id |
SEDICI_55019c55b7ec3991c66f8c88b384f045 |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/167230 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliariosDioguardi, FelipeInformáticaDetección de duplicadosgrafo de conocimientoavisos inmobiliariosclasificador bayesianoweb scrapingEste trabajo es una contribución al proyecto "Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano", cuyo objetivo es tener una herramienta que sirva para analizar el mercado inmobiliario en la provincia de Buenos Aires y así desarrollar políticas públicas de urbanización más efectivas. Esta investigación se enfoca en identificar entidades duplicadas en un grafo de conocimiento sobre el sector inmobiliario que servirá como base de datos principal de la herramienta. El grafo está estructurado mediante una ontología del dominio inmobiliario, y poblado mediante el uso de web scraping sobre distintas páginas de avisos inmobiliarios. La construcción del grafo se describe en este trabajo para contextualizar sobre el origen de la existencia de los duplicados. Dado que la existencia de entidades duplicadas puede obstaculizar el análisis estadístico de la información debido a las inconsistencias que generan, este trabajo propone una solución basada en un enfoque bayesiano y evaluada sobre un conjunto de los datos reales curado a mano por los expertos en el dominio.Director profesional: Juan Pablo del RíoPrograma de Apoyo al Egreso para Alumnos con Práctica Profesional SupervisadaLicenciado en InformáticaUniversidad Nacional de La PlataFacultad de InformáticaTorres, DiegoAntonelli, Rubén Leandro2024-06-11info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/acceptedVersionTesis de gradohttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/167230spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-15T11:36:20Zoai:sedici.unlp.edu.ar:10915/167230Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-15 11:36:20.583SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
title |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
spellingShingle |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios Dioguardi, Felipe Informática Detección de duplicados grafo de conocimiento avisos inmobiliarios clasificador bayesiano web scraping |
title_short |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
title_full |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
title_fullStr |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
title_full_unstemmed |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
title_sort |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
dc.creator.none.fl_str_mv |
Dioguardi, Felipe |
author |
Dioguardi, Felipe |
author_facet |
Dioguardi, Felipe |
author_role |
author |
dc.contributor.none.fl_str_mv |
Torres, Diego Antonelli, Rubén Leandro |
dc.subject.none.fl_str_mv |
Informática Detección de duplicados grafo de conocimiento avisos inmobiliarios clasificador bayesiano web scraping |
topic |
Informática Detección de duplicados grafo de conocimiento avisos inmobiliarios clasificador bayesiano web scraping |
dc.description.none.fl_txt_mv |
Este trabajo es una contribución al proyecto "Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano", cuyo objetivo es tener una herramienta que sirva para analizar el mercado inmobiliario en la provincia de Buenos Aires y así desarrollar políticas públicas de urbanización más efectivas. Esta investigación se enfoca en identificar entidades duplicadas en un grafo de conocimiento sobre el sector inmobiliario que servirá como base de datos principal de la herramienta. El grafo está estructurado mediante una ontología del dominio inmobiliario, y poblado mediante el uso de web scraping sobre distintas páginas de avisos inmobiliarios. La construcción del grafo se describe en este trabajo para contextualizar sobre el origen de la existencia de los duplicados. Dado que la existencia de entidades duplicadas puede obstaculizar el análisis estadístico de la información debido a las inconsistencias que generan, este trabajo propone una solución basada en un enfoque bayesiano y evaluada sobre un conjunto de los datos reales curado a mano por los expertos en el dominio. Director profesional: Juan Pablo del Río Programa de Apoyo al Egreso para Alumnos con Práctica Profesional Supervisada Licenciado en Informática Universidad Nacional de La Plata Facultad de Informática |
description |
Este trabajo es una contribución al proyecto "Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano", cuyo objetivo es tener una herramienta que sirva para analizar el mercado inmobiliario en la provincia de Buenos Aires y así desarrollar políticas públicas de urbanización más efectivas. Esta investigación se enfoca en identificar entidades duplicadas en un grafo de conocimiento sobre el sector inmobiliario que servirá como base de datos principal de la herramienta. El grafo está estructurado mediante una ontología del dominio inmobiliario, y poblado mediante el uso de web scraping sobre distintas páginas de avisos inmobiliarios. La construcción del grafo se describe en este trabajo para contextualizar sobre el origen de la existencia de los duplicados. Dado que la existencia de entidades duplicadas puede obstaculizar el análisis estadístico de la información debido a las inconsistencias que generan, este trabajo propone una solución basada en un enfoque bayesiano y evaluada sobre un conjunto de los datos reales curado a mano por los expertos en el dominio. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-06-11 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/acceptedVersion Tesis de grado http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
acceptedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/167230 |
url |
http://sedici.unlp.edu.ar/handle/10915/167230 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1846064386059272192 |
score |
13.22299 |