Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado

Autores
Badgen, Iván Matías
Año de publicación
2015
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Castaño, José Daniel
Descripción
En este trabajo se estudian y aplican distintas técnicas de web mining e information retrieval con el objetivo de explorar el espacio de sitios web y desarrollar un prototipo de buscador sobre cine, particularmente bajo la categoría de documentales. Se comenzó partiendo de algunas semillas consideradas de interés y luego se amplió a resultados de algunos buscadores tradicionales. La idea no fue solo quedarse con ellos, sino intentar descubrir nuevos sitios que se pudieran clasificar también dentro del interés planteado. Por otra parte, utilizando crawling e indexando los resultados, se estudió el espacio obtenido en términos de grafos, para determinar qué sitios podrían ser más relevantes que otros dentro del dominio. En este caso, no necesariamente relevantes en cuanto a contenido, pero sí como potenciales semillas para encontrar otros sitios relacionados. El trabajo en buscadores verticales es usualmente complementado con técnicas de aprendizaje automático para mejorar tanto la búsqueda como la presentación de resultados. En el caso de este trabajo, se utilizaron algoritmos de clasificación para el descubrimiento de nuevas páginas relevantes y algoritmos de clustering para el análisis de los resultados obtenidos. Como resultado, se implementó un prototipo de buscador para el cine documental cuyo contenido esté restringido a documentales del cine hispano-americano.
Fil: Badgen, Iván Matías. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
WEB MINING
INFORMATION RETRIEVAL
CLASSIFICATION
CLUSTERING
SEARCH ENGINES
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000433_Badgen

id BDUBAFCEN_b9bcc5e2a79d25e6d7151fcf1ba8d586
oai_identifier_str seminario:seminario_nCOM000433_Badgen
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisadoBadgen, Iván MatíasWEB MININGINFORMATION RETRIEVAL CLASSIFICATION CLUSTERING SEARCH ENGINESEn este trabajo se estudian y aplican distintas técnicas de web mining e information retrieval con el objetivo de explorar el espacio de sitios web y desarrollar un prototipo de buscador sobre cine, particularmente bajo la categoría de documentales. Se comenzó partiendo de algunas semillas consideradas de interés y luego se amplió a resultados de algunos buscadores tradicionales. La idea no fue solo quedarse con ellos, sino intentar descubrir nuevos sitios que se pudieran clasificar también dentro del interés planteado. Por otra parte, utilizando crawling e indexando los resultados, se estudió el espacio obtenido en términos de grafos, para determinar qué sitios podrían ser más relevantes que otros dentro del dominio. En este caso, no necesariamente relevantes en cuanto a contenido, pero sí como potenciales semillas para encontrar otros sitios relacionados. El trabajo en buscadores verticales es usualmente complementado con técnicas de aprendizaje automático para mejorar tanto la búsqueda como la presentación de resultados. En el caso de este trabajo, se utilizaron algoritmos de clasificación para el descubrimiento de nuevas páginas relevantes y algoritmos de clustering para el análisis de los resultados obtenidos. Como resultado, se implementó un prototipo de buscador para el cine documental cuyo contenido esté restringido a documentales del cine hispano-americano.Fil: Badgen, Iván Matías. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesCastaño, José Daniel2015-06-08info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000433_Badgenspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-04T09:49:19Zseminario:seminario_nCOM000433_BadgenInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-04 09:49:20.337Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
title Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
spellingShingle Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
Badgen, Iván Matías
WEB MINING
INFORMATION RETRIEVAL
CLASSIFICATION
CLUSTERING
SEARCH ENGINES
title_short Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
title_full Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
title_fullStr Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
title_full_unstemmed Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
title_sort Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
dc.creator.none.fl_str_mv Badgen, Iván Matías
author Badgen, Iván Matías
author_facet Badgen, Iván Matías
author_role author
dc.contributor.none.fl_str_mv Castaño, José Daniel
dc.subject.none.fl_str_mv WEB MINING
INFORMATION RETRIEVAL
CLASSIFICATION
CLUSTERING
SEARCH ENGINES
topic WEB MINING
INFORMATION RETRIEVAL
CLASSIFICATION
CLUSTERING
SEARCH ENGINES
dc.description.none.fl_txt_mv En este trabajo se estudian y aplican distintas técnicas de web mining e information retrieval con el objetivo de explorar el espacio de sitios web y desarrollar un prototipo de buscador sobre cine, particularmente bajo la categoría de documentales. Se comenzó partiendo de algunas semillas consideradas de interés y luego se amplió a resultados de algunos buscadores tradicionales. La idea no fue solo quedarse con ellos, sino intentar descubrir nuevos sitios que se pudieran clasificar también dentro del interés planteado. Por otra parte, utilizando crawling e indexando los resultados, se estudió el espacio obtenido en términos de grafos, para determinar qué sitios podrían ser más relevantes que otros dentro del dominio. En este caso, no necesariamente relevantes en cuanto a contenido, pero sí como potenciales semillas para encontrar otros sitios relacionados. El trabajo en buscadores verticales es usualmente complementado con técnicas de aprendizaje automático para mejorar tanto la búsqueda como la presentación de resultados. En el caso de este trabajo, se utilizaron algoritmos de clasificación para el descubrimiento de nuevas páginas relevantes y algoritmos de clustering para el análisis de los resultados obtenidos. Como resultado, se implementó un prototipo de buscador para el cine documental cuyo contenido esté restringido a documentales del cine hispano-americano.
Fil: Badgen, Iván Matías. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description En este trabajo se estudian y aplican distintas técnicas de web mining e information retrieval con el objetivo de explorar el espacio de sitios web y desarrollar un prototipo de buscador sobre cine, particularmente bajo la categoría de documentales. Se comenzó partiendo de algunas semillas consideradas de interés y luego se amplió a resultados de algunos buscadores tradicionales. La idea no fue solo quedarse con ellos, sino intentar descubrir nuevos sitios que se pudieran clasificar también dentro del interés planteado. Por otra parte, utilizando crawling e indexando los resultados, se estudió el espacio obtenido en términos de grafos, para determinar qué sitios podrían ser más relevantes que otros dentro del dominio. En este caso, no necesariamente relevantes en cuanto a contenido, pero sí como potenciales semillas para encontrar otros sitios relacionados. El trabajo en buscadores verticales es usualmente complementado con técnicas de aprendizaje automático para mejorar tanto la búsqueda como la presentación de resultados. En el caso de este trabajo, se utilizaron algoritmos de clasificación para el descubrimiento de nuevas páginas relevantes y algoritmos de clustering para el análisis de los resultados obtenidos. Como resultado, se implementó un prototipo de buscador para el cine documental cuyo contenido esté restringido a documentales del cine hispano-americano.
publishDate 2015
dc.date.none.fl_str_mv 2015-06-08
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000433_Badgen
url https://hdl.handle.net/20.500.12110/seminario_nCOM000433_Badgen
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1842340718077542400
score 12.623145