Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras

Autores
De Giusti, Marisa Raquel; Villarreal, Gonzalo Luján; Sobrado, Ariel; Vosou, Agustín
Año de publicación
2009
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
En este trabajo se presenta una herramienta de recolección de información abierta que, mediante la combinación de ontologías y tesauros, brindará información clasificada y unificada en un repositorio temático a los usuarios del Servicio de Difusión de la Creación Intelectual (SeDiCI); esta clasificación permitirá optimizar considerablemente las búsquedas dentro del portal. SeDiCI posee actualmente una gran cantidad de documentos con una sintaxis y catalogación correctas, pero carece de relaciones semánticas entre los mismos. Esta falta de relaciones semánticas genera mayores esfuerzos por parte de los usuarios para vincular documentos unos con otros, a fin de filtrar y clasificar los resultados de una consulta a partir de un dominio específico. Con el objeto de ayudar a los usuarios de SeDiCI a encontrar información pertinente, se propone aquí la incorporación de una herramienta capaz de establecer relaciones semánticas entre los documentos. Esta herramienta constará de dos módulos: el primero estará encargado de recolectar información abierta de interés mediante un agente que navega recursivamente a través de las URLs de los documentos localizados; el segundo módulo será capaz de identificar las páginas marcadas junto a sus etiquetas, y proveer un conjunto de reglas para extraer la información y guardarla en un fichero RDF. A continuación se realizará un proceso de homogeneización entre los términos encontrados, clasificando la información en función de una ontología de dominio. El material recolectado poblará de este modo la ontología, sumándose al repositorio semántico. Para las primeras pruebas de esta herramienta, se utilizará el repositorio propio de SeDiCI, junto con una operación de marcado automática. Una vez que los documentos hayan sido vinculados semánticamente, se proveerá un buscador capaz de aprovechar estas nuevas relaciones-compuestas por clases y subclases-dentro de la ontología lo cual resultará en una considerable mejora en el proceso de organización y entrega de información pertinente al usuario.
Dirección PREBI-SEDICI
Materia
Bibliotecología
Informática
Sistemas de Información
Recuperación de información
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by/3.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/5554

id SEDICI_073299f7b7c3260a99ddd093524a6390
oai_identifier_str oai:sedici.unlp.edu.ar:10915/5554
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Recuperación y clasificación automática de información, resultados actuales y perspectivas futurasDe Giusti, Marisa RaquelVillarreal, Gonzalo LujánSobrado, ArielVosou, AgustínBibliotecologíaInformáticaSistemas de InformaciónRecuperación de informaciónEn este trabajo se presenta una herramienta de recolección de información abierta que, mediante la combinación de ontologías y tesauros, brindará información clasificada y unificada en un repositorio temático a los usuarios del Servicio de Difusión de la Creación Intelectual (SeDiCI); esta clasificación permitirá optimizar considerablemente las búsquedas dentro del portal. SeDiCI posee actualmente una gran cantidad de documentos con una sintaxis y catalogación correctas, pero carece de relaciones semánticas entre los mismos. Esta falta de relaciones semánticas genera mayores esfuerzos por parte de los usuarios para vincular documentos unos con otros, a fin de filtrar y clasificar los resultados de una consulta a partir de un dominio específico. Con el objeto de ayudar a los usuarios de SeDiCI a encontrar información pertinente, se propone aquí la incorporación de una herramienta capaz de establecer relaciones semánticas entre los documentos. Esta herramienta constará de dos módulos: el primero estará encargado de recolectar información abierta de interés mediante un agente que navega recursivamente a través de las URLs de los documentos localizados; el segundo módulo será capaz de identificar las páginas marcadas junto a sus etiquetas, y proveer un conjunto de reglas para extraer la información y guardarla en un fichero RDF. A continuación se realizará un proceso de homogeneización entre los términos encontrados, clasificando la información en función de una ontología de dominio. El material recolectado poblará de este modo la ontología, sumándose al repositorio semántico. Para las primeras pruebas de esta herramienta, se utilizará el repositorio propio de SeDiCI, junto con una operación de marcado automática. Una vez que los documentos hayan sido vinculados semánticamente, se proveerá un buscador capaz de aprovechar estas nuevas relaciones-compuestas por clases y subclases-dentro de la ontología lo cual resultará en una considerable mejora en el proceso de organización y entrega de información pertinente al usuario.Dirección PREBI-SEDICI2009info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/5554spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/3.0/Creative Commons Attribution 3.0 Unported (CC BY 3.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-03T10:22:31Zoai:sedici.unlp.edu.ar:10915/5554Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-03 10:22:31.932SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
spellingShingle Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
De Giusti, Marisa Raquel
Bibliotecología
Informática
Sistemas de Información
Recuperación de información
title_short Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_full Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_fullStr Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_full_unstemmed Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_sort Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
dc.creator.none.fl_str_mv De Giusti, Marisa Raquel
Villarreal, Gonzalo Luján
Sobrado, Ariel
Vosou, Agustín
author De Giusti, Marisa Raquel
author_facet De Giusti, Marisa Raquel
Villarreal, Gonzalo Luján
Sobrado, Ariel
Vosou, Agustín
author_role author
author2 Villarreal, Gonzalo Luján
Sobrado, Ariel
Vosou, Agustín
author2_role author
author
author
dc.subject.none.fl_str_mv Bibliotecología
Informática
Sistemas de Información
Recuperación de información
topic Bibliotecología
Informática
Sistemas de Información
Recuperación de información
dc.description.none.fl_txt_mv En este trabajo se presenta una herramienta de recolección de información abierta que, mediante la combinación de ontologías y tesauros, brindará información clasificada y unificada en un repositorio temático a los usuarios del Servicio de Difusión de la Creación Intelectual (SeDiCI); esta clasificación permitirá optimizar considerablemente las búsquedas dentro del portal. SeDiCI posee actualmente una gran cantidad de documentos con una sintaxis y catalogación correctas, pero carece de relaciones semánticas entre los mismos. Esta falta de relaciones semánticas genera mayores esfuerzos por parte de los usuarios para vincular documentos unos con otros, a fin de filtrar y clasificar los resultados de una consulta a partir de un dominio específico. Con el objeto de ayudar a los usuarios de SeDiCI a encontrar información pertinente, se propone aquí la incorporación de una herramienta capaz de establecer relaciones semánticas entre los documentos. Esta herramienta constará de dos módulos: el primero estará encargado de recolectar información abierta de interés mediante un agente que navega recursivamente a través de las URLs de los documentos localizados; el segundo módulo será capaz de identificar las páginas marcadas junto a sus etiquetas, y proveer un conjunto de reglas para extraer la información y guardarla en un fichero RDF. A continuación se realizará un proceso de homogeneización entre los términos encontrados, clasificando la información en función de una ontología de dominio. El material recolectado poblará de este modo la ontología, sumándose al repositorio semántico. Para las primeras pruebas de esta herramienta, se utilizará el repositorio propio de SeDiCI, junto con una operación de marcado automática. Una vez que los documentos hayan sido vinculados semánticamente, se proveerá un buscador capaz de aprovechar estas nuevas relaciones-compuestas por clases y subclases-dentro de la ontología lo cual resultará en una considerable mejora en el proceso de organización y entrega de información pertinente al usuario.
Dirección PREBI-SEDICI
description En este trabajo se presenta una herramienta de recolección de información abierta que, mediante la combinación de ontologías y tesauros, brindará información clasificada y unificada en un repositorio temático a los usuarios del Servicio de Difusión de la Creación Intelectual (SeDiCI); esta clasificación permitirá optimizar considerablemente las búsquedas dentro del portal. SeDiCI posee actualmente una gran cantidad de documentos con una sintaxis y catalogación correctas, pero carece de relaciones semánticas entre los mismos. Esta falta de relaciones semánticas genera mayores esfuerzos por parte de los usuarios para vincular documentos unos con otros, a fin de filtrar y clasificar los resultados de una consulta a partir de un dominio específico. Con el objeto de ayudar a los usuarios de SeDiCI a encontrar información pertinente, se propone aquí la incorporación de una herramienta capaz de establecer relaciones semánticas entre los documentos. Esta herramienta constará de dos módulos: el primero estará encargado de recolectar información abierta de interés mediante un agente que navega recursivamente a través de las URLs de los documentos localizados; el segundo módulo será capaz de identificar las páginas marcadas junto a sus etiquetas, y proveer un conjunto de reglas para extraer la información y guardarla en un fichero RDF. A continuación se realizará un proceso de homogeneización entre los términos encontrados, clasificando la información en función de una ontología de dominio. El material recolectado poblará de este modo la ontología, sumándose al repositorio semántico. Para las primeras pruebas de esta herramienta, se utilizará el repositorio propio de SeDiCI, junto con una operación de marcado automática. Una vez que los documentos hayan sido vinculados semánticamente, se proveerá un buscador capaz de aprovechar estas nuevas relaciones-compuestas por clases y subclases-dentro de la ontología lo cual resultará en una considerable mejora en el proceso de organización y entrega de información pertinente al usuario.
publishDate 2009
dc.date.none.fl_str_mv 2009
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/5554
url http://sedici.unlp.edu.ar/handle/10915/5554
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by/3.0/
Creative Commons Attribution 3.0 Unported (CC BY 3.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/3.0/
Creative Commons Attribution 3.0 Unported (CC BY 3.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1842260052954578944
score 13.13397