Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras

Autores
De Giusti, Marisa Raquel; Villarreal, Gonzalo Luján; Sobrado, Ariel; Vosou, Agustín
Año de publicación
2009
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
En este trabajo se presenta una herramienta de recolección de información abierta que, mediante la combinación de ontologías y tesauros, brindará información clasificada y unificada en un repositorio temático a los usuarios del Servicio de Difusión de la Creación Intelectual (SeDiCI); esta clasificación permitirá optimizar considerablemente las búsquedas dentro del portal.\nSeDiCI posee actualmente una gran cantidad de documentos con una sintaxis y catalogación correctas, pero carece de relaciones semánticas entre los mismos. Esta falta de relaciones semánticas genera mayores esfuerzos por parte de los usuarios para vincular documentos unos con otros, a fin de filtrar y clasificar los resultados de una consulta a partir de un dominio específico.\nCon el objeto de ayudar a los usuarios de SeDiCI a encontrar información pertinente, se propone aquí la incorporación de una herramienta capaz de establecer relaciones semánticas entre los documentos. Esta herramienta constará de dos módulos: el primero estará encargado de recolectar información abierta de interés mediante un agente que navega recursivamente a través de las URLs de los documentos localizados; el segundo módulo será capaz de identificar las páginas marcadas junto a sus etiquetas, y proveer un conjunto de reglas para extraer la información y guardarla en un fichero RDF. A continuación se realizará un proceso de homogeneización entre los términos encontrados, clasificando la información en función de una ontología de dominio. El material recolectado poblará de este modo la ontología, sumándose al repositorio semántico. Para las primeras pruebas de esta herramienta, se utilizará el repositorio propio de SeDiCI, junto con una operación de marcado automática.\nUna vez que los documentos hayan sido vinculados semánticamente, se proveerá un buscador capaz de aprovechar estas nuevas relaciones-compuestas por clases y subclases-dentro de la ontología lo cual resultará en una considerable mejora en el proceso de organización y entrega de información pertinente al usuario.
Materia
Ciencias de la Computación e Información
Almacenamiento y Recuperación de la Información
Web Semántica
SEDICI
repositorios
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by/4.0/
Repositorio
CIC Digital (CICBA)
Institución
Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
OAI Identificador
oai:digital.cic.gba.gob.ar:11746/3420

id CICBA_5f96db2729c6b728d641197b45629b87
oai_identifier_str oai:digital.cic.gba.gob.ar:11746/3420
network_acronym_str CICBA
repository_id_str 9441
network_name_str CIC Digital (CICBA)
spelling Recuperación y clasificación automática de información, resultados actuales y perspectivas futurasDe Giusti, Marisa RaquelVillarreal, Gonzalo LujánSobrado, ArielVosou, AgustínCiencias de la Computación e InformaciónAlmacenamiento y Recuperación de la InformaciónWeb SemánticaSEDICIrepositoriosEn este trabajo se presenta una herramienta de recolección de información abierta que, mediante la combinación de ontologías y tesauros, brindará información clasificada y unificada en un repositorio temático a los usuarios del Servicio de Difusión de la Creación Intelectual (SeDiCI); esta clasificación permitirá optimizar considerablemente las búsquedas dentro del portal.\nSeDiCI posee actualmente una gran cantidad de documentos con una sintaxis y catalogación correctas, pero carece de relaciones semánticas entre los mismos. Esta falta de relaciones semánticas genera mayores esfuerzos por parte de los usuarios para vincular documentos unos con otros, a fin de filtrar y clasificar los resultados de una consulta a partir de un dominio específico.\nCon el objeto de ayudar a los usuarios de SeDiCI a encontrar información pertinente, se propone aquí la incorporación de una herramienta capaz de establecer relaciones semánticas entre los documentos. Esta herramienta constará de dos módulos: el primero estará encargado de recolectar información abierta de interés mediante un agente que navega recursivamente a través de las URLs de los documentos localizados; el segundo módulo será capaz de identificar las páginas marcadas junto a sus etiquetas, y proveer un conjunto de reglas para extraer la información y guardarla en un fichero RDF. A continuación se realizará un proceso de homogeneización entre los términos encontrados, clasificando la información en función de una ontología de dominio. El material recolectado poblará de este modo la ontología, sumándose al repositorio semántico. Para las primeras pruebas de esta herramienta, se utilizará el repositorio propio de SeDiCI, junto con una operación de marcado automática.\nUna vez que los documentos hayan sido vinculados semánticamente, se proveerá un buscador capaz de aprovechar estas nuevas relaciones-compuestas por clases y subclases-dentro de la ontología lo cual resultará en una considerable mejora en el proceso de organización y entrega de información pertinente al usuario.2009info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttps://digital.cic.gba.gob.ar/handle/11746/3420spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/4.0/reponame:CIC Digital (CICBA)instname:Comisión de Investigaciones Científicas de la Provincia de Buenos Airesinstacron:CICBA2025-10-16T09:27:23Zoai:digital.cic.gba.gob.ar:11746/3420Institucionalhttp://digital.cic.gba.gob.arOrganismo científico-tecnológicoNo correspondehttp://digital.cic.gba.gob.ar/oai/snrdmarisa.degiusti@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:94412025-10-16 09:27:24.023CIC Digital (CICBA) - Comisión de Investigaciones Científicas de la Provincia de Buenos Airesfalse
dc.title.none.fl_str_mv Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
spellingShingle Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
De Giusti, Marisa Raquel
Ciencias de la Computación e Información
Almacenamiento y Recuperación de la Información
Web Semántica
SEDICI
repositorios
title_short Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_full Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_fullStr Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_full_unstemmed Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_sort Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
dc.creator.none.fl_str_mv De Giusti, Marisa Raquel
Villarreal, Gonzalo Luján
Sobrado, Ariel
Vosou, Agustín
author De Giusti, Marisa Raquel
author_facet De Giusti, Marisa Raquel
Villarreal, Gonzalo Luján
Sobrado, Ariel
Vosou, Agustín
author_role author
author2 Villarreal, Gonzalo Luján
Sobrado, Ariel
Vosou, Agustín
author2_role author
author
author
dc.subject.none.fl_str_mv Ciencias de la Computación e Información
Almacenamiento y Recuperación de la Información
Web Semántica
SEDICI
repositorios
topic Ciencias de la Computación e Información
Almacenamiento y Recuperación de la Información
Web Semántica
SEDICI
repositorios
dc.description.none.fl_txt_mv En este trabajo se presenta una herramienta de recolección de información abierta que, mediante la combinación de ontologías y tesauros, brindará información clasificada y unificada en un repositorio temático a los usuarios del Servicio de Difusión de la Creación Intelectual (SeDiCI); esta clasificación permitirá optimizar considerablemente las búsquedas dentro del portal.\nSeDiCI posee actualmente una gran cantidad de documentos con una sintaxis y catalogación correctas, pero carece de relaciones semánticas entre los mismos. Esta falta de relaciones semánticas genera mayores esfuerzos por parte de los usuarios para vincular documentos unos con otros, a fin de filtrar y clasificar los resultados de una consulta a partir de un dominio específico.\nCon el objeto de ayudar a los usuarios de SeDiCI a encontrar información pertinente, se propone aquí la incorporación de una herramienta capaz de establecer relaciones semánticas entre los documentos. Esta herramienta constará de dos módulos: el primero estará encargado de recolectar información abierta de interés mediante un agente que navega recursivamente a través de las URLs de los documentos localizados; el segundo módulo será capaz de identificar las páginas marcadas junto a sus etiquetas, y proveer un conjunto de reglas para extraer la información y guardarla en un fichero RDF. A continuación se realizará un proceso de homogeneización entre los términos encontrados, clasificando la información en función de una ontología de dominio. El material recolectado poblará de este modo la ontología, sumándose al repositorio semántico. Para las primeras pruebas de esta herramienta, se utilizará el repositorio propio de SeDiCI, junto con una operación de marcado automática.\nUna vez que los documentos hayan sido vinculados semánticamente, se proveerá un buscador capaz de aprovechar estas nuevas relaciones-compuestas por clases y subclases-dentro de la ontología lo cual resultará en una considerable mejora en el proceso de organización y entrega de información pertinente al usuario.
description En este trabajo se presenta una herramienta de recolección de información abierta que, mediante la combinación de ontologías y tesauros, brindará información clasificada y unificada en un repositorio temático a los usuarios del Servicio de Difusión de la Creación Intelectual (SeDiCI); esta clasificación permitirá optimizar considerablemente las búsquedas dentro del portal.\nSeDiCI posee actualmente una gran cantidad de documentos con una sintaxis y catalogación correctas, pero carece de relaciones semánticas entre los mismos. Esta falta de relaciones semánticas genera mayores esfuerzos por parte de los usuarios para vincular documentos unos con otros, a fin de filtrar y clasificar los resultados de una consulta a partir de un dominio específico.\nCon el objeto de ayudar a los usuarios de SeDiCI a encontrar información pertinente, se propone aquí la incorporación de una herramienta capaz de establecer relaciones semánticas entre los documentos. Esta herramienta constará de dos módulos: el primero estará encargado de recolectar información abierta de interés mediante un agente que navega recursivamente a través de las URLs de los documentos localizados; el segundo módulo será capaz de identificar las páginas marcadas junto a sus etiquetas, y proveer un conjunto de reglas para extraer la información y guardarla en un fichero RDF. A continuación se realizará un proceso de homogeneización entre los términos encontrados, clasificando la información en función de una ontología de dominio. El material recolectado poblará de este modo la ontología, sumándose al repositorio semántico. Para las primeras pruebas de esta herramienta, se utilizará el repositorio propio de SeDiCI, junto con una operación de marcado automática.\nUna vez que los documentos hayan sido vinculados semánticamente, se proveerá un buscador capaz de aprovechar estas nuevas relaciones-compuestas por clases y subclases-dentro de la ontología lo cual resultará en una considerable mejora en el proceso de organización y entrega de información pertinente al usuario.
publishDate 2009
dc.date.none.fl_str_mv 2009
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv https://digital.cic.gba.gob.ar/handle/11746/3420
url https://digital.cic.gba.gob.ar/handle/11746/3420
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:CIC Digital (CICBA)
instname:Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
instacron:CICBA
reponame_str CIC Digital (CICBA)
collection CIC Digital (CICBA)
instname_str Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
instacron_str CICBA
institution CICBA
repository.name.fl_str_mv CIC Digital (CICBA) - Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
repository.mail.fl_str_mv marisa.degiusti@sedici.unlp.edu.ar
_version_ 1846142625051049984
score 12.712165