Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales

Autores
Soloaga,Ignacio; Lira, Ariel Jorge; Villarreal, Gonzalo Luján; Vila, María Marta; De Giusti, Marisa Raquel
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Uno de los principales objetivos de los repositorios digitales es el brindar mecanismos de interoperabilidad, a fin de permitir la recuperación de sus registros por otros sistemas y de ofrecer a sus usuarios información y servicios a partir de registros obtenidos desde otros repositorios. El intercambio de registros entre repositorios digitales brinda un mecanismo para agilizar el poblamiento cruzado, mediante el cual un repositorio puede obtener recursos de otro repositorio para corroborar datos cruzados, completar información faltante o desactualizada, e incluso para incorporar nuevos registros a su acervo propio. Esto resulta de particular interés para repositorios institucionales con investigadores de múltiple dependencia, que quizás realizan el autoarchivo de su producción en el repositorio de una de las instituciones en las que realizan sus actividades, o en muchos casos en repositorios temáticos utilizados tradicionalmente en cada área, como ser arXiv, REPEC o PubMed Central. Existen múltiples formas de obtener documentos en masa de distintos repositorios, y una de ellas es mediante el protocolo OAI-PMH, que permite la transmisión de registros de metadatos bajo el esquema Dublin Core. Haciendo uso de las interfaces que expone cada repositorio, se puede realizar una cosecha de los metadatos deseados. Si bien la obtención de los documentos a importar a un repositorio es crucial para el proceso de importación en masa, existen una serie de etapas subsiguientes a ésta que son de suma importancia y que a su vez presentan ciertos obstáculos que deben ser solucionados para garantizar la integridad y calidad de los datos. Estas etapas pueden agruparse, además de la obtención de los documentos, en transformación de los metadatos y detección de registros duplicados. Se describe el proceso general de obtención de documentos e importación de los mismos a un repositorio, así como también las herramientas desarrolladas para dar soporte a las distintas etapas del proceso.
One of the main objectives of digital repositories is to provide interoperability mechanisms in order to allow the recovery of their records by other systems and to offer their users information and services from records obtained from other repositories. The exchange of records between digital repositories provides a mechanism to streamline cross-population, whereby a repository can obtain resources from another repository to corroborate cross-data, complete missing or outdated information, and even to incorporate new records into its own collection. This is of particular interest for institutional repositories with multi-dependency researchers, who may self-archive their production in the repository of one of the institutions in which they carry out their activities, or in many cases in thematic repositories traditionally used in each area, such as arXiv, REPEC or PubMed Central. There are multiple ways to obtain mass documents from different repositories, and one of them is through the OAI-PMH protocol, which allows the transmission of record metadata under the Dublin Core scheme. Using the interfaces that each repository exposes, you can harvest the desired metadata. While obtaining the documents to be imported into a repository is crucial for the mass import process, there are a series of steps that are consequential to it, which are of the utmost importance and which in turn present certain obstacles that must be solved to guarantee the data integrity and quality. These stages can be grouped, in addition to obtaining the documents, in transformation of the metadata and detection of duplicate records. The general process of obtaining documents and importing them into a repository is described below, as well as the tools developed to support the different stages of the process.
Materia
Ciencias de la Computación e Información
Repositorios digitales
Metadatos
Interoperabilidad
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
CIC Digital (CICBA)
Institución
Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
OAI Identificador
oai:digital.cic.gba.gob.ar:11746/10511

id CICBA_e8cf61cbfccdbb1f435154aecc96e3fc
oai_identifier_str oai:digital.cic.gba.gob.ar:11746/10511
network_acronym_str CICBA
repository_id_str 9441
network_name_str CIC Digital (CICBA)
spelling Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitalesSoloaga,IgnacioLira, Ariel JorgeVillarreal, Gonzalo LujánVila, María MartaDe Giusti, Marisa RaquelCiencias de la Computación e InformaciónRepositorios digitalesMetadatosInteroperabilidadUno de los principales objetivos de los repositorios digitales es el brindar mecanismos de interoperabilidad, a fin de permitir la recuperación de sus registros por otros sistemas y de ofrecer a sus usuarios información y servicios a partir de registros obtenidos desde otros repositorios. El intercambio de registros entre repositorios digitales brinda un mecanismo para agilizar el poblamiento cruzado, mediante el cual un repositorio puede obtener recursos de otro repositorio para corroborar datos cruzados, completar información faltante o desactualizada, e incluso para incorporar nuevos registros a su acervo propio. Esto resulta de particular interés para repositorios institucionales con investigadores de múltiple dependencia, que quizás realizan el autoarchivo de su producción en el repositorio de una de las instituciones en las que realizan sus actividades, o en muchos casos en repositorios temáticos utilizados tradicionalmente en cada área, como ser arXiv, REPEC o PubMed Central. Existen múltiples formas de obtener documentos en masa de distintos repositorios, y una de ellas es mediante el protocolo OAI-PMH, que permite la transmisión de registros de metadatos bajo el esquema Dublin Core. Haciendo uso de las interfaces que expone cada repositorio, se puede realizar una cosecha de los metadatos deseados. Si bien la obtención de los documentos a importar a un repositorio es crucial para el proceso de importación en masa, existen una serie de etapas subsiguientes a ésta que son de suma importancia y que a su vez presentan ciertos obstáculos que deben ser solucionados para garantizar la integridad y calidad de los datos. Estas etapas pueden agruparse, además de la obtención de los documentos, en transformación de los metadatos y detección de registros duplicados. Se describe el proceso general de obtención de documentos e importación de los mismos a un repositorio, así como también las herramientas desarrolladas para dar soporte a las distintas etapas del proceso.One of the main objectives of digital repositories is to provide interoperability mechanisms in order to allow the recovery of their records by other systems and to offer their users information and services from records obtained from other repositories. The exchange of records between digital repositories provides a mechanism to streamline cross-population, whereby a repository can obtain resources from another repository to corroborate cross-data, complete missing or outdated information, and even to incorporate new records into its own collection. This is of particular interest for institutional repositories with multi-dependency researchers, who may self-archive their production in the repository of one of the institutions in which they carry out their activities, or in many cases in thematic repositories traditionally used in each area, such as arXiv, REPEC or PubMed Central. There are multiple ways to obtain mass documents from different repositories, and one of them is through the OAI-PMH protocol, which allows the transmission of record metadata under the Dublin Core scheme. Using the interfaces that each repository exposes, you can harvest the desired metadata. While obtaining the documents to be imported into a repository is crucial for the mass import process, there are a series of steps that are consequential to it, which are of the utmost importance and which in turn present certain obstacles that must be solved to guarantee the data integrity and quality. These stages can be grouped, in addition to obtaining the documents, in transformation of the metadata and detection of duplicate records. The general process of obtaining documents and importing them into a repository is described below, as well as the tools developed to support the different stages of the process.2019-11info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfapplication/pdfhttps://digital.cic.gba.gob.ar/handle/11746/10511spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/reponame:CIC Digital (CICBA)instname:Comisión de Investigaciones Científicas de la Provincia de Buenos Airesinstacron:CICBA2025-09-29T13:40:21Zoai:digital.cic.gba.gob.ar:11746/10511Institucionalhttp://digital.cic.gba.gob.arOrganismo científico-tecnológicoNo correspondehttp://digital.cic.gba.gob.ar/oai/snrdmarisa.degiusti@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:94412025-09-29 13:40:21.447CIC Digital (CICBA) - Comisión de Investigaciones Científicas de la Provincia de Buenos Airesfalse
dc.title.none.fl_str_mv Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
title Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
spellingShingle Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
Soloaga,Ignacio
Ciencias de la Computación e Información
Repositorios digitales
Metadatos
Interoperabilidad
title_short Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
title_full Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
title_fullStr Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
title_full_unstemmed Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
title_sort Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
dc.creator.none.fl_str_mv Soloaga,Ignacio
Lira, Ariel Jorge
Villarreal, Gonzalo Luján
Vila, María Marta
De Giusti, Marisa Raquel
author Soloaga,Ignacio
author_facet Soloaga,Ignacio
Lira, Ariel Jorge
Villarreal, Gonzalo Luján
Vila, María Marta
De Giusti, Marisa Raquel
author_role author
author2 Lira, Ariel Jorge
Villarreal, Gonzalo Luján
Vila, María Marta
De Giusti, Marisa Raquel
author2_role author
author
author
author
dc.subject.none.fl_str_mv Ciencias de la Computación e Información
Repositorios digitales
Metadatos
Interoperabilidad
topic Ciencias de la Computación e Información
Repositorios digitales
Metadatos
Interoperabilidad
dc.description.none.fl_txt_mv Uno de los principales objetivos de los repositorios digitales es el brindar mecanismos de interoperabilidad, a fin de permitir la recuperación de sus registros por otros sistemas y de ofrecer a sus usuarios información y servicios a partir de registros obtenidos desde otros repositorios. El intercambio de registros entre repositorios digitales brinda un mecanismo para agilizar el poblamiento cruzado, mediante el cual un repositorio puede obtener recursos de otro repositorio para corroborar datos cruzados, completar información faltante o desactualizada, e incluso para incorporar nuevos registros a su acervo propio. Esto resulta de particular interés para repositorios institucionales con investigadores de múltiple dependencia, que quizás realizan el autoarchivo de su producción en el repositorio de una de las instituciones en las que realizan sus actividades, o en muchos casos en repositorios temáticos utilizados tradicionalmente en cada área, como ser arXiv, REPEC o PubMed Central. Existen múltiples formas de obtener documentos en masa de distintos repositorios, y una de ellas es mediante el protocolo OAI-PMH, que permite la transmisión de registros de metadatos bajo el esquema Dublin Core. Haciendo uso de las interfaces que expone cada repositorio, se puede realizar una cosecha de los metadatos deseados. Si bien la obtención de los documentos a importar a un repositorio es crucial para el proceso de importación en masa, existen una serie de etapas subsiguientes a ésta que son de suma importancia y que a su vez presentan ciertos obstáculos que deben ser solucionados para garantizar la integridad y calidad de los datos. Estas etapas pueden agruparse, además de la obtención de los documentos, en transformación de los metadatos y detección de registros duplicados. Se describe el proceso general de obtención de documentos e importación de los mismos a un repositorio, así como también las herramientas desarrolladas para dar soporte a las distintas etapas del proceso.
One of the main objectives of digital repositories is to provide interoperability mechanisms in order to allow the recovery of their records by other systems and to offer their users information and services from records obtained from other repositories. The exchange of records between digital repositories provides a mechanism to streamline cross-population, whereby a repository can obtain resources from another repository to corroborate cross-data, complete missing or outdated information, and even to incorporate new records into its own collection. This is of particular interest for institutional repositories with multi-dependency researchers, who may self-archive their production in the repository of one of the institutions in which they carry out their activities, or in many cases in thematic repositories traditionally used in each area, such as arXiv, REPEC or PubMed Central. There are multiple ways to obtain mass documents from different repositories, and one of them is through the OAI-PMH protocol, which allows the transmission of record metadata under the Dublin Core scheme. Using the interfaces that each repository exposes, you can harvest the desired metadata. While obtaining the documents to be imported into a repository is crucial for the mass import process, there are a series of steps that are consequential to it, which are of the utmost importance and which in turn present certain obstacles that must be solved to guarantee the data integrity and quality. These stages can be grouped, in addition to obtaining the documents, in transformation of the metadata and detection of duplicate records. The general process of obtaining documents and importing them into a repository is described below, as well as the tools developed to support the different stages of the process.
description Uno de los principales objetivos de los repositorios digitales es el brindar mecanismos de interoperabilidad, a fin de permitir la recuperación de sus registros por otros sistemas y de ofrecer a sus usuarios información y servicios a partir de registros obtenidos desde otros repositorios. El intercambio de registros entre repositorios digitales brinda un mecanismo para agilizar el poblamiento cruzado, mediante el cual un repositorio puede obtener recursos de otro repositorio para corroborar datos cruzados, completar información faltante o desactualizada, e incluso para incorporar nuevos registros a su acervo propio. Esto resulta de particular interés para repositorios institucionales con investigadores de múltiple dependencia, que quizás realizan el autoarchivo de su producción en el repositorio de una de las instituciones en las que realizan sus actividades, o en muchos casos en repositorios temáticos utilizados tradicionalmente en cada área, como ser arXiv, REPEC o PubMed Central. Existen múltiples formas de obtener documentos en masa de distintos repositorios, y una de ellas es mediante el protocolo OAI-PMH, que permite la transmisión de registros de metadatos bajo el esquema Dublin Core. Haciendo uso de las interfaces que expone cada repositorio, se puede realizar una cosecha de los metadatos deseados. Si bien la obtención de los documentos a importar a un repositorio es crucial para el proceso de importación en masa, existen una serie de etapas subsiguientes a ésta que son de suma importancia y que a su vez presentan ciertos obstáculos que deben ser solucionados para garantizar la integridad y calidad de los datos. Estas etapas pueden agruparse, además de la obtención de los documentos, en transformación de los metadatos y detección de registros duplicados. Se describe el proceso general de obtención de documentos e importación de los mismos a un repositorio, así como también las herramientas desarrolladas para dar soporte a las distintas etapas del proceso.
publishDate 2019
dc.date.none.fl_str_mv 2019-11
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv https://digital.cic.gba.gob.ar/handle/11746/10511
url https://digital.cic.gba.gob.ar/handle/11746/10511
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.source.none.fl_str_mv reponame:CIC Digital (CICBA)
instname:Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
instacron:CICBA
reponame_str CIC Digital (CICBA)
collection CIC Digital (CICBA)
instname_str Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
instacron_str CICBA
institution CICBA
repository.name.fl_str_mv CIC Digital (CICBA) - Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
repository.mail.fl_str_mv marisa.degiusti@sedici.unlp.edu.ar
_version_ 1844618618944356352
score 13.070432