Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales

Autores
Soloaga, Ignacio; Lira, Ariel Jorge; Villarreal, Gonzalo Luján; Vila, María Marta; De Giusti, Marisa Raquel
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Uno de los principales objetivos de los repositorios digitales es el brindar mecanismos de interoperabilidad, a fin de permitir la recuperación de sus registros por otros sistemas y de ofrecer a sus usuarios información y servicios a partir de registros obtenidos desde otros repositorios. El intercambio de registros entre repositorios digitales brinda un mecanismo para agilizar el poblamiento cruzado, mediante el cual un repositorio puede obtener recursos de otro repositorio para corroborar datos cruzados, completar información faltante o desactualizada, e incluso para incorporar nuevos registros a su acervo propio. Esto resulta de particular interés para repositorios institucionales con investigadores de múltiple dependencia, que quizás realizan el autoarchivo de su producción en el repositorio de una de las instituciones en las que realizan sus actividades, o en muchos casos en repositorios temáticos utilizados tradicionalmente en cada área, como ser arXiv, REPEC o PubMed Central. Existen múltiples formas de obtener documentos en masa de distintos repositorios, y una de ellas es mediante el protocolo OAI-PMH, que permite la transmisión de registros de metadatos bajo el esquema Dublin Core. Haciendo uso de las interfaces que expone cada repositorio, se puede realizar una cosecha de los metadatos deseados. Si bien la obtención de los documentos a importar a un repositorio es crucial para el proceso de importación en masa, existen una serie de etapas subsiguientes a ésta que son de suma importancia y que a su vez presentan ciertos obstáculos que deben ser solucionados para garantizar la integridad y calidad de los datos. Estas etapas pueden agruparse, además de la obtención de los documentos, en transformación de los metadatos y detección de registros duplicados. Se describe el proceso general de obtención de documentos e importación de los mismos a un repositorio, así como también las herramientas desarrolladas para dar soporte a las distintas etapas del proceso.
One of the main objectives of digital repositories is to provide interoperability mechanisms in order to allow the recovery of their records by other systems and to offer their users information and services from records obtained from other repositories. The exchange of records between digital repositories provides a mechanism to streamline cross-population, whereby a repository can obtain resources from another repository to corroborate cross-data, complete missing or outdated information, and even to incorporate new records into its own collection. This is of particular interest for institutional repositories with multi-dependency researchers, who may self-archive their production in the repository of one of the institutions in which they carry out their activities, or in many cases in thematic repositories traditionally used in each area, such as arXiv, REPEC or PubMed Central. There are multiple ways to obtain mass documents from different repositories, and one of them is through the OAI-PMH protocol, which allows the transmission of record metadata under the Dublin Core scheme. Using the interfaces that each repository exposes, you can harvest the desired metadata. While obtaining the documents to be imported into a repository is crucial for the mass import process, there are a series of steps that are consequential to it, which are of the utmost importance and which in turn present certain obstacles that must be solved to guarantee the data integrity and quality. These stages can be grouped, in addition to obtaining the documents, in transformation of the metadata and detection of duplicate records. The general process of obtaining documents and importing them into a repository is described below, as well as the tools developed to support the different stages of the process.
Dirección PREBI-SEDICI
Materia
Ciencias Informáticas
Bibliotecología
Repositorios digitales
Metadatos
Interoperabilidad
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/91176

id SEDICI_9781fc17e51f276a97e564a0dd2216dd
oai_identifier_str oai:sedici.unlp.edu.ar:10915/91176
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitalesSoloaga, IgnacioLira, Ariel JorgeVillarreal, Gonzalo LujánVila, María MartaDe Giusti, Marisa RaquelCiencias InformáticasBibliotecologíaRepositorios digitalesMetadatosInteroperabilidadUno de los principales objetivos de los repositorios digitales es el brindar mecanismos de interoperabilidad, a fin de permitir la recuperación de sus registros por otros sistemas y de ofrecer a sus usuarios información y servicios a partir de registros obtenidos desde otros repositorios. El intercambio de registros entre repositorios digitales brinda un mecanismo para agilizar el poblamiento cruzado, mediante el cual un repositorio puede obtener recursos de otro repositorio para corroborar datos cruzados, completar información faltante o desactualizada, e incluso para incorporar nuevos registros a su acervo propio. Esto resulta de particular interés para repositorios institucionales con investigadores de múltiple dependencia, que quizás realizan el autoarchivo de su producción en el repositorio de una de las instituciones en las que realizan sus actividades, o en muchos casos en repositorios temáticos utilizados tradicionalmente en cada área, como ser arXiv, REPEC o PubMed Central. Existen múltiples formas de obtener documentos en masa de distintos repositorios, y una de ellas es mediante el protocolo OAI-PMH, que permite la transmisión de registros de metadatos bajo el esquema Dublin Core. Haciendo uso de las interfaces que expone cada repositorio, se puede realizar una cosecha de los metadatos deseados. Si bien la obtención de los documentos a importar a un repositorio es crucial para el proceso de importación en masa, existen una serie de etapas subsiguientes a ésta que son de suma importancia y que a su vez presentan ciertos obstáculos que deben ser solucionados para garantizar la integridad y calidad de los datos. Estas etapas pueden agruparse, además de la obtención de los documentos, en transformación de los metadatos y detección de registros duplicados. Se describe el proceso general de obtención de documentos e importación de los mismos a un repositorio, así como también las herramientas desarrolladas para dar soporte a las distintas etapas del proceso.One of the main objectives of digital repositories is to provide interoperability mechanisms in order to allow the recovery of their records by other systems and to offer their users information and services from records obtained from other repositories. The exchange of records between digital repositories provides a mechanism to streamline cross-population, whereby a repository can obtain resources from another repository to corroborate cross-data, complete missing or outdated information, and even to incorporate new records into its own collection. This is of particular interest for institutional repositories with multi-dependency researchers, who may self-archive their production in the repository of one of the institutions in which they carry out their activities, or in many cases in thematic repositories traditionally used in each area, such as arXiv, REPEC or PubMed Central. There are multiple ways to obtain mass documents from different repositories, and one of them is through the OAI-PMH protocol, which allows the transmission of record metadata under the Dublin Core scheme. Using the interfaces that each repository exposes, you can harvest the desired metadata. While obtaining the documents to be imported into a repository is crucial for the mass import process, there are a series of steps that are consequential to it, which are of the utmost importance and which in turn present certain obstacles that must be solved to guarantee the data integrity and quality. These stages can be grouped, in addition to obtaining the documents, in transformation of the metadata and detection of duplicate records. The general process of obtaining documents and importing them into a repository is described below, as well as the tools developed to support the different stages of the process.Dirección PREBI-SEDICI2019-11-21info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf90-97http://sedici.unlp.edu.ar/handle/10915/91176spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-15T11:11:01Zoai:sedici.unlp.edu.ar:10915/91176Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-15 11:11:01.251SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
title Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
spellingShingle Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
Soloaga, Ignacio
Ciencias Informáticas
Bibliotecología
Repositorios digitales
Metadatos
Interoperabilidad
title_short Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
title_full Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
title_fullStr Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
title_full_unstemmed Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
title_sort Herramientas para obtener, mapear y filtrar recursos académicos desde repositorios digitales
dc.creator.none.fl_str_mv Soloaga, Ignacio
Lira, Ariel Jorge
Villarreal, Gonzalo Luján
Vila, María Marta
De Giusti, Marisa Raquel
author Soloaga, Ignacio
author_facet Soloaga, Ignacio
Lira, Ariel Jorge
Villarreal, Gonzalo Luján
Vila, María Marta
De Giusti, Marisa Raquel
author_role author
author2 Lira, Ariel Jorge
Villarreal, Gonzalo Luján
Vila, María Marta
De Giusti, Marisa Raquel
author2_role author
author
author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Bibliotecología
Repositorios digitales
Metadatos
Interoperabilidad
topic Ciencias Informáticas
Bibliotecología
Repositorios digitales
Metadatos
Interoperabilidad
dc.description.none.fl_txt_mv Uno de los principales objetivos de los repositorios digitales es el brindar mecanismos de interoperabilidad, a fin de permitir la recuperación de sus registros por otros sistemas y de ofrecer a sus usuarios información y servicios a partir de registros obtenidos desde otros repositorios. El intercambio de registros entre repositorios digitales brinda un mecanismo para agilizar el poblamiento cruzado, mediante el cual un repositorio puede obtener recursos de otro repositorio para corroborar datos cruzados, completar información faltante o desactualizada, e incluso para incorporar nuevos registros a su acervo propio. Esto resulta de particular interés para repositorios institucionales con investigadores de múltiple dependencia, que quizás realizan el autoarchivo de su producción en el repositorio de una de las instituciones en las que realizan sus actividades, o en muchos casos en repositorios temáticos utilizados tradicionalmente en cada área, como ser arXiv, REPEC o PubMed Central. Existen múltiples formas de obtener documentos en masa de distintos repositorios, y una de ellas es mediante el protocolo OAI-PMH, que permite la transmisión de registros de metadatos bajo el esquema Dublin Core. Haciendo uso de las interfaces que expone cada repositorio, se puede realizar una cosecha de los metadatos deseados. Si bien la obtención de los documentos a importar a un repositorio es crucial para el proceso de importación en masa, existen una serie de etapas subsiguientes a ésta que son de suma importancia y que a su vez presentan ciertos obstáculos que deben ser solucionados para garantizar la integridad y calidad de los datos. Estas etapas pueden agruparse, además de la obtención de los documentos, en transformación de los metadatos y detección de registros duplicados. Se describe el proceso general de obtención de documentos e importación de los mismos a un repositorio, así como también las herramientas desarrolladas para dar soporte a las distintas etapas del proceso.
One of the main objectives of digital repositories is to provide interoperability mechanisms in order to allow the recovery of their records by other systems and to offer their users information and services from records obtained from other repositories. The exchange of records between digital repositories provides a mechanism to streamline cross-population, whereby a repository can obtain resources from another repository to corroborate cross-data, complete missing or outdated information, and even to incorporate new records into its own collection. This is of particular interest for institutional repositories with multi-dependency researchers, who may self-archive their production in the repository of one of the institutions in which they carry out their activities, or in many cases in thematic repositories traditionally used in each area, such as arXiv, REPEC or PubMed Central. There are multiple ways to obtain mass documents from different repositories, and one of them is through the OAI-PMH protocol, which allows the transmission of record metadata under the Dublin Core scheme. Using the interfaces that each repository exposes, you can harvest the desired metadata. While obtaining the documents to be imported into a repository is crucial for the mass import process, there are a series of steps that are consequential to it, which are of the utmost importance and which in turn present certain obstacles that must be solved to guarantee the data integrity and quality. These stages can be grouped, in addition to obtaining the documents, in transformation of the metadata and detection of duplicate records. The general process of obtaining documents and importing them into a repository is described below, as well as the tools developed to support the different stages of the process.
Dirección PREBI-SEDICI
description Uno de los principales objetivos de los repositorios digitales es el brindar mecanismos de interoperabilidad, a fin de permitir la recuperación de sus registros por otros sistemas y de ofrecer a sus usuarios información y servicios a partir de registros obtenidos desde otros repositorios. El intercambio de registros entre repositorios digitales brinda un mecanismo para agilizar el poblamiento cruzado, mediante el cual un repositorio puede obtener recursos de otro repositorio para corroborar datos cruzados, completar información faltante o desactualizada, e incluso para incorporar nuevos registros a su acervo propio. Esto resulta de particular interés para repositorios institucionales con investigadores de múltiple dependencia, que quizás realizan el autoarchivo de su producción en el repositorio de una de las instituciones en las que realizan sus actividades, o en muchos casos en repositorios temáticos utilizados tradicionalmente en cada área, como ser arXiv, REPEC o PubMed Central. Existen múltiples formas de obtener documentos en masa de distintos repositorios, y una de ellas es mediante el protocolo OAI-PMH, que permite la transmisión de registros de metadatos bajo el esquema Dublin Core. Haciendo uso de las interfaces que expone cada repositorio, se puede realizar una cosecha de los metadatos deseados. Si bien la obtención de los documentos a importar a un repositorio es crucial para el proceso de importación en masa, existen una serie de etapas subsiguientes a ésta que son de suma importancia y que a su vez presentan ciertos obstáculos que deben ser solucionados para garantizar la integridad y calidad de los datos. Estas etapas pueden agruparse, además de la obtención de los documentos, en transformación de los metadatos y detección de registros duplicados. Se describe el proceso general de obtención de documentos e importación de los mismos a un repositorio, así como también las herramientas desarrolladas para dar soporte a las distintas etapas del proceso.
publishDate 2019
dc.date.none.fl_str_mv 2019-11-21
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/91176
url http://sedici.unlp.edu.ar/handle/10915/91176
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
90-97
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1846064167023280128
score 13.22299