Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlex

Autores
De Albuquerque, Pablo César; Villarreal, Gonzalo Luján
Año de publicación
2025
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Este trabajo presenta una estrategia para enriquecer y analizar los metadatos de un repositorio institucional mediante la integración de fuentes abiertas como OpenAIRE y OpenAlex. Partiendo de la premisa de que estas fuentes ofrecen perspectivas complementarias sobre la producción científica, se propone su combinación para construir una visión más integrada y enriquecida. El enfoque se basa en un modelado flexible con Data Vault, que permite una integración escalable de datos, normalizando identificadores y vinculando entidades clave. El proceso se organiza en tres etapas: recolección, normalización e integración. Durante la recolección, se aplican filtros que permiten obtener datos pertinentes desde ambas fuentes, considerando tanto la afiliación institucional como el repositorio local. La integración cruza información, combinando métricas de impacto y visibilidad. Se presentan resultados obtenidos para el repositorio SEDICI de la UNLP, incluyendo publicaciones enriquecidas, autores institucionales identificados y publicaciones candidatas a ser incorporadas desde OpenAlex. Finalmente, se discute el potencial de extender esta estrategia a otras fuentes, incluyendo sistemas internos, para mejorar la cobertura y calidad de los metadatos. La propuesta promueve un uso estratégico del repositorio como herramienta de gestión, evaluación y difusión de la producción científica institucional.
Dirección PREBI-SEDICI
Centro de Servicios en Gestión de la Información
Materia
Informática
Bibliometría
Repositorios institucionales
Data Warehouse
Identificadores persistentes
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/185486

id SEDICI_1801ec654f294c4bf33032fb6390bf5f
oai_identifier_str oai:sedici.unlp.edu.ar:10915/185486
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlexDe Albuquerque, Pablo CésarVillarreal, Gonzalo LujánInformáticaBibliometríaRepositorios institucionalesData WarehouseIdentificadores persistentesEste trabajo presenta una estrategia para enriquecer y analizar los metadatos de un repositorio institucional mediante la integración de fuentes abiertas como OpenAIRE y OpenAlex. Partiendo de la premisa de que estas fuentes ofrecen perspectivas complementarias sobre la producción científica, se propone su combinación para construir una visión más integrada y enriquecida. El enfoque se basa en un modelado flexible con Data Vault, que permite una integración escalable de datos, normalizando identificadores y vinculando entidades clave. El proceso se organiza en tres etapas: recolección, normalización e integración. Durante la recolección, se aplican filtros que permiten obtener datos pertinentes desde ambas fuentes, considerando tanto la afiliación institucional como el repositorio local. La integración cruza información, combinando métricas de impacto y visibilidad. Se presentan resultados obtenidos para el repositorio SEDICI de la UNLP, incluyendo publicaciones enriquecidas, autores institucionales identificados y publicaciones candidatas a ser incorporadas desde OpenAlex. Finalmente, se discute el potencial de extender esta estrategia a otras fuentes, incluyendo sistemas internos, para mejorar la cobertura y calidad de los metadatos. La propuesta promueve un uso estratégico del repositorio como herramienta de gestión, evaluación y difusión de la producción científica institucional.Dirección PREBI-SEDICICentro de Servicios en Gestión de la Información2025-10-09info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/185486spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-15T11:42:41Zoai:sedici.unlp.edu.ar:10915/185486Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-15 11:42:41.492SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlex
title Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlex
spellingShingle Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlex
De Albuquerque, Pablo César
Informática
Bibliometría
Repositorios institucionales
Data Warehouse
Identificadores persistentes
title_short Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlex
title_full Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlex
title_fullStr Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlex
title_full_unstemmed Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlex
title_sort Un framework flexible para la mejora de metadatos en repositorios institucionales con datos de OpenAIRE y OpenAlex
dc.creator.none.fl_str_mv De Albuquerque, Pablo César
Villarreal, Gonzalo Luján
author De Albuquerque, Pablo César
author_facet De Albuquerque, Pablo César
Villarreal, Gonzalo Luján
author_role author
author2 Villarreal, Gonzalo Luján
author2_role author
dc.subject.none.fl_str_mv Informática
Bibliometría
Repositorios institucionales
Data Warehouse
Identificadores persistentes
topic Informática
Bibliometría
Repositorios institucionales
Data Warehouse
Identificadores persistentes
dc.description.none.fl_txt_mv Este trabajo presenta una estrategia para enriquecer y analizar los metadatos de un repositorio institucional mediante la integración de fuentes abiertas como OpenAIRE y OpenAlex. Partiendo de la premisa de que estas fuentes ofrecen perspectivas complementarias sobre la producción científica, se propone su combinación para construir una visión más integrada y enriquecida. El enfoque se basa en un modelado flexible con Data Vault, que permite una integración escalable de datos, normalizando identificadores y vinculando entidades clave. El proceso se organiza en tres etapas: recolección, normalización e integración. Durante la recolección, se aplican filtros que permiten obtener datos pertinentes desde ambas fuentes, considerando tanto la afiliación institucional como el repositorio local. La integración cruza información, combinando métricas de impacto y visibilidad. Se presentan resultados obtenidos para el repositorio SEDICI de la UNLP, incluyendo publicaciones enriquecidas, autores institucionales identificados y publicaciones candidatas a ser incorporadas desde OpenAlex. Finalmente, se discute el potencial de extender esta estrategia a otras fuentes, incluyendo sistemas internos, para mejorar la cobertura y calidad de los metadatos. La propuesta promueve un uso estratégico del repositorio como herramienta de gestión, evaluación y difusión de la producción científica institucional.
Dirección PREBI-SEDICI
Centro de Servicios en Gestión de la Información
description Este trabajo presenta una estrategia para enriquecer y analizar los metadatos de un repositorio institucional mediante la integración de fuentes abiertas como OpenAIRE y OpenAlex. Partiendo de la premisa de que estas fuentes ofrecen perspectivas complementarias sobre la producción científica, se propone su combinación para construir una visión más integrada y enriquecida. El enfoque se basa en un modelado flexible con Data Vault, que permite una integración escalable de datos, normalizando identificadores y vinculando entidades clave. El proceso se organiza en tres etapas: recolección, normalización e integración. Durante la recolección, se aplican filtros que permiten obtener datos pertinentes desde ambas fuentes, considerando tanto la afiliación institucional como el repositorio local. La integración cruza información, combinando métricas de impacto y visibilidad. Se presentan resultados obtenidos para el repositorio SEDICI de la UNLP, incluyendo publicaciones enriquecidas, autores institucionales identificados y publicaciones candidatas a ser incorporadas desde OpenAlex. Finalmente, se discute el potencial de extender esta estrategia a otras fuentes, incluyendo sistemas internos, para mejorar la cobertura y calidad de los metadatos. La propuesta promueve un uso estratégico del repositorio como herramienta de gestión, evaluación y difusión de la producción científica institucional.
publishDate 2025
dc.date.none.fl_str_mv 2025-10-09
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/185486
url http://sedici.unlp.edu.ar/handle/10915/185486
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1846064432629678081
score 13.22299