Publication of linked open data: a systematic literature review for identifying problems and technical tools supporting the process

Autores
Silva-Aguilar, Jairo H.; Torres, Rommel; Estévez, Elsa Clara
Año de publicación
2023
Idioma
inglés
Tipo de recurso
artículo
Estado
versión publicada
Descripción
On the Internet, we find a large amount of information from government institutions that has been published in open format. However, only a part of these data is available in standard formats such as Resource Description Framework (RDF), and to a lesser extent, is published as Linked Open Data (LOD). The main objective of the research presented in this paper is to identify problems and tools used in the process of publishing LOD with the purpose of establishing a basis for the construction of a future framework that will help public institutions to facilitate such processes. To fulfill the objective, we conducted a systematic literature review in order to assess the state-of-the-art in this matter. The contribution of this work is to identify the frequent problems that arise in the LOD publishing process. It also provides a detail of the frameworks proposed in scientific papers grouping the technical tools by phases that correspond to the LOD publication life cycle. In addition, it compiles the characteristics of the ETL (Extract-Transform-Load) tools that predominate in this review, such as Pentaho Data Integration (Kettle) and OpenRefine.
En Internet encontramos una gran cantidad de información procedente de instituciones de gobierno que se ha publicado en formato abierto. Sin embargo, sólo una parte de estos datos está disponible en formatos estándar como Resource Description Framework (RDF) y, en menor medida, se publican como Linked Open Data (LOD). El objetivo principal de la investigación presentada en esta publicación es identificar los problemas y las herramientas utilizadas en el proceso de publicación de LOD con el fin de establecer una base para la construcción de un futuro marco que ayude a las instituciones públicas a facilitar dichos procesos. Para cumplir con el objetivo, realizamos una revisión sistemática de la literatura con el fin de evaluar el estado del arte en la materia. La contribución de este trabajo es identificar los problemas frecuentes que surgen en el proceso de publicación de LOD. También proporciona un detalle de los marcos propuestos en artículos científicos agrupando las herramientas técnicas por fases que corresponden al ciclo de vida de la publicación LOD. Además, recopila las características de las herramientas ETL (Extract-Transform-Load) que predominan en esta revisión, como Pentaho Data Integration (Kettle) y OpenRefine.
Facultad de Informática
Materia
Ciencias Informáticas
Framework
ICT Tools
Linked Open Data
Open Data
Open Government
Marco de Trabajo
Herramientas TIC
Datos Abiertos Enlazados
Datos Abiertos
Gobierno Abierto
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/159861

id SEDICI_a37c3d347722eb0f661ff02efcc2ee73
oai_identifier_str oai:sedici.unlp.edu.ar:10915/159861
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Publication of linked open data: a systematic literature review for identifying problems and technical tools supporting the processPublicación de datos abiertos enlazados: revisión sistemática de la literatura para identificar problemas y herramientas técnicas de apoyo al procesoSilva-Aguilar, Jairo H.Torres, RommelEstévez, Elsa ClaraCiencias InformáticasFrameworkICT ToolsLinked Open DataOpen DataOpen GovernmentMarco de TrabajoHerramientas TICDatos Abiertos EnlazadosDatos AbiertosGobierno AbiertoOn the Internet, we find a large amount of information from government institutions that has been published in open format. However, only a part of these data is available in standard formats such as Resource Description Framework (RDF), and to a lesser extent, is published as Linked Open Data (LOD). The main objective of the research presented in this paper is to identify problems and tools used in the process of publishing LOD with the purpose of establishing a basis for the construction of a future framework that will help public institutions to facilitate such processes. To fulfill the objective, we conducted a systematic literature review in order to assess the state-of-the-art in this matter. The contribution of this work is to identify the frequent problems that arise in the LOD publishing process. It also provides a detail of the frameworks proposed in scientific papers grouping the technical tools by phases that correspond to the LOD publication life cycle. In addition, it compiles the characteristics of the ETL (Extract-Transform-Load) tools that predominate in this review, such as Pentaho Data Integration (Kettle) and OpenRefine.En Internet encontramos una gran cantidad de información procedente de instituciones de gobierno que se ha publicado en formato abierto. Sin embargo, sólo una parte de estos datos está disponible en formatos estándar como Resource Description Framework (RDF) y, en menor medida, se publican como Linked Open Data (LOD). El objetivo principal de la investigación presentada en esta publicación es identificar los problemas y las herramientas utilizadas en el proceso de publicación de LOD con el fin de establecer una base para la construcción de un futuro marco que ayude a las instituciones públicas a facilitar dichos procesos. Para cumplir con el objetivo, realizamos una revisión sistemática de la literatura con el fin de evaluar el estado del arte en la materia. La contribución de este trabajo es identificar los problemas frecuentes que surgen en el proceso de publicación de LOD. También proporciona un detalle de los marcos propuestos en artículos científicos agrupando las herramientas técnicas por fases que corresponden al ciclo de vida de la publicación LOD. Además, recopila las características de las herramientas ETL (Extract-Transform-Load) que predominan en esta revisión, como Pentaho Data Integration (Kettle) y OpenRefine.Facultad de Informática2023-10info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionArticulohttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdf179-189http://sedici.unlp.edu.ar/handle/10915/159861enginfo:eu-repo/semantics/altIdentifier/issn/1666-6038info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.23.e16info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/4.0/Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-10T12:44:37Zoai:sedici.unlp.edu.ar:10915/159861Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-10 12:44:37.291SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Publication of linked open data: a systematic literature review for identifying problems and technical tools supporting the process
Publicación de datos abiertos enlazados: revisión sistemática de la literatura para identificar problemas y herramientas técnicas de apoyo al proceso
title Publication of linked open data: a systematic literature review for identifying problems and technical tools supporting the process
spellingShingle Publication of linked open data: a systematic literature review for identifying problems and technical tools supporting the process
Silva-Aguilar, Jairo H.
Ciencias Informáticas
Framework
ICT Tools
Linked Open Data
Open Data
Open Government
Marco de Trabajo
Herramientas TIC
Datos Abiertos Enlazados
Datos Abiertos
Gobierno Abierto
title_short Publication of linked open data: a systematic literature review for identifying problems and technical tools supporting the process
title_full Publication of linked open data: a systematic literature review for identifying problems and technical tools supporting the process
title_fullStr Publication of linked open data: a systematic literature review for identifying problems and technical tools supporting the process
title_full_unstemmed Publication of linked open data: a systematic literature review for identifying problems and technical tools supporting the process
title_sort Publication of linked open data: a systematic literature review for identifying problems and technical tools supporting the process
dc.creator.none.fl_str_mv Silva-Aguilar, Jairo H.
Torres, Rommel
Estévez, Elsa Clara
author Silva-Aguilar, Jairo H.
author_facet Silva-Aguilar, Jairo H.
Torres, Rommel
Estévez, Elsa Clara
author_role author
author2 Torres, Rommel
Estévez, Elsa Clara
author2_role author
author
dc.subject.none.fl_str_mv Ciencias Informáticas
Framework
ICT Tools
Linked Open Data
Open Data
Open Government
Marco de Trabajo
Herramientas TIC
Datos Abiertos Enlazados
Datos Abiertos
Gobierno Abierto
topic Ciencias Informáticas
Framework
ICT Tools
Linked Open Data
Open Data
Open Government
Marco de Trabajo
Herramientas TIC
Datos Abiertos Enlazados
Datos Abiertos
Gobierno Abierto
dc.description.none.fl_txt_mv On the Internet, we find a large amount of information from government institutions that has been published in open format. However, only a part of these data is available in standard formats such as Resource Description Framework (RDF), and to a lesser extent, is published as Linked Open Data (LOD). The main objective of the research presented in this paper is to identify problems and tools used in the process of publishing LOD with the purpose of establishing a basis for the construction of a future framework that will help public institutions to facilitate such processes. To fulfill the objective, we conducted a systematic literature review in order to assess the state-of-the-art in this matter. The contribution of this work is to identify the frequent problems that arise in the LOD publishing process. It also provides a detail of the frameworks proposed in scientific papers grouping the technical tools by phases that correspond to the LOD publication life cycle. In addition, it compiles the characteristics of the ETL (Extract-Transform-Load) tools that predominate in this review, such as Pentaho Data Integration (Kettle) and OpenRefine.
En Internet encontramos una gran cantidad de información procedente de instituciones de gobierno que se ha publicado en formato abierto. Sin embargo, sólo una parte de estos datos está disponible en formatos estándar como Resource Description Framework (RDF) y, en menor medida, se publican como Linked Open Data (LOD). El objetivo principal de la investigación presentada en esta publicación es identificar los problemas y las herramientas utilizadas en el proceso de publicación de LOD con el fin de establecer una base para la construcción de un futuro marco que ayude a las instituciones públicas a facilitar dichos procesos. Para cumplir con el objetivo, realizamos una revisión sistemática de la literatura con el fin de evaluar el estado del arte en la materia. La contribución de este trabajo es identificar los problemas frecuentes que surgen en el proceso de publicación de LOD. También proporciona un detalle de los marcos propuestos en artículos científicos agrupando las herramientas técnicas por fases que corresponden al ciclo de vida de la publicación LOD. Además, recopila las características de las herramientas ETL (Extract-Transform-Load) que predominan en esta revisión, como Pentaho Data Integration (Kettle) y OpenRefine.
Facultad de Informática
description On the Internet, we find a large amount of information from government institutions that has been published in open format. However, only a part of these data is available in standard formats such as Resource Description Framework (RDF), and to a lesser extent, is published as Linked Open Data (LOD). The main objective of the research presented in this paper is to identify problems and tools used in the process of publishing LOD with the purpose of establishing a basis for the construction of a future framework that will help public institutions to facilitate such processes. To fulfill the objective, we conducted a systematic literature review in order to assess the state-of-the-art in this matter. The contribution of this work is to identify the frequent problems that arise in the LOD publishing process. It also provides a detail of the frameworks proposed in scientific papers grouping the technical tools by phases that correspond to the LOD publication life cycle. In addition, it compiles the characteristics of the ETL (Extract-Transform-Load) tools that predominate in this review, such as Pentaho Data Integration (Kettle) and OpenRefine.
publishDate 2023
dc.date.none.fl_str_mv 2023-10
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Articulo
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/159861
url http://sedici.unlp.edu.ar/handle/10915/159861
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/issn/1666-6038
info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.23.e16
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc/4.0/
Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/4.0/
Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.format.none.fl_str_mv application/pdf
179-189
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1842904663616126976
score 12.993085