Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process

Autores
Silva Aguilar, Jairo H.; Torres T., Rommel; Estevez, Elsa Clara
Año de publicación
2023
Idioma
inglés
Tipo de recurso
artículo
Estado
versión publicada
Descripción
On the Internet, we find a large amount of information from government institutions that has been published in open format. However, only a part of these data is available in standard formats such as Resource Description Framework (RDF), and to a lesser extent, is published as Linked Open Data (LOD). The main objective of the research presented in this paper is to identify problems and tools used in the process of publishing LOD with the purpose of establishing a basis for the construction of a future framework that will help public institutions to facilitate such processes. To fulfill the objective, we conducted a systematic literature review in order to assess the state-of-the-art in this matter. The contribution of this work is to identify the frequent problems that arise in the LOD publishing process. It also provides a detail of the frameworks proposed in scientific papers grouping the technical tools by phases that correspond to the LOD publication life cycle. In addition, it compiles the characteristics of the ETL (Extract-Transform-Load) tools that predominate in this review, such as Pentaho Data Integration (Kettle) and OpenRefine.
En Internet encontramos una gran cantidad de información procedente de instituciones de gobierno que se ha publicado en formato abierto. Sin embargo, sólo una parte de estos datos está disponible en formatos estándar como Resource Description Framework (RDF) y, en menor medida, se publican como Linked Open Data (LOD). El objetivo principal de la investigación presentada en esta publicación es identificar los problemas y las herramientas utilizadas en el proceso de publicación de LOD con el fin de establecer una base para la construcción de un futuro marco que ayude a las instituciones públicas a facilitar dichos procesos. Para cumplir con el objetivo, realizamos una revisión sistemática de la literatura con el fin de evaluar el estado del arte en la materia. La contribución de este trabajo es identificar los problemas frecuentes que surgen en el proceso de publicación de LOD. También proporciona un detalle de los marcos propuestos en artículos científicos agrupando las herramientas técnicas por fases que corresponden al ciclo de vida de la publicación LOD. Además, recopila las características de las herramientas ETL (Extract-Transform-Load) que predominan en esta revisión, como Pentaho Data Integration (Kettle) y OpenRefine.
Fil: Silva Aguilar, Jairo H.. Universidad Nacional de La Plata. Facultad de Informática; Argentina
Fil: Torres T., Rommel. Universidad Tecnica Particular de Loja; Ecuador
Fil: Estevez, Elsa Clara. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentina. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; Argentina
Materia
Linked Open Data
Open Government
e-Government
Ecuador
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/250558

id CONICETDig_458993a31d8ed891fa3855a86be8dd00
oai_identifier_str oai:ri.conicet.gov.ar:11336/250558
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the ProcessSilva Aguilar, Jairo H.Torres T., RommelEstevez, Elsa ClaraLinked Open DataOpen Governmente-GovernmentEcuadorhttps://purl.org/becyt/ford/1.2https://purl.org/becyt/ford/1On the Internet, we find a large amount of information from government institutions that has been published in open format. However, only a part of these data is available in standard formats such as Resource Description Framework (RDF), and to a lesser extent, is published as Linked Open Data (LOD). The main objective of the research presented in this paper is to identify problems and tools used in the process of publishing LOD with the purpose of establishing a basis for the construction of a future framework that will help public institutions to facilitate such processes. To fulfill the objective, we conducted a systematic literature review in order to assess the state-of-the-art in this matter. The contribution of this work is to identify the frequent problems that arise in the LOD publishing process. It also provides a detail of the frameworks proposed in scientific papers grouping the technical tools by phases that correspond to the LOD publication life cycle. In addition, it compiles the characteristics of the ETL (Extract-Transform-Load) tools that predominate in this review, such as Pentaho Data Integration (Kettle) and OpenRefine.En Internet encontramos una gran cantidad de información procedente de instituciones de gobierno que se ha publicado en formato abierto. Sin embargo, sólo una parte de estos datos está disponible en formatos estándar como Resource Description Framework (RDF) y, en menor medida, se publican como Linked Open Data (LOD). El objetivo principal de la investigación presentada en esta publicación es identificar los problemas y las herramientas utilizadas en el proceso de publicación de LOD con el fin de establecer una base para la construcción de un futuro marco que ayude a las instituciones públicas a facilitar dichos procesos. Para cumplir con el objetivo, realizamos una revisión sistemática de la literatura con el fin de evaluar el estado del arte en la materia. La contribución de este trabajo es identificar los problemas frecuentes que surgen en el proceso de publicación de LOD. También proporciona un detalle de los marcos propuestos en artículos científicos agrupando las herramientas técnicas por fases que corresponden al ciclo de vida de la publicación LOD. Además, recopila las características de las herramientas ETL (Extract-Transform-Load) que predominan en esta revisión, como Pentaho Data Integration (Kettle) y OpenRefine.Fil: Silva Aguilar, Jairo H.. Universidad Nacional de La Plata. Facultad de Informática; ArgentinaFil: Torres T., Rommel. Universidad Tecnica Particular de Loja; EcuadorFil: Estevez, Elsa Clara. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentina. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; ArgentinaUniversidad Nacional de La Plata2023-10info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/250558Silva Aguilar, Jairo H.; Torres T., Rommel; Estevez, Elsa Clara; Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process; Universidad Nacional de La Plata; Journal of Computer Science and Technology; 23; 2; 10-2023; 1-111666-60461666-6038CONICET DigitalCONICETenginfo:eu-repo/semantics/altIdentifier/url/https://journal.info.unlp.edu.ar/JCST/article/view/2730info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.23.e16info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-11-26T08:49:42Zoai:ri.conicet.gov.ar:11336/250558instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-11-26 08:49:43.008CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process
title Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process
spellingShingle Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process
Silva Aguilar, Jairo H.
Linked Open Data
Open Government
e-Government
Ecuador
title_short Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process
title_full Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process
title_fullStr Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process
title_full_unstemmed Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process
title_sort Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process
dc.creator.none.fl_str_mv Silva Aguilar, Jairo H.
Torres T., Rommel
Estevez, Elsa Clara
author Silva Aguilar, Jairo H.
author_facet Silva Aguilar, Jairo H.
Torres T., Rommel
Estevez, Elsa Clara
author_role author
author2 Torres T., Rommel
Estevez, Elsa Clara
author2_role author
author
dc.subject.none.fl_str_mv Linked Open Data
Open Government
e-Government
Ecuador
topic Linked Open Data
Open Government
e-Government
Ecuador
purl_subject.fl_str_mv https://purl.org/becyt/ford/1.2
https://purl.org/becyt/ford/1
dc.description.none.fl_txt_mv On the Internet, we find a large amount of information from government institutions that has been published in open format. However, only a part of these data is available in standard formats such as Resource Description Framework (RDF), and to a lesser extent, is published as Linked Open Data (LOD). The main objective of the research presented in this paper is to identify problems and tools used in the process of publishing LOD with the purpose of establishing a basis for the construction of a future framework that will help public institutions to facilitate such processes. To fulfill the objective, we conducted a systematic literature review in order to assess the state-of-the-art in this matter. The contribution of this work is to identify the frequent problems that arise in the LOD publishing process. It also provides a detail of the frameworks proposed in scientific papers grouping the technical tools by phases that correspond to the LOD publication life cycle. In addition, it compiles the characteristics of the ETL (Extract-Transform-Load) tools that predominate in this review, such as Pentaho Data Integration (Kettle) and OpenRefine.
En Internet encontramos una gran cantidad de información procedente de instituciones de gobierno que se ha publicado en formato abierto. Sin embargo, sólo una parte de estos datos está disponible en formatos estándar como Resource Description Framework (RDF) y, en menor medida, se publican como Linked Open Data (LOD). El objetivo principal de la investigación presentada en esta publicación es identificar los problemas y las herramientas utilizadas en el proceso de publicación de LOD con el fin de establecer una base para la construcción de un futuro marco que ayude a las instituciones públicas a facilitar dichos procesos. Para cumplir con el objetivo, realizamos una revisión sistemática de la literatura con el fin de evaluar el estado del arte en la materia. La contribución de este trabajo es identificar los problemas frecuentes que surgen en el proceso de publicación de LOD. También proporciona un detalle de los marcos propuestos en artículos científicos agrupando las herramientas técnicas por fases que corresponden al ciclo de vida de la publicación LOD. Además, recopila las características de las herramientas ETL (Extract-Transform-Load) que predominan en esta revisión, como Pentaho Data Integration (Kettle) y OpenRefine.
Fil: Silva Aguilar, Jairo H.. Universidad Nacional de La Plata. Facultad de Informática; Argentina
Fil: Torres T., Rommel. Universidad Tecnica Particular de Loja; Ecuador
Fil: Estevez, Elsa Clara. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentina. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; Argentina
description On the Internet, we find a large amount of information from government institutions that has been published in open format. However, only a part of these data is available in standard formats such as Resource Description Framework (RDF), and to a lesser extent, is published as Linked Open Data (LOD). The main objective of the research presented in this paper is to identify problems and tools used in the process of publishing LOD with the purpose of establishing a basis for the construction of a future framework that will help public institutions to facilitate such processes. To fulfill the objective, we conducted a systematic literature review in order to assess the state-of-the-art in this matter. The contribution of this work is to identify the frequent problems that arise in the LOD publishing process. It also provides a detail of the frameworks proposed in scientific papers grouping the technical tools by phases that correspond to the LOD publication life cycle. In addition, it compiles the characteristics of the ETL (Extract-Transform-Load) tools that predominate in this review, such as Pentaho Data Integration (Kettle) and OpenRefine.
publishDate 2023
dc.date.none.fl_str_mv 2023-10
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/250558
Silva Aguilar, Jairo H.; Torres T., Rommel; Estevez, Elsa Clara; Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process; Universidad Nacional de La Plata; Journal of Computer Science and Technology; 23; 2; 10-2023; 1-11
1666-6046
1666-6038
CONICET Digital
CONICET
url http://hdl.handle.net/11336/250558
identifier_str_mv Silva Aguilar, Jairo H.; Torres T., Rommel; Estevez, Elsa Clara; Publication of Linked Open Data – A Systematic Literature Review for Identifying Problems and Technical Tools Supporting the Process; Universidad Nacional de La Plata; Journal of Computer Science and Technology; 23; 2; 10-2023; 1-11
1666-6046
1666-6038
CONICET Digital
CONICET
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://journal.info.unlp.edu.ar/JCST/article/view/2730
info:eu-repo/semantics/altIdentifier/doi/10.24215/16666038.23.e16
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional de La Plata
publisher.none.fl_str_mv Universidad Nacional de La Plata
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1849872748113821696
score 13.011256