Alineamiento e integración de información basada en ontologías para biogeografía marina y biodiversidad

Autores
Zárate, Marcos Daniel
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
tesis doctoral
Estado
versión aceptada
Colaborador/a o director/a de tesis
Fillottrani, Pablo Rubén
Descripción
El objetivo principal de esta tesis es analizar los problemas que existen actualmente con el manejo integrado de información en las ciencias de la vida en general, y particularmente analizar que sucede con la Biodiversidad y la Oceanografía. La actual crisis mundial de la biodiversidad, debida, entre otras cosas, al calentamiento global, genera un profundo impacto en la distribución geográfica de las especies y las comunidades ecológicas. Esto provoca un creciente interés entre los científicos para coordinar el uso compartido de conjuntos de datos que ayuden a entender esta problemática global. En este contexto, el paradigma de los Datos Vinculados (Linked Data en inglés) ha emergido como un conjunto de buenas prácticas para conectar, compartir y exponer datos y conocimiento, una parte central de este paradigma son las ontologías, que permiten la definición de vocabularios compartidos y modelos conceptuales que ayuden a integrar esta información. Estas consideraciones proporcionan una fuerte motivación para formular un sistema que tenga en cuenta las características geoespaciales que pueden brindar respuestas a preguntas como las siguientes: (i) >Cómo podemos definir las regiones espaciales para nuestros estudios? (ii) >Cómo se distribuyen las especies en una determinada región? (iii) Dada una georeferencia particular, >a qué re- gión geográfica pertenece? (iv) >Cómo relacionar las ocurrencias de especies con variables ambientales dentro de una región especifica?. En esta tesis se presenta el desarrollo de un sistema basado en ontologías denominado BiGe-Onto [ZBF+19] para administrar información de los dominios de Biodiversidad y Biogeografía marina. Este sistema está compuesto por (i) Arquitectura; (ii) Modelo conceptual; (iii) Versión operacional OWL 2; y (iv) Conjunto de datos vinculados para su explotación a través de un punto final SPARQL. La evaluación de BiGe-Onto se realizo desde dos enfoques, el primero de ellos consiste en validar la ontologíaa utilizando datos reales extraídos de repositorios de Biodiversidad y Biogeografía marina para luego validar el modelo conceptual propuesto utilizando preguntas de competencia. El segundo enfoque tiene que ver con la validación mediante casos de estudio definidos en conjunto con investigadores del Centro Científico Tecnológico (CENPAT-CONICET) que trabajan realizando análisis de distribución de especies. Finalmente la documentación de BiGe-Onto esta disponible en línea en http://crowd.fi.uncoma.edu.ar/cenpat-gilia/bigeonto/ y el conjunto de datos enlazados es accesible públicamente a través de DOI 10.5281/zenodo.3235548.
The main goal of this thesis is to analyze the existing issues currently related to the integrated management of information in life sciences in general, and particularly to analyze what happens with Biodiversity and Oceanography. The current global biodiversity crisis, due, among other things, to global warming, has a great impact on the geographical distribution of species and ecological communities. This motivates a growing interest among scientists to coordinate the sharing of datasets that help to understand this global problem. In this context, Linked Data paradigm has emerged as a set of good practices to connect, share and expose data and knowledge. A central part of this paradigm are the ontologies, which allow the de nition of shared vocabularies and conceptual models that help integrate this information. These considerations provide strong motivation to formulate an ontologybased system considering geospatial features that may provide answers to questions such as: (i) How can we define spatial regions for our studies? (ii) How are the species distributed in a certain region? (iii) Given a particular georeference, which geographic region does it belong to? (iv) How to relate occurrences of species with environmental variables within a specific region?. This thesis presents the development of an ontology-based system called BiGe-Onto [ZBF+19] to manage information from Biodiversity and Marine Biogeography domains. This system is composed of (i) Architecture; (ii) Conceptual model; (iii) OWL 2 operational version; and (iv) Linked dataset to exploit through a SPARQL endpoint. BiGe-Onto evaluation was developed from two approaches, the first one is to validate the ontology using real data extracted from Biodiversity and Marine Biogeography repositories and then validate the proposed conceptual model using competence questions. The second approach is based on validation through case studies defined in conjunction with researchers from the Technological Scientific Center (CENPAT-CONICET) who work on species distribution analysis. Finally, BiGe-Onto documentation is available online at http: //crowd.fi.uncoma.edu.ar/cenpat-gilia/bigeonto/ and the linked dataset is publicly accessible through DOI 10.5281/zenodo.3235548.
Fil: Zárate, Marcos Daniel. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; Argentina
Materia
Inteligencia artificial
Ciencias de la computación
Ontologías (Recuperación de la información)
Biogeografía
Biodiversidad
Biogeografía marina
Semantic web
Linked data
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-nd/4.0/
Repositorio
Repositorio Institucional Digital de la Universidad Nacional del Sur (RID-UNS)
Institución
Universidad Nacional del Sur
OAI Identificador
oai:repositorio.bc.uns.edu.ar:123456789/4711

id RID-UNS_b4a98deab7acae22a2b4085815c48be5
oai_identifier_str oai:repositorio.bc.uns.edu.ar:123456789/4711
network_acronym_str RID-UNS
repository_id_str
network_name_str Repositorio Institucional Digital de la Universidad Nacional del Sur (RID-UNS)
spelling Alineamiento e integración de información basada en ontologías para biogeografía marina y biodiversidadZárate, Marcos DanielInteligencia artificialCiencias de la computaciónOntologías (Recuperación de la información)BiogeografíaBiodiversidadBiogeografía marinaSemantic webLinked dataEl objetivo principal de esta tesis es analizar los problemas que existen actualmente con el manejo integrado de información en las ciencias de la vida en general, y particularmente analizar que sucede con la Biodiversidad y la Oceanografía. La actual crisis mundial de la biodiversidad, debida, entre otras cosas, al calentamiento global, genera un profundo impacto en la distribución geográfica de las especies y las comunidades ecológicas. Esto provoca un creciente interés entre los científicos para coordinar el uso compartido de conjuntos de datos que ayuden a entender esta problemática global. En este contexto, el paradigma de los Datos Vinculados (Linked Data en inglés) ha emergido como un conjunto de buenas prácticas para conectar, compartir y exponer datos y conocimiento, una parte central de este paradigma son las ontologías, que permiten la definición de vocabularios compartidos y modelos conceptuales que ayuden a integrar esta información. Estas consideraciones proporcionan una fuerte motivación para formular un sistema que tenga en cuenta las características geoespaciales que pueden brindar respuestas a preguntas como las siguientes: (i) >Cómo podemos definir las regiones espaciales para nuestros estudios? (ii) >Cómo se distribuyen las especies en una determinada región? (iii) Dada una georeferencia particular, >a qué re- gión geográfica pertenece? (iv) >Cómo relacionar las ocurrencias de especies con variables ambientales dentro de una región especifica?. En esta tesis se presenta el desarrollo de un sistema basado en ontologías denominado BiGe-Onto [ZBF+19] para administrar información de los dominios de Biodiversidad y Biogeografía marina. Este sistema está compuesto por (i) Arquitectura; (ii) Modelo conceptual; (iii) Versión operacional OWL 2; y (iv) Conjunto de datos vinculados para su explotación a través de un punto final SPARQL. La evaluación de BiGe-Onto se realizo desde dos enfoques, el primero de ellos consiste en validar la ontologíaa utilizando datos reales extraídos de repositorios de Biodiversidad y Biogeografía marina para luego validar el modelo conceptual propuesto utilizando preguntas de competencia. El segundo enfoque tiene que ver con la validación mediante casos de estudio definidos en conjunto con investigadores del Centro Científico Tecnológico (CENPAT-CONICET) que trabajan realizando análisis de distribución de especies. Finalmente la documentación de BiGe-Onto esta disponible en línea en http://crowd.fi.uncoma.edu.ar/cenpat-gilia/bigeonto/ y el conjunto de datos enlazados es accesible públicamente a través de DOI 10.5281/zenodo.3235548.The main goal of this thesis is to analyze the existing issues currently related to the integrated management of information in life sciences in general, and particularly to analyze what happens with Biodiversity and Oceanography. The current global biodiversity crisis, due, among other things, to global warming, has a great impact on the geographical distribution of species and ecological communities. This motivates a growing interest among scientists to coordinate the sharing of datasets that help to understand this global problem. In this context, Linked Data paradigm has emerged as a set of good practices to connect, share and expose data and knowledge. A central part of this paradigm are the ontologies, which allow the de nition of shared vocabularies and conceptual models that help integrate this information. These considerations provide strong motivation to formulate an ontologybased system considering geospatial features that may provide answers to questions such as: (i) How can we define spatial regions for our studies? (ii) How are the species distributed in a certain region? (iii) Given a particular georeference, which geographic region does it belong to? (iv) How to relate occurrences of species with environmental variables within a specific region?. This thesis presents the development of an ontology-based system called BiGe-Onto [ZBF+19] to manage information from Biodiversity and Marine Biogeography domains. This system is composed of (i) Architecture; (ii) Conceptual model; (iii) OWL 2 operational version; and (iv) Linked dataset to exploit through a SPARQL endpoint. BiGe-Onto evaluation was developed from two approaches, the first one is to validate the ontology using real data extracted from Biodiversity and Marine Biogeography repositories and then validate the proposed conceptual model using competence questions. The second approach is based on validation through case studies defined in conjunction with researchers from the Technological Scientific Center (CENPAT-CONICET) who work on species distribution analysis. Finally, BiGe-Onto documentation is available online at http: //crowd.fi.uncoma.edu.ar/cenpat-gilia/bigeonto/ and the linked dataset is publicly accessible through DOI 10.5281/zenodo.3235548.Fil: Zárate, Marcos Daniel. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; ArgentinaFillottrani, Pablo Rubén2019-10-24info:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_db06info:ar-repo/semantics/tesisDoctoralapplication/pdfhttp://repositoriodigital.uns.edu.ar/handle/123456789/4711spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/reponame:Repositorio Institucional Digital de la Universidad Nacional del Sur (RID-UNS)instname:Universidad Nacional del Sur2025-09-29T13:42:06Zoai:repositorio.bc.uns.edu.ar:123456789/4711instacron:UNSInstitucionalhttp://repositoriodigital.uns.edu.ar/Universidad públicaNo correspondehttp://repositoriodigital.uns.edu.ar/oaimesnaola@uns.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:2025-09-29 13:42:07.174Repositorio Institucional Digital de la Universidad Nacional del Sur (RID-UNS) - Universidad Nacional del Surfalse
dc.title.none.fl_str_mv Alineamiento e integración de información basada en ontologías para biogeografía marina y biodiversidad
title Alineamiento e integración de información basada en ontologías para biogeografía marina y biodiversidad
spellingShingle Alineamiento e integración de información basada en ontologías para biogeografía marina y biodiversidad
Zárate, Marcos Daniel
Inteligencia artificial
Ciencias de la computación
Ontologías (Recuperación de la información)
Biogeografía
Biodiversidad
Biogeografía marina
Semantic web
Linked data
title_short Alineamiento e integración de información basada en ontologías para biogeografía marina y biodiversidad
title_full Alineamiento e integración de información basada en ontologías para biogeografía marina y biodiversidad
title_fullStr Alineamiento e integración de información basada en ontologías para biogeografía marina y biodiversidad
title_full_unstemmed Alineamiento e integración de información basada en ontologías para biogeografía marina y biodiversidad
title_sort Alineamiento e integración de información basada en ontologías para biogeografía marina y biodiversidad
dc.creator.none.fl_str_mv Zárate, Marcos Daniel
author Zárate, Marcos Daniel
author_facet Zárate, Marcos Daniel
author_role author
dc.contributor.none.fl_str_mv Fillottrani, Pablo Rubén
dc.subject.none.fl_str_mv Inteligencia artificial
Ciencias de la computación
Ontologías (Recuperación de la información)
Biogeografía
Biodiversidad
Biogeografía marina
Semantic web
Linked data
topic Inteligencia artificial
Ciencias de la computación
Ontologías (Recuperación de la información)
Biogeografía
Biodiversidad
Biogeografía marina
Semantic web
Linked data
dc.description.none.fl_txt_mv El objetivo principal de esta tesis es analizar los problemas que existen actualmente con el manejo integrado de información en las ciencias de la vida en general, y particularmente analizar que sucede con la Biodiversidad y la Oceanografía. La actual crisis mundial de la biodiversidad, debida, entre otras cosas, al calentamiento global, genera un profundo impacto en la distribución geográfica de las especies y las comunidades ecológicas. Esto provoca un creciente interés entre los científicos para coordinar el uso compartido de conjuntos de datos que ayuden a entender esta problemática global. En este contexto, el paradigma de los Datos Vinculados (Linked Data en inglés) ha emergido como un conjunto de buenas prácticas para conectar, compartir y exponer datos y conocimiento, una parte central de este paradigma son las ontologías, que permiten la definición de vocabularios compartidos y modelos conceptuales que ayuden a integrar esta información. Estas consideraciones proporcionan una fuerte motivación para formular un sistema que tenga en cuenta las características geoespaciales que pueden brindar respuestas a preguntas como las siguientes: (i) >Cómo podemos definir las regiones espaciales para nuestros estudios? (ii) >Cómo se distribuyen las especies en una determinada región? (iii) Dada una georeferencia particular, >a qué re- gión geográfica pertenece? (iv) >Cómo relacionar las ocurrencias de especies con variables ambientales dentro de una región especifica?. En esta tesis se presenta el desarrollo de un sistema basado en ontologías denominado BiGe-Onto [ZBF+19] para administrar información de los dominios de Biodiversidad y Biogeografía marina. Este sistema está compuesto por (i) Arquitectura; (ii) Modelo conceptual; (iii) Versión operacional OWL 2; y (iv) Conjunto de datos vinculados para su explotación a través de un punto final SPARQL. La evaluación de BiGe-Onto se realizo desde dos enfoques, el primero de ellos consiste en validar la ontologíaa utilizando datos reales extraídos de repositorios de Biodiversidad y Biogeografía marina para luego validar el modelo conceptual propuesto utilizando preguntas de competencia. El segundo enfoque tiene que ver con la validación mediante casos de estudio definidos en conjunto con investigadores del Centro Científico Tecnológico (CENPAT-CONICET) que trabajan realizando análisis de distribución de especies. Finalmente la documentación de BiGe-Onto esta disponible en línea en http://crowd.fi.uncoma.edu.ar/cenpat-gilia/bigeonto/ y el conjunto de datos enlazados es accesible públicamente a través de DOI 10.5281/zenodo.3235548.
The main goal of this thesis is to analyze the existing issues currently related to the integrated management of information in life sciences in general, and particularly to analyze what happens with Biodiversity and Oceanography. The current global biodiversity crisis, due, among other things, to global warming, has a great impact on the geographical distribution of species and ecological communities. This motivates a growing interest among scientists to coordinate the sharing of datasets that help to understand this global problem. In this context, Linked Data paradigm has emerged as a set of good practices to connect, share and expose data and knowledge. A central part of this paradigm are the ontologies, which allow the de nition of shared vocabularies and conceptual models that help integrate this information. These considerations provide strong motivation to formulate an ontologybased system considering geospatial features that may provide answers to questions such as: (i) How can we define spatial regions for our studies? (ii) How are the species distributed in a certain region? (iii) Given a particular georeference, which geographic region does it belong to? (iv) How to relate occurrences of species with environmental variables within a specific region?. This thesis presents the development of an ontology-based system called BiGe-Onto [ZBF+19] to manage information from Biodiversity and Marine Biogeography domains. This system is composed of (i) Architecture; (ii) Conceptual model; (iii) OWL 2 operational version; and (iv) Linked dataset to exploit through a SPARQL endpoint. BiGe-Onto evaluation was developed from two approaches, the first one is to validate the ontology using real data extracted from Biodiversity and Marine Biogeography repositories and then validate the proposed conceptual model using competence questions. The second approach is based on validation through case studies defined in conjunction with researchers from the Technological Scientific Center (CENPAT-CONICET) who work on species distribution analysis. Finally, BiGe-Onto documentation is available online at http: //crowd.fi.uncoma.edu.ar/cenpat-gilia/bigeonto/ and the linked dataset is publicly accessible through DOI 10.5281/zenodo.3235548.
Fil: Zárate, Marcos Daniel. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; Argentina
description El objetivo principal de esta tesis es analizar los problemas que existen actualmente con el manejo integrado de información en las ciencias de la vida en general, y particularmente analizar que sucede con la Biodiversidad y la Oceanografía. La actual crisis mundial de la biodiversidad, debida, entre otras cosas, al calentamiento global, genera un profundo impacto en la distribución geográfica de las especies y las comunidades ecológicas. Esto provoca un creciente interés entre los científicos para coordinar el uso compartido de conjuntos de datos que ayuden a entender esta problemática global. En este contexto, el paradigma de los Datos Vinculados (Linked Data en inglés) ha emergido como un conjunto de buenas prácticas para conectar, compartir y exponer datos y conocimiento, una parte central de este paradigma son las ontologías, que permiten la definición de vocabularios compartidos y modelos conceptuales que ayuden a integrar esta información. Estas consideraciones proporcionan una fuerte motivación para formular un sistema que tenga en cuenta las características geoespaciales que pueden brindar respuestas a preguntas como las siguientes: (i) >Cómo podemos definir las regiones espaciales para nuestros estudios? (ii) >Cómo se distribuyen las especies en una determinada región? (iii) Dada una georeferencia particular, >a qué re- gión geográfica pertenece? (iv) >Cómo relacionar las ocurrencias de especies con variables ambientales dentro de una región especifica?. En esta tesis se presenta el desarrollo de un sistema basado en ontologías denominado BiGe-Onto [ZBF+19] para administrar información de los dominios de Biodiversidad y Biogeografía marina. Este sistema está compuesto por (i) Arquitectura; (ii) Modelo conceptual; (iii) Versión operacional OWL 2; y (iv) Conjunto de datos vinculados para su explotación a través de un punto final SPARQL. La evaluación de BiGe-Onto se realizo desde dos enfoques, el primero de ellos consiste en validar la ontologíaa utilizando datos reales extraídos de repositorios de Biodiversidad y Biogeografía marina para luego validar el modelo conceptual propuesto utilizando preguntas de competencia. El segundo enfoque tiene que ver con la validación mediante casos de estudio definidos en conjunto con investigadores del Centro Científico Tecnológico (CENPAT-CONICET) que trabajan realizando análisis de distribución de especies. Finalmente la documentación de BiGe-Onto esta disponible en línea en http://crowd.fi.uncoma.edu.ar/cenpat-gilia/bigeonto/ y el conjunto de datos enlazados es accesible públicamente a través de DOI 10.5281/zenodo.3235548.
publishDate 2019
dc.date.none.fl_str_mv 2019-10-24
dc.type.none.fl_str_mv info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/acceptedVersion
http://purl.org/coar/resource_type/c_db06
info:ar-repo/semantics/tesisDoctoral
format doctoralThesis
status_str acceptedVersion
dc.identifier.none.fl_str_mv http://repositoriodigital.uns.edu.ar/handle/123456789/4711
url http://repositoriodigital.uns.edu.ar/handle/123456789/4711
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Institucional Digital de la Universidad Nacional del Sur (RID-UNS)
instname:Universidad Nacional del Sur
reponame_str Repositorio Institucional Digital de la Universidad Nacional del Sur (RID-UNS)
collection Repositorio Institucional Digital de la Universidad Nacional del Sur (RID-UNS)
instname_str Universidad Nacional del Sur
repository.name.fl_str_mv Repositorio Institucional Digital de la Universidad Nacional del Sur (RID-UNS) - Universidad Nacional del Sur
repository.mail.fl_str_mv mesnaola@uns.edu.ar
_version_ 1844619083396415488
score 12.559606