A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à Saúde

Autores
Fernandes de Queiroz, Claudete; Neves Maranhão, Ana Maria; Danielli de Araujo, Luciana; Gonçalves do Nascimento, Andrea F.; Belchior Rodrigues, Raphael; de Almeida Freyre, Éder; da Costa Lima, Jefferson; de Moraes Pedroso, Marcel
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Apresenta o projeto desenvolvido entre o Laboratório de Ciência de Dados aplicada À Saúde, do Instituto de Informação Científica e Tecnológica em Saúde (ICICT) e o Arca – Repositório Institucional da Fiocruz. O projeto teve como objetivos: melhorar a curadoria dos dados inseridos no repositório institucional, visando a qualidade das informações, e a recuperação e a visualização de dados, oferecendo uma plataforma que permite a extração de informações com potencial de uso pela gestão e pela pesquisa. No processo de curadoria foi possível identificar inconsistências no preenchimento dos metadados, utilizando classificação automática e machine learning, e consequente correção, de forma a garantir a qualidade das informações e dos dados extraídos. Outro fator importante para a realização do projeto foi a utilização do software Kibana e do Elasticsearch para a visualização de dados de forma dinâmica, oferecendo uma plataforma de exploração interativa para extração e mineração de dados. O software permitiu a utilização de filtros e combinações de dados contidos no Arca, como produção por tipo de material, Unidades da Fiocruz, assunto, autor, ano e direito autoral de forma que possam ser manipulados pelas diferentes unidades/comunidades representadas no Repositório Institucional.
Fundação Oswaldo Cruz
Materia
Bibliotecología
Ciencias Informáticas
Arca - Repositório Institucional da Fiocruz
Ciência de Dados
Visualização de Dados
Curadoria Digital
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/86900

id SEDICI_378135f935b9fc9bf7e6fd572dca389f
oai_identifier_str oai:sedici.unlp.edu.ar:10915/86900
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à SaúdeFernandes de Queiroz, ClaudeteNeves Maranhão, Ana MariaDanielli de Araujo, LucianaGonçalves do Nascimento, Andrea F.Belchior Rodrigues, Raphaelde Almeida Freyre, Éderda Costa Lima, Jeffersonde Moraes Pedroso, MarcelBibliotecologíaCiencias InformáticasArca - Repositório Institucional da FiocruzCiência de DadosVisualização de DadosCuradoria DigitalApresenta o projeto desenvolvido entre o Laboratório de Ciência de Dados aplicada À Saúde, do Instituto de Informação Científica e Tecnológica em Saúde (ICICT) e o Arca – Repositório Institucional da Fiocruz. O projeto teve como objetivos: melhorar a curadoria dos dados inseridos no repositório institucional, visando a qualidade das informações, e a recuperação e a visualização de dados, oferecendo uma plataforma que permite a extração de informações com potencial de uso pela gestão e pela pesquisa. No processo de curadoria foi possível identificar inconsistências no preenchimento dos metadados, utilizando classificação automática e machine learning, e consequente correção, de forma a garantir a qualidade das informações e dos dados extraídos. Outro fator importante para a realização do projeto foi a utilização do software Kibana e do Elasticsearch para a visualização de dados de forma dinâmica, oferecendo uma plataforma de exploração interativa para extração e mineração de dados. O software permitiu a utilização de filtros e combinações de dados contidos no Arca, como produção por tipo de material, Unidades da Fiocruz, assunto, autor, ano e direito autoral de forma que possam ser manipulados pelas diferentes unidades/comunidades representadas no Repositório Institucional.Fundação Oswaldo Cruz2019-07info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/86900spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-03T10:49:36Zoai:sedici.unlp.edu.ar:10915/86900Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-03 10:49:37.136SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à Saúde
title A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à Saúde
spellingShingle A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à Saúde
Fernandes de Queiroz, Claudete
Bibliotecología
Ciencias Informáticas
Arca - Repositório Institucional da Fiocruz
Ciência de Dados
Visualização de Dados
Curadoria Digital
title_short A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à Saúde
title_full A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à Saúde
title_fullStr A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à Saúde
title_full_unstemmed A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à Saúde
title_sort A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à Saúde
dc.creator.none.fl_str_mv Fernandes de Queiroz, Claudete
Neves Maranhão, Ana Maria
Danielli de Araujo, Luciana
Gonçalves do Nascimento, Andrea F.
Belchior Rodrigues, Raphael
de Almeida Freyre, Éder
da Costa Lima, Jefferson
de Moraes Pedroso, Marcel
author Fernandes de Queiroz, Claudete
author_facet Fernandes de Queiroz, Claudete
Neves Maranhão, Ana Maria
Danielli de Araujo, Luciana
Gonçalves do Nascimento, Andrea F.
Belchior Rodrigues, Raphael
de Almeida Freyre, Éder
da Costa Lima, Jefferson
de Moraes Pedroso, Marcel
author_role author
author2 Neves Maranhão, Ana Maria
Danielli de Araujo, Luciana
Gonçalves do Nascimento, Andrea F.
Belchior Rodrigues, Raphael
de Almeida Freyre, Éder
da Costa Lima, Jefferson
de Moraes Pedroso, Marcel
author2_role author
author
author
author
author
author
author
dc.subject.none.fl_str_mv Bibliotecología
Ciencias Informáticas
Arca - Repositório Institucional da Fiocruz
Ciência de Dados
Visualização de Dados
Curadoria Digital
topic Bibliotecología
Ciencias Informáticas
Arca - Repositório Institucional da Fiocruz
Ciência de Dados
Visualização de Dados
Curadoria Digital
dc.description.none.fl_txt_mv Apresenta o projeto desenvolvido entre o Laboratório de Ciência de Dados aplicada À Saúde, do Instituto de Informação Científica e Tecnológica em Saúde (ICICT) e o Arca – Repositório Institucional da Fiocruz. O projeto teve como objetivos: melhorar a curadoria dos dados inseridos no repositório institucional, visando a qualidade das informações, e a recuperação e a visualização de dados, oferecendo uma plataforma que permite a extração de informações com potencial de uso pela gestão e pela pesquisa. No processo de curadoria foi possível identificar inconsistências no preenchimento dos metadados, utilizando classificação automática e machine learning, e consequente correção, de forma a garantir a qualidade das informações e dos dados extraídos. Outro fator importante para a realização do projeto foi a utilização do software Kibana e do Elasticsearch para a visualização de dados de forma dinâmica, oferecendo uma plataforma de exploração interativa para extração e mineração de dados. O software permitiu a utilização de filtros e combinações de dados contidos no Arca, como produção por tipo de material, Unidades da Fiocruz, assunto, autor, ano e direito autoral de forma que possam ser manipulados pelas diferentes unidades/comunidades representadas no Repositório Institucional.
Fundação Oswaldo Cruz
description Apresenta o projeto desenvolvido entre o Laboratório de Ciência de Dados aplicada À Saúde, do Instituto de Informação Científica e Tecnológica em Saúde (ICICT) e o Arca – Repositório Institucional da Fiocruz. O projeto teve como objetivos: melhorar a curadoria dos dados inseridos no repositório institucional, visando a qualidade das informações, e a recuperação e a visualização de dados, oferecendo uma plataforma que permite a extração de informações com potencial de uso pela gestão e pela pesquisa. No processo de curadoria foi possível identificar inconsistências no preenchimento dos metadados, utilizando classificação automática e machine learning, e consequente correção, de forma a garantir a qualidade das informações e dos dados extraídos. Outro fator importante para a realização do projeto foi a utilização do software Kibana e do Elasticsearch para a visualização de dados de forma dinâmica, oferecendo uma plataforma de exploração interativa para extração e mineração de dados. O software permitiu a utilização de filtros e combinações de dados contidos no Arca, como produção por tipo de material, Unidades da Fiocruz, assunto, autor, ano e direito autoral de forma que possam ser manipulados pelas diferentes unidades/comunidades representadas no Repositório Institucional.
publishDate 2019
dc.date.none.fl_str_mv 2019-07
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/86900
url http://sedici.unlp.edu.ar/handle/10915/86900
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1842260373316567040
score 13.13397