Minería de texto en publicaciones científicas con autores argentinos

Autores
Dorr, Ricardo Alfredo; Casal, Juan José; Toriano, Roxana Mabel
Año de publicación
2021
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
En el presente trabajo utilizamos la minería de texto como herramienta de tratamiento de una gran base de datos científica, con el objetivo de obtener nueva información de todas las publicaciones firmadas por autores argentinos e indexadas hasta 2019 en el área de las ciencias de la vida. Se analizaron más de 75 000 artículos, publicados en alrededor de 5000 medios, firmados por cerca de 186 000 autores con lugar de trabajo en la Argentina o en colaboraciones con laboratorios argentinos. Mediante herramientas automatizadas, que fueron desarrolladas ad hoc, se analizó el texto de alrededor de 70 800 resúmenes y se buscaron, mediante detección digital no supervisada, los principales temas abordados, su relación con problemáticas de salud en la Argentina y su tratamiento. Se presentan, además, resultados del número de publicaciones por año, las revistas que las publicaron, y sobre sus autores y colaboraciones. Estos resultados, junto con las predicciones que se obtuvieron, podrían constituirse en una herramienta útil para optimizar el manejo de recursos dedicados a la investigación básica y clínica.
n the present work we use text mining as a treatment tool for a large scientific database, with the aim of obtaining new information about all the publications signed by Argentine authors and indexed until 2019, in the area of life sciences. More than 75 000 articles were analysed, published in around 5000 media, signed by about 186 000 authors with a workplace in Argentina or in collaborations with Argentine laboratories. Using automated tools that were developed ad hoc, the text of around 70 800 abstracts was analysed, seeking, through non-supervised digital detection, the main topics addressed by the authors, and the relationship with health problems in Argentina and their treatment. Results are also presented regarding the number of publications per year, the journals that have published them, and their authors and collaborations. These results, together with the predictions that were obtained, could become a useful tool to optimize the management of resources dedicated to basic and clinical research.
Fil: Dorr, Ricardo Alfredo. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Fisiología y Biofísica Bernardo Houssay. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Fisiología y Biofísica Bernardo Houssay; Argentina
Fil: Casal, Juan José. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Fisiología y Biofísica Bernardo Houssay. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Fisiología y Biofísica Bernardo Houssay; Argentina
Fil: Toriano, Roxana Mabel. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Fisiología y Biofísica Bernardo Houssay. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Fisiología y Biofísica Bernardo Houssay; Argentina
Materia
MINERÍA DE TEXTO
ARGENTINA
PUBLICACIONES CIENTÍFICAS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/172666

id CONICETDig_9873f44721142ebfbb9a37d0b8828893
oai_identifier_str oai:ri.conicet.gov.ar:11336/172666
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Minería de texto en publicaciones científicas con autores argentinosText mining in scientific publications with Argentine authorsDorr, Ricardo AlfredoCasal, Juan JoséToriano, Roxana MabelMINERÍA DE TEXTOARGENTINAPUBLICACIONES CIENTÍFICAShttps://purl.org/becyt/ford/1.2https://purl.org/becyt/ford/1https://purl.org/becyt/ford/5.8https://purl.org/becyt/ford/5https://purl.org/becyt/ford/1.1https://purl.org/becyt/ford/1En el presente trabajo utilizamos la minería de texto como herramienta de tratamiento de una gran base de datos científica, con el objetivo de obtener nueva información de todas las publicaciones firmadas por autores argentinos e indexadas hasta 2019 en el área de las ciencias de la vida. Se analizaron más de 75 000 artículos, publicados en alrededor de 5000 medios, firmados por cerca de 186 000 autores con lugar de trabajo en la Argentina o en colaboraciones con laboratorios argentinos. Mediante herramientas automatizadas, que fueron desarrolladas ad hoc, se analizó el texto de alrededor de 70 800 resúmenes y se buscaron, mediante detección digital no supervisada, los principales temas abordados, su relación con problemáticas de salud en la Argentina y su tratamiento. Se presentan, además, resultados del número de publicaciones por año, las revistas que las publicaron, y sobre sus autores y colaboraciones. Estos resultados, junto con las predicciones que se obtuvieron, podrían constituirse en una herramienta útil para optimizar el manejo de recursos dedicados a la investigación básica y clínica.n the present work we use text mining as a treatment tool for a large scientific database, with the aim of obtaining new information about all the publications signed by Argentine authors and indexed until 2019, in the area of life sciences. More than 75 000 articles were analysed, published in around 5000 media, signed by about 186 000 authors with a workplace in Argentina or in collaborations with Argentine laboratories. Using automated tools that were developed ad hoc, the text of around 70 800 abstracts was analysed, seeking, through non-supervised digital detection, the main topics addressed by the authors, and the relationship with health problems in Argentina and their treatment. Results are also presented regarding the number of publications per year, the journals that have published them, and their authors and collaborations. These results, together with the predictions that were obtained, could become a useful tool to optimize the management of resources dedicated to basic and clinical research.Fil: Dorr, Ricardo Alfredo. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Fisiología y Biofísica Bernardo Houssay. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Fisiología y Biofísica Bernardo Houssay; ArgentinaFil: Casal, Juan José. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Fisiología y Biofísica Bernardo Houssay. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Fisiología y Biofísica Bernardo Houssay; ArgentinaFil: Toriano, Roxana Mabel. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Fisiología y Biofísica Bernardo Houssay. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Fisiología y Biofísica Bernardo Houssay; ArgentinaMedicina (Buenos Aires)2021-04info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/172666Dorr, Ricardo Alfredo; Casal, Juan José; Toriano, Roxana Mabel; Minería de texto en publicaciones científicas con autores argentinos; Medicina (Buenos Aires); Medicina (Buenos Aires); 81; 2; 4-2021; 214-2230025-76801669-9106CONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/https://www.medicinabuenosaires.com/revistas/vol81-21/n2/214.pdfinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-10-22T11:02:15Zoai:ri.conicet.gov.ar:11336/172666instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-10-22 11:02:15.409CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Minería de texto en publicaciones científicas con autores argentinos
Text mining in scientific publications with Argentine authors
title Minería de texto en publicaciones científicas con autores argentinos
spellingShingle Minería de texto en publicaciones científicas con autores argentinos
Dorr, Ricardo Alfredo
MINERÍA DE TEXTO
ARGENTINA
PUBLICACIONES CIENTÍFICAS
title_short Minería de texto en publicaciones científicas con autores argentinos
title_full Minería de texto en publicaciones científicas con autores argentinos
title_fullStr Minería de texto en publicaciones científicas con autores argentinos
title_full_unstemmed Minería de texto en publicaciones científicas con autores argentinos
title_sort Minería de texto en publicaciones científicas con autores argentinos
dc.creator.none.fl_str_mv Dorr, Ricardo Alfredo
Casal, Juan José
Toriano, Roxana Mabel
author Dorr, Ricardo Alfredo
author_facet Dorr, Ricardo Alfredo
Casal, Juan José
Toriano, Roxana Mabel
author_role author
author2 Casal, Juan José
Toriano, Roxana Mabel
author2_role author
author
dc.subject.none.fl_str_mv MINERÍA DE TEXTO
ARGENTINA
PUBLICACIONES CIENTÍFICAS
topic MINERÍA DE TEXTO
ARGENTINA
PUBLICACIONES CIENTÍFICAS
purl_subject.fl_str_mv https://purl.org/becyt/ford/1.2
https://purl.org/becyt/ford/1
https://purl.org/becyt/ford/5.8
https://purl.org/becyt/ford/5
https://purl.org/becyt/ford/1.1
https://purl.org/becyt/ford/1
dc.description.none.fl_txt_mv En el presente trabajo utilizamos la minería de texto como herramienta de tratamiento de una gran base de datos científica, con el objetivo de obtener nueva información de todas las publicaciones firmadas por autores argentinos e indexadas hasta 2019 en el área de las ciencias de la vida. Se analizaron más de 75 000 artículos, publicados en alrededor de 5000 medios, firmados por cerca de 186 000 autores con lugar de trabajo en la Argentina o en colaboraciones con laboratorios argentinos. Mediante herramientas automatizadas, que fueron desarrolladas ad hoc, se analizó el texto de alrededor de 70 800 resúmenes y se buscaron, mediante detección digital no supervisada, los principales temas abordados, su relación con problemáticas de salud en la Argentina y su tratamiento. Se presentan, además, resultados del número de publicaciones por año, las revistas que las publicaron, y sobre sus autores y colaboraciones. Estos resultados, junto con las predicciones que se obtuvieron, podrían constituirse en una herramienta útil para optimizar el manejo de recursos dedicados a la investigación básica y clínica.
n the present work we use text mining as a treatment tool for a large scientific database, with the aim of obtaining new information about all the publications signed by Argentine authors and indexed until 2019, in the area of life sciences. More than 75 000 articles were analysed, published in around 5000 media, signed by about 186 000 authors with a workplace in Argentina or in collaborations with Argentine laboratories. Using automated tools that were developed ad hoc, the text of around 70 800 abstracts was analysed, seeking, through non-supervised digital detection, the main topics addressed by the authors, and the relationship with health problems in Argentina and their treatment. Results are also presented regarding the number of publications per year, the journals that have published them, and their authors and collaborations. These results, together with the predictions that were obtained, could become a useful tool to optimize the management of resources dedicated to basic and clinical research.
Fil: Dorr, Ricardo Alfredo. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Fisiología y Biofísica Bernardo Houssay. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Fisiología y Biofísica Bernardo Houssay; Argentina
Fil: Casal, Juan José. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Fisiología y Biofísica Bernardo Houssay. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Fisiología y Biofísica Bernardo Houssay; Argentina
Fil: Toriano, Roxana Mabel. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Houssay. Instituto de Fisiología y Biofísica Bernardo Houssay. Universidad de Buenos Aires. Facultad de Medicina. Instituto de Fisiología y Biofísica Bernardo Houssay; Argentina
description En el presente trabajo utilizamos la minería de texto como herramienta de tratamiento de una gran base de datos científica, con el objetivo de obtener nueva información de todas las publicaciones firmadas por autores argentinos e indexadas hasta 2019 en el área de las ciencias de la vida. Se analizaron más de 75 000 artículos, publicados en alrededor de 5000 medios, firmados por cerca de 186 000 autores con lugar de trabajo en la Argentina o en colaboraciones con laboratorios argentinos. Mediante herramientas automatizadas, que fueron desarrolladas ad hoc, se analizó el texto de alrededor de 70 800 resúmenes y se buscaron, mediante detección digital no supervisada, los principales temas abordados, su relación con problemáticas de salud en la Argentina y su tratamiento. Se presentan, además, resultados del número de publicaciones por año, las revistas que las publicaron, y sobre sus autores y colaboraciones. Estos resultados, junto con las predicciones que se obtuvieron, podrían constituirse en una herramienta útil para optimizar el manejo de recursos dedicados a la investigación básica y clínica.
publishDate 2021
dc.date.none.fl_str_mv 2021-04
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/172666
Dorr, Ricardo Alfredo; Casal, Juan José; Toriano, Roxana Mabel; Minería de texto en publicaciones científicas con autores argentinos; Medicina (Buenos Aires); Medicina (Buenos Aires); 81; 2; 4-2021; 214-223
0025-7680
1669-9106
CONICET Digital
CONICET
url http://hdl.handle.net/11336/172666
identifier_str_mv Dorr, Ricardo Alfredo; Casal, Juan José; Toriano, Roxana Mabel; Minería de texto en publicaciones científicas con autores argentinos; Medicina (Buenos Aires); Medicina (Buenos Aires); 81; 2; 4-2021; 214-223
0025-7680
1669-9106
CONICET Digital
CONICET
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://www.medicinabuenosaires.com/revistas/vol81-21/n2/214.pdf
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
application/pdf
dc.publisher.none.fl_str_mv Medicina (Buenos Aires)
publisher.none.fl_str_mv Medicina (Buenos Aires)
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1846781226077126656
score 12.982451