Los datos de investigación en las Humanidades – periódicos decimonónicos
- Autores
- Galina Russell, Isabel; Peña Pimentel, Miriam; Priani Saisó, Ernesto
- Año de publicación
- 2019
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- Introducción: El OCR de periódicos digitalizados del siglo XIX pueden entenderse como "datos crudos" para la realización de investigación histórica hemerográfica y ofrecemos una reflexión en torno a cómo deben integrarse estos datos al repositorio para poder ser utilizado para estos fines. Este trabajo forma parte de los resultados de “Oceanic Exchanges: Tracing Global Information Networks in Historical Newspaper Repositories”, un proyecto de minería de datos en repositorios de periódicos digitalizados. Materiales y metodología: OcEx está compuesto por 6 equipos de investigación en 9 países y busca modelar patrones de flujo de información en periódicos del XIX. México participa con el repositorio Hemeroteca Nacional Digital de México (HNDM) que contiene más de 7 millones de imágenes y sus correspondientes archivos en XML producto del proceso de OCR. A partir de utilizar este repositorio para realizar un proyecto de minería de datos humanístico hacemos una reflexión en cómo pueden ser concebidas las colecciones digitales y sus datos de tal forma que pueden ser utilizados como datos crudos para investigación hemerográfica. Resultados y conclusiones: El uso de repositorios para custodiar colecciones de datos crudos permite compartir y reutilizar esta información. Sin embargo, es necesario una descripción bibliográfica de la digitalización. Para lograr esto es necesario aproximarse a los datos resultantes de una digitalización, desde una perspectiva crítica y no únicamente tecnológica. Este trabajo representa un primer acercamiento y reflexión a cómo este tipo de datos deben de ser almacenados en repositorios para que sean adecuadamente interpretados y utilizados en la investigación. Abstract Introduction: OCR
Universidad Nacional Autónoma de México - Materia
-
Bibliotecología
Ciencias Informáticas
datos de investigación
Humanidades - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/86748
Ver los metadatos del registro completo
id |
SEDICI_467db93f397bcc2afdfc8948dffbdc49 |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/86748 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Los datos de investigación en las Humanidades – periódicos decimonónicosGalina Russell, IsabelPeña Pimentel, MiriamPriani Saisó, ErnestoBibliotecologíaCiencias Informáticasdatos de investigaciónHumanidadesIntroducción: El OCR de periódicos digitalizados del siglo XIX pueden entenderse como "datos crudos" para la realización de investigación histórica hemerográfica y ofrecemos una reflexión en torno a cómo deben integrarse estos datos al repositorio para poder ser utilizado para estos fines. Este trabajo forma parte de los resultados de “Oceanic Exchanges: Tracing Global Information Networks in Historical Newspaper Repositories”, un proyecto de minería de datos en repositorios de periódicos digitalizados. Materiales y metodología: OcEx está compuesto por 6 equipos de investigación en 9 países y busca modelar patrones de flujo de información en periódicos del XIX. México participa con el repositorio Hemeroteca Nacional Digital de México (HNDM) que contiene más de 7 millones de imágenes y sus correspondientes archivos en XML producto del proceso de OCR. A partir de utilizar este repositorio para realizar un proyecto de minería de datos humanístico hacemos una reflexión en cómo pueden ser concebidas las colecciones digitales y sus datos de tal forma que pueden ser utilizados como datos crudos para investigación hemerográfica. Resultados y conclusiones: El uso de repositorios para custodiar colecciones de datos crudos permite compartir y reutilizar esta información. Sin embargo, es necesario una descripción bibliográfica de la digitalización. Para lograr esto es necesario aproximarse a los datos resultantes de una digitalización, desde una perspectiva crítica y no únicamente tecnológica. Este trabajo representa un primer acercamiento y reflexión a cómo este tipo de datos deben de ser almacenados en repositorios para que sean adecuadamente interpretados y utilizados en la investigación. Abstract Introduction: OCRUniversidad Nacional Autónoma de México2019-07info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttp://sedici.unlp.edu.ar/handle/10915/86748spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-22T16:58:07Zoai:sedici.unlp.edu.ar:10915/86748Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-22 16:58:07.844SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
title |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
spellingShingle |
Los datos de investigación en las Humanidades – periódicos decimonónicos Galina Russell, Isabel Bibliotecología Ciencias Informáticas datos de investigación Humanidades |
title_short |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
title_full |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
title_fullStr |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
title_full_unstemmed |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
title_sort |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
dc.creator.none.fl_str_mv |
Galina Russell, Isabel Peña Pimentel, Miriam Priani Saisó, Ernesto |
author |
Galina Russell, Isabel |
author_facet |
Galina Russell, Isabel Peña Pimentel, Miriam Priani Saisó, Ernesto |
author_role |
author |
author2 |
Peña Pimentel, Miriam Priani Saisó, Ernesto |
author2_role |
author author |
dc.subject.none.fl_str_mv |
Bibliotecología Ciencias Informáticas datos de investigación Humanidades |
topic |
Bibliotecología Ciencias Informáticas datos de investigación Humanidades |
dc.description.none.fl_txt_mv |
Introducción: El OCR de periódicos digitalizados del siglo XIX pueden entenderse como "datos crudos" para la realización de investigación histórica hemerográfica y ofrecemos una reflexión en torno a cómo deben integrarse estos datos al repositorio para poder ser utilizado para estos fines. Este trabajo forma parte de los resultados de “Oceanic Exchanges: Tracing Global Information Networks in Historical Newspaper Repositories”, un proyecto de minería de datos en repositorios de periódicos digitalizados. Materiales y metodología: OcEx está compuesto por 6 equipos de investigación en 9 países y busca modelar patrones de flujo de información en periódicos del XIX. México participa con el repositorio Hemeroteca Nacional Digital de México (HNDM) que contiene más de 7 millones de imágenes y sus correspondientes archivos en XML producto del proceso de OCR. A partir de utilizar este repositorio para realizar un proyecto de minería de datos humanístico hacemos una reflexión en cómo pueden ser concebidas las colecciones digitales y sus datos de tal forma que pueden ser utilizados como datos crudos para investigación hemerográfica. Resultados y conclusiones: El uso de repositorios para custodiar colecciones de datos crudos permite compartir y reutilizar esta información. Sin embargo, es necesario una descripción bibliográfica de la digitalización. Para lograr esto es necesario aproximarse a los datos resultantes de una digitalización, desde una perspectiva crítica y no únicamente tecnológica. Este trabajo representa un primer acercamiento y reflexión a cómo este tipo de datos deben de ser almacenados en repositorios para que sean adecuadamente interpretados y utilizados en la investigación. Abstract Introduction: OCR Universidad Nacional Autónoma de México |
description |
Introducción: El OCR de periódicos digitalizados del siglo XIX pueden entenderse como "datos crudos" para la realización de investigación histórica hemerográfica y ofrecemos una reflexión en torno a cómo deben integrarse estos datos al repositorio para poder ser utilizado para estos fines. Este trabajo forma parte de los resultados de “Oceanic Exchanges: Tracing Global Information Networks in Historical Newspaper Repositories”, un proyecto de minería de datos en repositorios de periódicos digitalizados. Materiales y metodología: OcEx está compuesto por 6 equipos de investigación en 9 países y busca modelar patrones de flujo de información en periódicos del XIX. México participa con el repositorio Hemeroteca Nacional Digital de México (HNDM) que contiene más de 7 millones de imágenes y sus correspondientes archivos en XML producto del proceso de OCR. A partir de utilizar este repositorio para realizar un proyecto de minería de datos humanístico hacemos una reflexión en cómo pueden ser concebidas las colecciones digitales y sus datos de tal forma que pueden ser utilizados como datos crudos para investigación hemerográfica. Resultados y conclusiones: El uso de repositorios para custodiar colecciones de datos crudos permite compartir y reutilizar esta información. Sin embargo, es necesario una descripción bibliográfica de la digitalización. Para lograr esto es necesario aproximarse a los datos resultantes de una digitalización, desde una perspectiva crítica y no únicamente tecnológica. Este trabajo representa un primer acercamiento y reflexión a cómo este tipo de datos deben de ser almacenados en repositorios para que sean adecuadamente interpretados y utilizados en la investigación. Abstract Introduction: OCR |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-07 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/86748 |
url |
http://sedici.unlp.edu.ar/handle/10915/86748 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1846783201427587072 |
score |
12.960015 |