Segmentación y reconocimiento de textos manuscritos utilizando redes profundas
- Autores
- Pilorget, Juan Pablo
- Año de publicación
- 2023
- Idioma
- español castellano
- Tipo de recurso
- tesis de maestría
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Buemi, María Elena
- Descripción
- El reconocimiento de caracteres es un campo de investigación y desarrollo aplicado que ha tenido numerosos avances en los últimos años. Las técnicas tradicionales de reconocimiento óptico de caracteres, con una alta carga de trabajo manual para lograr su correcto funcionamiento, han comenzado a ser reemplazadas por abordajes inteligentes utilizando redes neuronales profundas. Los nuevos modelos permiten no sólo automatizar los procesos de reconocimiento sino mejorar la calidad de un tipo específico: el texto escrito a mano. La cantidad creciente de documentos manuscritos digitalizados presentan a la vez un desafío, por la imposibilidad de los métodos tradicionales para reconocer adecuadamente ese tipo de texto, y una oportunidad, por el impacto que podrían generar para el acervo público el desarrollo de modelos que detecten y reconozcan correctamente caracteres escritos a mano. El presente trabajo profundiza en las arquitecturas de redes neuronales que pueden utilizarse para detectar texto y reconocer caracteres de forma inteligente, analizando cuantitativamente el desempeño de modelos de segmentación y reconocimiento. Asimismo, evalúa cualitativamente los modelos en el acervo de la Biblioteca Digital de la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, aplicando las técnicas a la correspondencia digitalizada de Mario Bunge. La información obtenida es sistematizada y puesta a disposición para futuros trabajos y líneas de investigación.
Character recognition is an applied research field that has gone through numerous advances in recent years. Traditional optical character recognition techniques, requiring several manual steps in order to work properly, are being gradually replaced by new intelligent approaches leveraging deep neural networks. These new models allow not only to automate the processes but also enable improving the quality of a specific type of document: handwritten text. The increasing volume of handwritten documents that are being digitized pose both a challenge, given the struggle of traditional methods on correctly identifying text, and an opportunity, for the impact the development of detection and recognition models might have in the public archive. The present work dives deep in the neural network architectures that can be used for detecting text and intelligently recognizing characters, performing a quantitative analysis of performance on the segmentation and recognition models. It also evaluates qualitatively the models by applying them to the digital assets of the Library of the Faculty of Exact and Natural Sciences of the University of Buenos Aires, using the techniques on the correspondence of Mario Bunge. The resulting information is thus systematized and made available for future works and researches.
Fil: Pilorget, Juan Pablo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
RECONOCIMIENTO DE CARACTERES
REDES NEURONALES
SEGMENTACIÓN SEMANTICA
TEXTO MANUSCRITO
APRENDIZAJE PROFUNDO
CHARACTER RECOGNITION
NEURAL NETWORKS
SEMANTIC SEGMENTATION
HANDWRITTEN TEXT
DEEP LEARNING - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- tesis:tesis_n7456_Pilorget
Ver los metadatos del registro completo
id |
BDUBAFCEN_151e592d3fc26c9fbc90e252b02a27af |
---|---|
oai_identifier_str |
tesis:tesis_n7456_Pilorget |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Segmentación y reconocimiento de textos manuscritos utilizando redes profundasHandwritten text segmentation and recognition with deep learningPilorget, Juan PabloRECONOCIMIENTO DE CARACTERESREDES NEURONALESSEGMENTACIÓN SEMANTICATEXTO MANUSCRITOAPRENDIZAJE PROFUNDOCHARACTER RECOGNITIONNEURAL NETWORKSSEMANTIC SEGMENTATIONHANDWRITTEN TEXTDEEP LEARNINGEl reconocimiento de caracteres es un campo de investigación y desarrollo aplicado que ha tenido numerosos avances en los últimos años. Las técnicas tradicionales de reconocimiento óptico de caracteres, con una alta carga de trabajo manual para lograr su correcto funcionamiento, han comenzado a ser reemplazadas por abordajes inteligentes utilizando redes neuronales profundas. Los nuevos modelos permiten no sólo automatizar los procesos de reconocimiento sino mejorar la calidad de un tipo específico: el texto escrito a mano. La cantidad creciente de documentos manuscritos digitalizados presentan a la vez un desafío, por la imposibilidad de los métodos tradicionales para reconocer adecuadamente ese tipo de texto, y una oportunidad, por el impacto que podrían generar para el acervo público el desarrollo de modelos que detecten y reconozcan correctamente caracteres escritos a mano. El presente trabajo profundiza en las arquitecturas de redes neuronales que pueden utilizarse para detectar texto y reconocer caracteres de forma inteligente, analizando cuantitativamente el desempeño de modelos de segmentación y reconocimiento. Asimismo, evalúa cualitativamente los modelos en el acervo de la Biblioteca Digital de la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, aplicando las técnicas a la correspondencia digitalizada de Mario Bunge. La información obtenida es sistematizada y puesta a disposición para futuros trabajos y líneas de investigación.Character recognition is an applied research field that has gone through numerous advances in recent years. Traditional optical character recognition techniques, requiring several manual steps in order to work properly, are being gradually replaced by new intelligent approaches leveraging deep neural networks. These new models allow not only to automate the processes but also enable improving the quality of a specific type of document: handwritten text. The increasing volume of handwritten documents that are being digitized pose both a challenge, given the struggle of traditional methods on correctly identifying text, and an opportunity, for the impact the development of detection and recognition models might have in the public archive. The present work dives deep in the neural network architectures that can be used for detecting text and intelligently recognizing characters, performing a quantitative analysis of performance on the segmentation and recognition models. It also evaluates qualitatively the models by applying them to the digital assets of the Library of the Faculty of Exact and Natural Sciences of the University of Buenos Aires, using the techniques on the correspondence of Mario Bunge. The resulting information is thus systematized and made available for future works and researches.Fil: Pilorget, Juan Pablo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesBuemi, María Elena2023-05-31info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n7456_Pilorgetspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-10-16T09:28:10Ztesis:tesis_n7456_PilorgetInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-10-16 09:28:11.551Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Segmentación y reconocimiento de textos manuscritos utilizando redes profundas Handwritten text segmentation and recognition with deep learning |
title |
Segmentación y reconocimiento de textos manuscritos utilizando redes profundas |
spellingShingle |
Segmentación y reconocimiento de textos manuscritos utilizando redes profundas Pilorget, Juan Pablo RECONOCIMIENTO DE CARACTERES REDES NEURONALES SEGMENTACIÓN SEMANTICA TEXTO MANUSCRITO APRENDIZAJE PROFUNDO CHARACTER RECOGNITION NEURAL NETWORKS SEMANTIC SEGMENTATION HANDWRITTEN TEXT DEEP LEARNING |
title_short |
Segmentación y reconocimiento de textos manuscritos utilizando redes profundas |
title_full |
Segmentación y reconocimiento de textos manuscritos utilizando redes profundas |
title_fullStr |
Segmentación y reconocimiento de textos manuscritos utilizando redes profundas |
title_full_unstemmed |
Segmentación y reconocimiento de textos manuscritos utilizando redes profundas |
title_sort |
Segmentación y reconocimiento de textos manuscritos utilizando redes profundas |
dc.creator.none.fl_str_mv |
Pilorget, Juan Pablo |
author |
Pilorget, Juan Pablo |
author_facet |
Pilorget, Juan Pablo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Buemi, María Elena |
dc.subject.none.fl_str_mv |
RECONOCIMIENTO DE CARACTERES REDES NEURONALES SEGMENTACIÓN SEMANTICA TEXTO MANUSCRITO APRENDIZAJE PROFUNDO CHARACTER RECOGNITION NEURAL NETWORKS SEMANTIC SEGMENTATION HANDWRITTEN TEXT DEEP LEARNING |
topic |
RECONOCIMIENTO DE CARACTERES REDES NEURONALES SEGMENTACIÓN SEMANTICA TEXTO MANUSCRITO APRENDIZAJE PROFUNDO CHARACTER RECOGNITION NEURAL NETWORKS SEMANTIC SEGMENTATION HANDWRITTEN TEXT DEEP LEARNING |
dc.description.none.fl_txt_mv |
El reconocimiento de caracteres es un campo de investigación y desarrollo aplicado que ha tenido numerosos avances en los últimos años. Las técnicas tradicionales de reconocimiento óptico de caracteres, con una alta carga de trabajo manual para lograr su correcto funcionamiento, han comenzado a ser reemplazadas por abordajes inteligentes utilizando redes neuronales profundas. Los nuevos modelos permiten no sólo automatizar los procesos de reconocimiento sino mejorar la calidad de un tipo específico: el texto escrito a mano. La cantidad creciente de documentos manuscritos digitalizados presentan a la vez un desafío, por la imposibilidad de los métodos tradicionales para reconocer adecuadamente ese tipo de texto, y una oportunidad, por el impacto que podrían generar para el acervo público el desarrollo de modelos que detecten y reconozcan correctamente caracteres escritos a mano. El presente trabajo profundiza en las arquitecturas de redes neuronales que pueden utilizarse para detectar texto y reconocer caracteres de forma inteligente, analizando cuantitativamente el desempeño de modelos de segmentación y reconocimiento. Asimismo, evalúa cualitativamente los modelos en el acervo de la Biblioteca Digital de la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, aplicando las técnicas a la correspondencia digitalizada de Mario Bunge. La información obtenida es sistematizada y puesta a disposición para futuros trabajos y líneas de investigación. Character recognition is an applied research field that has gone through numerous advances in recent years. Traditional optical character recognition techniques, requiring several manual steps in order to work properly, are being gradually replaced by new intelligent approaches leveraging deep neural networks. These new models allow not only to automate the processes but also enable improving the quality of a specific type of document: handwritten text. The increasing volume of handwritten documents that are being digitized pose both a challenge, given the struggle of traditional methods on correctly identifying text, and an opportunity, for the impact the development of detection and recognition models might have in the public archive. The present work dives deep in the neural network architectures that can be used for detecting text and intelligently recognizing characters, performing a quantitative analysis of performance on the segmentation and recognition models. It also evaluates qualitatively the models by applying them to the digital assets of the Library of the Faculty of Exact and Natural Sciences of the University of Buenos Aires, using the techniques on the correspondence of Mario Bunge. The resulting information is thus systematized and made available for future works and researches. Fil: Pilorget, Juan Pablo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
El reconocimiento de caracteres es un campo de investigación y desarrollo aplicado que ha tenido numerosos avances en los últimos años. Las técnicas tradicionales de reconocimiento óptico de caracteres, con una alta carga de trabajo manual para lograr su correcto funcionamiento, han comenzado a ser reemplazadas por abordajes inteligentes utilizando redes neuronales profundas. Los nuevos modelos permiten no sólo automatizar los procesos de reconocimiento sino mejorar la calidad de un tipo específico: el texto escrito a mano. La cantidad creciente de documentos manuscritos digitalizados presentan a la vez un desafío, por la imposibilidad de los métodos tradicionales para reconocer adecuadamente ese tipo de texto, y una oportunidad, por el impacto que podrían generar para el acervo público el desarrollo de modelos que detecten y reconozcan correctamente caracteres escritos a mano. El presente trabajo profundiza en las arquitecturas de redes neuronales que pueden utilizarse para detectar texto y reconocer caracteres de forma inteligente, analizando cuantitativamente el desempeño de modelos de segmentación y reconocimiento. Asimismo, evalúa cualitativamente los modelos en el acervo de la Biblioteca Digital de la Facultad de Ciencias Exactas y Naturales de la Universidad de Buenos Aires, aplicando las técnicas a la correspondencia digitalizada de Mario Bunge. La información obtenida es sistematizada y puesta a disposición para futuros trabajos y líneas de investigación. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-05-31 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_bdcc info:ar-repo/semantics/tesisDeMaestria |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/tesis_n7456_Pilorget |
url |
https://hdl.handle.net/20.500.12110/tesis_n7456_Pilorget |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1846142808074747904 |
score |
12.712165 |