Reconocimiento de caracteres en imágenes no estructuradas

Autores
Carranza Astrada, Rodrigo Pablo
Año de publicación
2015
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Sánchez, Jorge Adrián, dir.
Luque, Franco Martín, dir.
Descripción
El que una computadora pueda discernir un carácter de otro en la imagen de un texto no es una tarea sencilla. El objetivo es clasificar caracteres en escenas naturales en donde las técnicas tradicionales de OCR no se pueden aplicar de forma directa (De Campos et al., 2009). En este trabajo se presenta un análisis del impacto producido en la performance de clasificación al entrenar un clasificador de caracteres con imágenes sintéticas (Wang et al., 2011). Se complementa esto realizando una análisis de performance utilizando diferentes conjuntos de entrenamiento sintéticos generados a partir del dataset público conocido como Chars74k. El resultado final de este trabajo sirve para corrobar que este tipo de datos produce un impacto positivo en la clasificación y más aún al combinar estas con datos reales.
Materia
Computing Methodologies
Document and text processing
Document capture
Optical character recognition
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/2818

id RDUUNC_53241eea0bc4d29a875dd22f8edecf7f
oai_identifier_str oai:rdu.unc.edu.ar:11086/2818
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Reconocimiento de caracteres en imágenes no estructuradasCarranza Astrada, Rodrigo PabloComputing MethodologiesDocument and text processingDocument captureOptical character recognitionEl que una computadora pueda discernir un carácter de otro en la imagen de un texto no es una tarea sencilla. El objetivo es clasificar caracteres en escenas naturales en donde las técnicas tradicionales de OCR no se pueden aplicar de forma directa (De Campos et al., 2009). En este trabajo se presenta un análisis del impacto producido en la performance de clasificación al entrenar un clasificador de caracteres con imágenes sintéticas (Wang et al., 2011). Se complementa esto realizando una análisis de performance utilizando diferentes conjuntos de entrenamiento sintéticos generados a partir del dataset público conocido como Chars74k. El resultado final de este trabajo sirve para corrobar que este tipo de datos produce un impacto positivo en la clasificación y más aún al combinar estas con datos reales.Sánchez, Jorge Adrián, dir.Luque, Franco Martín, dir.2015info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/2818spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-10-23T11:19:01Zoai:rdu.unc.edu.ar:11086/2818Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-10-23 11:19:01.925Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Reconocimiento de caracteres en imágenes no estructuradas
title Reconocimiento de caracteres en imágenes no estructuradas
spellingShingle Reconocimiento de caracteres en imágenes no estructuradas
Carranza Astrada, Rodrigo Pablo
Computing Methodologies
Document and text processing
Document capture
Optical character recognition
title_short Reconocimiento de caracteres en imágenes no estructuradas
title_full Reconocimiento de caracteres en imágenes no estructuradas
title_fullStr Reconocimiento de caracteres en imágenes no estructuradas
title_full_unstemmed Reconocimiento de caracteres en imágenes no estructuradas
title_sort Reconocimiento de caracteres en imágenes no estructuradas
dc.creator.none.fl_str_mv Carranza Astrada, Rodrigo Pablo
author Carranza Astrada, Rodrigo Pablo
author_facet Carranza Astrada, Rodrigo Pablo
author_role author
dc.contributor.none.fl_str_mv Sánchez, Jorge Adrián, dir.
Luque, Franco Martín, dir.
dc.subject.none.fl_str_mv Computing Methodologies
Document and text processing
Document capture
Optical character recognition
topic Computing Methodologies
Document and text processing
Document capture
Optical character recognition
dc.description.none.fl_txt_mv El que una computadora pueda discernir un carácter de otro en la imagen de un texto no es una tarea sencilla. El objetivo es clasificar caracteres en escenas naturales en donde las técnicas tradicionales de OCR no se pueden aplicar de forma directa (De Campos et al., 2009). En este trabajo se presenta un análisis del impacto producido en la performance de clasificación al entrenar un clasificador de caracteres con imágenes sintéticas (Wang et al., 2011). Se complementa esto realizando una análisis de performance utilizando diferentes conjuntos de entrenamiento sintéticos generados a partir del dataset público conocido como Chars74k. El resultado final de este trabajo sirve para corrobar que este tipo de datos produce un impacto positivo en la clasificación y más aún al combinar estas con datos reales.
description El que una computadora pueda discernir un carácter de otro en la imagen de un texto no es una tarea sencilla. El objetivo es clasificar caracteres en escenas naturales en donde las técnicas tradicionales de OCR no se pueden aplicar de forma directa (De Campos et al., 2009). En este trabajo se presenta un análisis del impacto producido en la performance de clasificación al entrenar un clasificador de caracteres con imágenes sintéticas (Wang et al., 2011). Se complementa esto realizando una análisis de performance utilizando diferentes conjuntos de entrenamiento sintéticos generados a partir del dataset público conocido como Chars74k. El resultado final de este trabajo sirve para corrobar que este tipo de datos produce un impacto positivo en la clasificación y más aún al combinar estas con datos reales.
publishDate 2015
dc.date.none.fl_str_mv 2015
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/2818
url http://hdl.handle.net/11086/2818
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1846785318992216064
score 12.982451