Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires

Autores
Lamagna, Walter Marcelo
Año de publicación
2016
Idioma
español castellano
Tipo de recurso
tesis de maestría
Estado
versión publicada
Colaborador/a o director/a de tesis
Buemi, María Elena
Descripción
En esta última década, el acceso masivo a las nuevas tecnológicas con medios dealmacenamiento reducidos en tamaño y precios accesibles han impulsado la creacióny manipulaci´on de grandes volúmenes de datos. En este trabajo se utilizan datospúblicos, abiertos, libres de origen gubernamental. Existen ciertos datos, que como resultado de la gestión de un país y puestos adisposición de la sociedad, significan un enorme beneficio. Los datos abiertos fortalecenla participación democrática motivando a los científicos de datos a utilizar suconocimiento para responder ciertas preguntas ó resolver problemas a través de latecnología. Nuestro estudio consistió en tomar los Datos Abiertos Electorales que correspondena las elecciones de diputados y senadores en Argentina, Buenos Aires, Capital Federal el 27 de Octubre de 2013 y nos propusimos comparar un mismo dato provenientede dos fuentes diferentes de formato distinto: dígitos tipeados a partir deformularios en papel e imágenes escaneadas. Las planillas manuscritas escaneadasutilizadas en este trabajo albergan datos numéricos, que son datos certeros, ya queson producto del conteo manual supervisado por todos los actores presentes en elevento. Conociendo la metodología utilizada sabemos que este dato debería corresponderseentre ambas fuentes. Se busca determinar si existe una tasa de error entredos orígenes de datos que deberían coincidir en sus valores. Se describe el preprocesamiento de las planillas-imágenes para detectar las regionesde interés que localizan cada número que luego será segmentado en sus correspondientesdígitos. La dificultad de decodificar el símbolo numérico que correspondea cada número manuscrito se encuentra en la necesidad de utilizar técnicas de procesamientode imágenes y aprendizaje automático. En esta tesis se evaluó la aplicación de un método de lectura artificial automatizadoque clasifica los dígitos manuscritos de los telegramas y luego los compara conlos datos tipeados manualmente buscando inconsistencias. En diferentes etapas de este trabajo se aplica minería de datos: se utilizan árbolesde decisión en la clasificación de las regiones del telegrama y redes neuronalesconvolucionales en la clasificación de los dígitos manuscritos.
Fil: Lamagna, Walter Marcelo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
ELECCIONES
DATAMINING
GOBIERNO ABIERTO
PROCESAMIENTO DE IMAGENES
REDES NEURONALES CONVOLUCIONALES
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
tesis:tesis_n6105_Lamagna

id BDUBAFCEN_e38ace9e682664e2cc5aaa3addf68000
oai_identifier_str tesis:tesis_n6105_Lamagna
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos AiresLamagna, Walter MarceloELECCIONESDATAMININGGOBIERNO ABIERTOPROCESAMIENTO DE IMAGENESREDES NEURONALES CONVOLUCIONALESEn esta última década, el acceso masivo a las nuevas tecnológicas con medios dealmacenamiento reducidos en tamaño y precios accesibles han impulsado la creacióny manipulaci´on de grandes volúmenes de datos. En este trabajo se utilizan datospúblicos, abiertos, libres de origen gubernamental. Existen ciertos datos, que como resultado de la gestión de un país y puestos adisposición de la sociedad, significan un enorme beneficio. Los datos abiertos fortalecenla participación democrática motivando a los científicos de datos a utilizar suconocimiento para responder ciertas preguntas ó resolver problemas a través de latecnología. Nuestro estudio consistió en tomar los Datos Abiertos Electorales que correspondena las elecciones de diputados y senadores en Argentina, Buenos Aires, Capital Federal el 27 de Octubre de 2013 y nos propusimos comparar un mismo dato provenientede dos fuentes diferentes de formato distinto: dígitos tipeados a partir deformularios en papel e imágenes escaneadas. Las planillas manuscritas escaneadasutilizadas en este trabajo albergan datos numéricos, que son datos certeros, ya queson producto del conteo manual supervisado por todos los actores presentes en elevento. Conociendo la metodología utilizada sabemos que este dato debería corresponderseentre ambas fuentes. Se busca determinar si existe una tasa de error entredos orígenes de datos que deberían coincidir en sus valores. Se describe el preprocesamiento de las planillas-imágenes para detectar las regionesde interés que localizan cada número que luego será segmentado en sus correspondientesdígitos. La dificultad de decodificar el símbolo numérico que correspondea cada número manuscrito se encuentra en la necesidad de utilizar técnicas de procesamientode imágenes y aprendizaje automático. En esta tesis se evaluó la aplicación de un método de lectura artificial automatizadoque clasifica los dígitos manuscritos de los telegramas y luego los compara conlos datos tipeados manualmente buscando inconsistencias. En diferentes etapas de este trabajo se aplica minería de datos: se utilizan árbolesde decisión en la clasificación de las regiones del telegrama y redes neuronalesconvolucionales en la clasificación de los dígitos manuscritos.Fil: Lamagna, Walter Marcelo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesBuemi, María Elena2016-11-24info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n6105_Lamagnaspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-11-13T08:45:13Ztesis:tesis_n6105_LamagnaInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-11-13 08:45:14.833Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires
title Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires
spellingShingle Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires
Lamagna, Walter Marcelo
ELECCIONES
DATAMINING
GOBIERNO ABIERTO
PROCESAMIENTO DE IMAGENES
REDES NEURONALES CONVOLUCIONALES
title_short Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires
title_full Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires
title_fullStr Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires
title_full_unstemmed Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires
title_sort Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires
dc.creator.none.fl_str_mv Lamagna, Walter Marcelo
author Lamagna, Walter Marcelo
author_facet Lamagna, Walter Marcelo
author_role author
dc.contributor.none.fl_str_mv Buemi, María Elena
dc.subject.none.fl_str_mv ELECCIONES
DATAMINING
GOBIERNO ABIERTO
PROCESAMIENTO DE IMAGENES
REDES NEURONALES CONVOLUCIONALES
topic ELECCIONES
DATAMINING
GOBIERNO ABIERTO
PROCESAMIENTO DE IMAGENES
REDES NEURONALES CONVOLUCIONALES
dc.description.none.fl_txt_mv En esta última década, el acceso masivo a las nuevas tecnológicas con medios dealmacenamiento reducidos en tamaño y precios accesibles han impulsado la creacióny manipulaci´on de grandes volúmenes de datos. En este trabajo se utilizan datospúblicos, abiertos, libres de origen gubernamental. Existen ciertos datos, que como resultado de la gestión de un país y puestos adisposición de la sociedad, significan un enorme beneficio. Los datos abiertos fortalecenla participación democrática motivando a los científicos de datos a utilizar suconocimiento para responder ciertas preguntas ó resolver problemas a través de latecnología. Nuestro estudio consistió en tomar los Datos Abiertos Electorales que correspondena las elecciones de diputados y senadores en Argentina, Buenos Aires, Capital Federal el 27 de Octubre de 2013 y nos propusimos comparar un mismo dato provenientede dos fuentes diferentes de formato distinto: dígitos tipeados a partir deformularios en papel e imágenes escaneadas. Las planillas manuscritas escaneadasutilizadas en este trabajo albergan datos numéricos, que son datos certeros, ya queson producto del conteo manual supervisado por todos los actores presentes en elevento. Conociendo la metodología utilizada sabemos que este dato debería corresponderseentre ambas fuentes. Se busca determinar si existe una tasa de error entredos orígenes de datos que deberían coincidir en sus valores. Se describe el preprocesamiento de las planillas-imágenes para detectar las regionesde interés que localizan cada número que luego será segmentado en sus correspondientesdígitos. La dificultad de decodificar el símbolo numérico que correspondea cada número manuscrito se encuentra en la necesidad de utilizar técnicas de procesamientode imágenes y aprendizaje automático. En esta tesis se evaluó la aplicación de un método de lectura artificial automatizadoque clasifica los dígitos manuscritos de los telegramas y luego los compara conlos datos tipeados manualmente buscando inconsistencias. En diferentes etapas de este trabajo se aplica minería de datos: se utilizan árbolesde decisión en la clasificación de las regiones del telegrama y redes neuronalesconvolucionales en la clasificación de los dígitos manuscritos.
Fil: Lamagna, Walter Marcelo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description En esta última década, el acceso masivo a las nuevas tecnológicas con medios dealmacenamiento reducidos en tamaño y precios accesibles han impulsado la creacióny manipulaci´on de grandes volúmenes de datos. En este trabajo se utilizan datospúblicos, abiertos, libres de origen gubernamental. Existen ciertos datos, que como resultado de la gestión de un país y puestos adisposición de la sociedad, significan un enorme beneficio. Los datos abiertos fortalecenla participación democrática motivando a los científicos de datos a utilizar suconocimiento para responder ciertas preguntas ó resolver problemas a través de latecnología. Nuestro estudio consistió en tomar los Datos Abiertos Electorales que correspondena las elecciones de diputados y senadores en Argentina, Buenos Aires, Capital Federal el 27 de Octubre de 2013 y nos propusimos comparar un mismo dato provenientede dos fuentes diferentes de formato distinto: dígitos tipeados a partir deformularios en papel e imágenes escaneadas. Las planillas manuscritas escaneadasutilizadas en este trabajo albergan datos numéricos, que son datos certeros, ya queson producto del conteo manual supervisado por todos los actores presentes en elevento. Conociendo la metodología utilizada sabemos que este dato debería corresponderseentre ambas fuentes. Se busca determinar si existe una tasa de error entredos orígenes de datos que deberían coincidir en sus valores. Se describe el preprocesamiento de las planillas-imágenes para detectar las regionesde interés que localizan cada número que luego será segmentado en sus correspondientesdígitos. La dificultad de decodificar el símbolo numérico que correspondea cada número manuscrito se encuentra en la necesidad de utilizar técnicas de procesamientode imágenes y aprendizaje automático. En esta tesis se evaluó la aplicación de un método de lectura artificial automatizadoque clasifica los dígitos manuscritos de los telegramas y luego los compara conlos datos tipeados manualmente buscando inconsistencias. En diferentes etapas de este trabajo se aplica minería de datos: se utilizan árbolesde decisión en la clasificación de las regiones del telegrama y redes neuronalesconvolucionales en la clasificación de los dígitos manuscritos.
publishDate 2016
dc.date.none.fl_str_mv 2016-11-24
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_bdcc
info:ar-repo/semantics/tesisDeMaestria
format masterThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/tesis_n6105_Lamagna
url https://hdl.handle.net/20.500.12110/tesis_n6105_Lamagna
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1848680045041680384
score 12.71313