Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires
- Autores
- Lamagna, Walter Marcelo
- Año de publicación
- 2016
- Idioma
- español castellano
- Tipo de recurso
- tesis de maestría
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Buemi, María Elena
- Descripción
- En esta última década, el acceso masivo a las nuevas tecnológicas con medios dealmacenamiento reducidos en tamaño y precios accesibles han impulsado la creacióny manipulaci´on de grandes volúmenes de datos. En este trabajo se utilizan datospúblicos, abiertos, libres de origen gubernamental. Existen ciertos datos, que como resultado de la gestión de un país y puestos adisposición de la sociedad, significan un enorme beneficio. Los datos abiertos fortalecenla participación democrática motivando a los científicos de datos a utilizar suconocimiento para responder ciertas preguntas ó resolver problemas a través de latecnología. Nuestro estudio consistió en tomar los Datos Abiertos Electorales que correspondena las elecciones de diputados y senadores en Argentina, Buenos Aires, Capital Federal el 27 de Octubre de 2013 y nos propusimos comparar un mismo dato provenientede dos fuentes diferentes de formato distinto: dígitos tipeados a partir deformularios en papel e imágenes escaneadas. Las planillas manuscritas escaneadasutilizadas en este trabajo albergan datos numéricos, que son datos certeros, ya queson producto del conteo manual supervisado por todos los actores presentes en elevento. Conociendo la metodología utilizada sabemos que este dato debería corresponderseentre ambas fuentes. Se busca determinar si existe una tasa de error entredos orígenes de datos que deberían coincidir en sus valores. Se describe el preprocesamiento de las planillas-imágenes para detectar las regionesde interés que localizan cada número que luego será segmentado en sus correspondientesdígitos. La dificultad de decodificar el símbolo numérico que correspondea cada número manuscrito se encuentra en la necesidad de utilizar técnicas de procesamientode imágenes y aprendizaje automático. En esta tesis se evaluó la aplicación de un método de lectura artificial automatizadoque clasifica los dígitos manuscritos de los telegramas y luego los compara conlos datos tipeados manualmente buscando inconsistencias. En diferentes etapas de este trabajo se aplica minería de datos: se utilizan árbolesde decisión en la clasificación de las regiones del telegrama y redes neuronalesconvolucionales en la clasificación de los dígitos manuscritos.
Fil: Lamagna, Walter Marcelo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
ELECCIONES
DATAMINING
GOBIERNO ABIERTO
PROCESAMIENTO DE IMAGENES
REDES NEURONALES CONVOLUCIONALES - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
.jpg)
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- tesis:tesis_n6105_Lamagna
Ver los metadatos del registro completo
| id |
BDUBAFCEN_e38ace9e682664e2cc5aaa3addf68000 |
|---|---|
| oai_identifier_str |
tesis:tesis_n6105_Lamagna |
| network_acronym_str |
BDUBAFCEN |
| repository_id_str |
1896 |
| network_name_str |
Biblioteca Digital (UBA-FCEN) |
| spelling |
Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos AiresLamagna, Walter MarceloELECCIONESDATAMININGGOBIERNO ABIERTOPROCESAMIENTO DE IMAGENESREDES NEURONALES CONVOLUCIONALESEn esta última década, el acceso masivo a las nuevas tecnológicas con medios dealmacenamiento reducidos en tamaño y precios accesibles han impulsado la creacióny manipulaci´on de grandes volúmenes de datos. En este trabajo se utilizan datospúblicos, abiertos, libres de origen gubernamental. Existen ciertos datos, que como resultado de la gestión de un país y puestos adisposición de la sociedad, significan un enorme beneficio. Los datos abiertos fortalecenla participación democrática motivando a los científicos de datos a utilizar suconocimiento para responder ciertas preguntas ó resolver problemas a través de latecnología. Nuestro estudio consistió en tomar los Datos Abiertos Electorales que correspondena las elecciones de diputados y senadores en Argentina, Buenos Aires, Capital Federal el 27 de Octubre de 2013 y nos propusimos comparar un mismo dato provenientede dos fuentes diferentes de formato distinto: dígitos tipeados a partir deformularios en papel e imágenes escaneadas. Las planillas manuscritas escaneadasutilizadas en este trabajo albergan datos numéricos, que son datos certeros, ya queson producto del conteo manual supervisado por todos los actores presentes en elevento. Conociendo la metodología utilizada sabemos que este dato debería corresponderseentre ambas fuentes. Se busca determinar si existe una tasa de error entredos orígenes de datos que deberían coincidir en sus valores. Se describe el preprocesamiento de las planillas-imágenes para detectar las regionesde interés que localizan cada número que luego será segmentado en sus correspondientesdígitos. La dificultad de decodificar el símbolo numérico que correspondea cada número manuscrito se encuentra en la necesidad de utilizar técnicas de procesamientode imágenes y aprendizaje automático. En esta tesis se evaluó la aplicación de un método de lectura artificial automatizadoque clasifica los dígitos manuscritos de los telegramas y luego los compara conlos datos tipeados manualmente buscando inconsistencias. En diferentes etapas de este trabajo se aplica minería de datos: se utilizan árbolesde decisión en la clasificación de las regiones del telegrama y redes neuronalesconvolucionales en la clasificación de los dígitos manuscritos.Fil: Lamagna, Walter Marcelo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesBuemi, María Elena2016-11-24info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_bdccinfo:ar-repo/semantics/tesisDeMaestriaapplication/pdfhttps://hdl.handle.net/20.500.12110/tesis_n6105_Lamagnaspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-11-13T08:45:13Ztesis:tesis_n6105_LamagnaInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-11-13 08:45:14.833Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
| dc.title.none.fl_str_mv |
Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires |
| title |
Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires |
| spellingShingle |
Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires Lamagna, Walter Marcelo ELECCIONES DATAMINING GOBIERNO ABIERTO PROCESAMIENTO DE IMAGENES REDES NEURONALES CONVOLUCIONALES |
| title_short |
Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires |
| title_full |
Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires |
| title_fullStr |
Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires |
| title_full_unstemmed |
Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires |
| title_sort |
Lectura artificial de números manuscritos en datos abiertos de elecciones legislativas en la Ciudad de Buenos Aires |
| dc.creator.none.fl_str_mv |
Lamagna, Walter Marcelo |
| author |
Lamagna, Walter Marcelo |
| author_facet |
Lamagna, Walter Marcelo |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Buemi, María Elena |
| dc.subject.none.fl_str_mv |
ELECCIONES DATAMINING GOBIERNO ABIERTO PROCESAMIENTO DE IMAGENES REDES NEURONALES CONVOLUCIONALES |
| topic |
ELECCIONES DATAMINING GOBIERNO ABIERTO PROCESAMIENTO DE IMAGENES REDES NEURONALES CONVOLUCIONALES |
| dc.description.none.fl_txt_mv |
En esta última década, el acceso masivo a las nuevas tecnológicas con medios dealmacenamiento reducidos en tamaño y precios accesibles han impulsado la creacióny manipulaci´on de grandes volúmenes de datos. En este trabajo se utilizan datospúblicos, abiertos, libres de origen gubernamental. Existen ciertos datos, que como resultado de la gestión de un país y puestos adisposición de la sociedad, significan un enorme beneficio. Los datos abiertos fortalecenla participación democrática motivando a los científicos de datos a utilizar suconocimiento para responder ciertas preguntas ó resolver problemas a través de latecnología. Nuestro estudio consistió en tomar los Datos Abiertos Electorales que correspondena las elecciones de diputados y senadores en Argentina, Buenos Aires, Capital Federal el 27 de Octubre de 2013 y nos propusimos comparar un mismo dato provenientede dos fuentes diferentes de formato distinto: dígitos tipeados a partir deformularios en papel e imágenes escaneadas. Las planillas manuscritas escaneadasutilizadas en este trabajo albergan datos numéricos, que son datos certeros, ya queson producto del conteo manual supervisado por todos los actores presentes en elevento. Conociendo la metodología utilizada sabemos que este dato debería corresponderseentre ambas fuentes. Se busca determinar si existe una tasa de error entredos orígenes de datos que deberían coincidir en sus valores. Se describe el preprocesamiento de las planillas-imágenes para detectar las regionesde interés que localizan cada número que luego será segmentado en sus correspondientesdígitos. La dificultad de decodificar el símbolo numérico que correspondea cada número manuscrito se encuentra en la necesidad de utilizar técnicas de procesamientode imágenes y aprendizaje automático. En esta tesis se evaluó la aplicación de un método de lectura artificial automatizadoque clasifica los dígitos manuscritos de los telegramas y luego los compara conlos datos tipeados manualmente buscando inconsistencias. En diferentes etapas de este trabajo se aplica minería de datos: se utilizan árbolesde decisión en la clasificación de las regiones del telegrama y redes neuronalesconvolucionales en la clasificación de los dígitos manuscritos. Fil: Lamagna, Walter Marcelo. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
| description |
En esta última década, el acceso masivo a las nuevas tecnológicas con medios dealmacenamiento reducidos en tamaño y precios accesibles han impulsado la creacióny manipulaci´on de grandes volúmenes de datos. En este trabajo se utilizan datospúblicos, abiertos, libres de origen gubernamental. Existen ciertos datos, que como resultado de la gestión de un país y puestos adisposición de la sociedad, significan un enorme beneficio. Los datos abiertos fortalecenla participación democrática motivando a los científicos de datos a utilizar suconocimiento para responder ciertas preguntas ó resolver problemas a través de latecnología. Nuestro estudio consistió en tomar los Datos Abiertos Electorales que correspondena las elecciones de diputados y senadores en Argentina, Buenos Aires, Capital Federal el 27 de Octubre de 2013 y nos propusimos comparar un mismo dato provenientede dos fuentes diferentes de formato distinto: dígitos tipeados a partir deformularios en papel e imágenes escaneadas. Las planillas manuscritas escaneadasutilizadas en este trabajo albergan datos numéricos, que son datos certeros, ya queson producto del conteo manual supervisado por todos los actores presentes en elevento. Conociendo la metodología utilizada sabemos que este dato debería corresponderseentre ambas fuentes. Se busca determinar si existe una tasa de error entredos orígenes de datos que deberían coincidir en sus valores. Se describe el preprocesamiento de las planillas-imágenes para detectar las regionesde interés que localizan cada número que luego será segmentado en sus correspondientesdígitos. La dificultad de decodificar el símbolo numérico que correspondea cada número manuscrito se encuentra en la necesidad de utilizar técnicas de procesamientode imágenes y aprendizaje automático. En esta tesis se evaluó la aplicación de un método de lectura artificial automatizadoque clasifica los dígitos manuscritos de los telegramas y luego los compara conlos datos tipeados manualmente buscando inconsistencias. En diferentes etapas de este trabajo se aplica minería de datos: se utilizan árbolesde decisión en la clasificación de las regiones del telegrama y redes neuronalesconvolucionales en la clasificación de los dígitos manuscritos. |
| publishDate |
2016 |
| dc.date.none.fl_str_mv |
2016-11-24 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_bdcc info:ar-repo/semantics/tesisDeMaestria |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/tesis_n6105_Lamagna |
| url |
https://hdl.handle.net/20.500.12110/tesis_n6105_Lamagna |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
| reponame_str |
Biblioteca Digital (UBA-FCEN) |
| collection |
Biblioteca Digital (UBA-FCEN) |
| instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| instacron_str |
UBA-FCEN |
| institution |
UBA-FCEN |
| repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
| _version_ |
1848680045041680384 |
| score |
12.71313 |