Detección de entidades nombradas en textos de reportes de imágenes médicas

Autores
Francesca, Lucas Agustín de
Año de publicación
2021
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Alonso i Alemany, Laura
Descripción
Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021.
Fil: Francesca, Lucas Agustín de. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
En este trabajo se abordó el problema de reconocimiento de entidades nombradas sobre texto de reportes de imágenes médicas, empleando distintas alternativas a la solución del problema. La primera de ellas es un clasificador basado en máquinas de vectores de soporte con ventana deslizante. Luego aplicamos distintas alternativas sobre arquitecturas de redes neuronales, donde la principal componente de las mismas es una capa recurrente bidireccional. Analizamos el impacto de las distintas configuraciones y llegamos a la conclusión que aquellos aprendedores que utilizan word embeddings (reducciones de dimensionalidad neuronales) a nivel palabra y carácter logran un mejor rendimiento. Además, la utilización de un campo aleatorio condicional (Conditional Random Field) como capa final de la arquitectura neuronal mejora el rendimiento en comparación con una capa densa con función de activación softmax.
This work addresses the named entity recognition task on medical image report texts by applying two approaches. The first one is a support vector machine based on a sliding window. The second approach is based on neural network architectures, using a bidirectional recurrent layer as the main component, where we apply and compare different configurations. We analyzed different alternatives and came to the conclusion that those learners that use word and character level embeddings achieve better performance. Also, using a conditional random field as a final layer increases performance compared to a dense layer with softmax as activation function.
publishedVersion
Fil: Francesca, Lucas Agustín de. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
Materia
Red recurrente
Red convolucional
Computing methodologies
Artificial intelligence
Machine learning
Word embeddings
NLP
NER
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/20301

id RDUUNC_515eec6932dcac6e842015954bb48ba7
oai_identifier_str oai:rdu.unc.edu.ar:11086/20301
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Detección de entidades nombradas en textos de reportes de imágenes médicasFrancesca, Lucas Agustín deRed recurrenteRed convolucionalComputing methodologiesArtificial intelligenceMachine learningWord embeddingsNLPNERTesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021.Fil: Francesca, Lucas Agustín de. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.En este trabajo se abordó el problema de reconocimiento de entidades nombradas sobre texto de reportes de imágenes médicas, empleando distintas alternativas a la solución del problema. La primera de ellas es un clasificador basado en máquinas de vectores de soporte con ventana deslizante. Luego aplicamos distintas alternativas sobre arquitecturas de redes neuronales, donde la principal componente de las mismas es una capa recurrente bidireccional. Analizamos el impacto de las distintas configuraciones y llegamos a la conclusión que aquellos aprendedores que utilizan word embeddings (reducciones de dimensionalidad neuronales) a nivel palabra y carácter logran un mejor rendimiento. Además, la utilización de un campo aleatorio condicional (Conditional Random Field) como capa final de la arquitectura neuronal mejora el rendimiento en comparación con una capa densa con función de activación softmax.This work addresses the named entity recognition task on medical image report texts by applying two approaches. The first one is a support vector machine based on a sliding window. The second approach is based on neural network architectures, using a bidirectional recurrent layer as the main component, where we apply and compare different configurations. We analyzed different alternatives and came to the conclusion that those learners that use word and character level embeddings achieve better performance. Also, using a conditional random field as a final layer increases performance compared to a dense layer with softmax as activation function.publishedVersionFil: Francesca, Lucas Agustín de. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.Alonso i Alemany, Laura2021info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/20301spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-04T12:34:19Zoai:rdu.unc.edu.ar:11086/20301Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-04 12:34:19.994Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Detección de entidades nombradas en textos de reportes de imágenes médicas
title Detección de entidades nombradas en textos de reportes de imágenes médicas
spellingShingle Detección de entidades nombradas en textos de reportes de imágenes médicas
Francesca, Lucas Agustín de
Red recurrente
Red convolucional
Computing methodologies
Artificial intelligence
Machine learning
Word embeddings
NLP
NER
title_short Detección de entidades nombradas en textos de reportes de imágenes médicas
title_full Detección de entidades nombradas en textos de reportes de imágenes médicas
title_fullStr Detección de entidades nombradas en textos de reportes de imágenes médicas
title_full_unstemmed Detección de entidades nombradas en textos de reportes de imágenes médicas
title_sort Detección de entidades nombradas en textos de reportes de imágenes médicas
dc.creator.none.fl_str_mv Francesca, Lucas Agustín de
author Francesca, Lucas Agustín de
author_facet Francesca, Lucas Agustín de
author_role author
dc.contributor.none.fl_str_mv Alonso i Alemany, Laura
dc.subject.none.fl_str_mv Red recurrente
Red convolucional
Computing methodologies
Artificial intelligence
Machine learning
Word embeddings
NLP
NER
topic Red recurrente
Red convolucional
Computing methodologies
Artificial intelligence
Machine learning
Word embeddings
NLP
NER
dc.description.none.fl_txt_mv Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021.
Fil: Francesca, Lucas Agustín de. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
En este trabajo se abordó el problema de reconocimiento de entidades nombradas sobre texto de reportes de imágenes médicas, empleando distintas alternativas a la solución del problema. La primera de ellas es un clasificador basado en máquinas de vectores de soporte con ventana deslizante. Luego aplicamos distintas alternativas sobre arquitecturas de redes neuronales, donde la principal componente de las mismas es una capa recurrente bidireccional. Analizamos el impacto de las distintas configuraciones y llegamos a la conclusión que aquellos aprendedores que utilizan word embeddings (reducciones de dimensionalidad neuronales) a nivel palabra y carácter logran un mejor rendimiento. Además, la utilización de un campo aleatorio condicional (Conditional Random Field) como capa final de la arquitectura neuronal mejora el rendimiento en comparación con una capa densa con función de activación softmax.
This work addresses the named entity recognition task on medical image report texts by applying two approaches. The first one is a support vector machine based on a sliding window. The second approach is based on neural network architectures, using a bidirectional recurrent layer as the main component, where we apply and compare different configurations. We analyzed different alternatives and came to the conclusion that those learners that use word and character level embeddings achieve better performance. Also, using a conditional random field as a final layer increases performance compared to a dense layer with softmax as activation function.
publishedVersion
Fil: Francesca, Lucas Agustín de. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.
description Tesis (Lic. en Cs. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2021.
publishDate 2021
dc.date.none.fl_str_mv 2021
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/20301
url http://hdl.handle.net/11086/20301
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1842349676560384000
score 13.13397