Procesamiento de imágenes médicas para generación automática de reportes

Autores
Garay, Lucas Gonzalo
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Alonso Alemany, Laura
Descripción
Tesis (Lic. en Ciencias. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
En el presente trabajo se plantea el problema de la generación automática de reportes médicos a partir de imágenes. La redacción de informes que interpretan las imágenes médicas consume gran parte del tiempo de los especialistas. Además, en muchos casos se trata de una tarea muy repetitiva. En este contexto, un texto generado automáticamente puede reducir el trabajo del médico, que en lugar de redactar el texto completo se enfocará en revisar y modificar un texto generado automáticamente. El objetivo de esta tesis es consolidar una implementación basada en redes neuronales para descripción textual de imágenes. Para ello, se utilizará una arquitectura provista para la descripción de imágenes genéricas y se aplicará en este dominio médico. Finalmente se hará una comparación con otras implementaciones específicas de dominio y se compararán los resultados de forma cuantitativa y cualitativa. La principal dificultad que se presenta es la escasez de datos disponibles, porque a pesar de que se generan grandes volúmenes de datos, no siempre se encuentran disponibles para su uso. Para resolver este problema se aplicarán técnicas tales como subsampling y suprasampling. Otro problema detectado refiere a la métrica estándar de evaluación, BLEU, la cual no mide la semejanza entre dos textos de la forma que esperaríamos. Para solucionar esto, se plantea el uso de la similitud coseno. Finalmente, se reportará el impacto de los word embeddings y el mecanismo de atención.
In the present work we expose a system which aim is to automatically generate medical reports from medical images. The specialists spend a lot of time writing reports from images. Moreover, most of the cases this is a very repetitive task. In this context, an automatic generated draft could reduce the doctor’s workload, which will not write the whole report by himself, instead can review and modify the automatic generated draft. This thesis objective is to consolidate a neural network based implementation for image captioning. For this task, we will use a provided architecture for generic image captioning but will use it for medical domain. At the end, we will do a quantitative and qualitative comparison between our generic approach and some specific domain approaches. The main difficulty is the lack of available data, because despite of the huge amount of that is generated, not all of this data is available and with free use. To solve this problem we will apply some techniques such as subsampling and suprasampling. Another detected problem refers to the standard metric, BLEU, which doesn’t capture the similarity of two texts the way that we expected. To address this problem, we propose the cosine similarity. Finally, we report the impact the of specific domain word embeddings and the attention mechanism.
Materia
Metodologías computacionales
Inteligencia artificial
Procesamiento del lenguaje natural
Generación de lenguaje natural
Visión artificial
Tareas de visión artificial
Comprensión de escenas
Computing methodologies
Artificial intelligence
Natural language processing
Natural language generation
Computer vision tasks
Scene understanding
Procesamiento de imágenes
Generación de texto
Reportes médicos
Imágenes médicas
Red convolucional
Red recurrente
Nivel de accesibilidad
acceso abierto
Condiciones de uso
Repositorio
Repositorio Digital Universitario (UNC)
Institución
Universidad Nacional de Córdoba
OAI Identificador
oai:rdu.unc.edu.ar:11086/13418

id RDUUNC_57eecb3217d24057348eefb13d0b74f1
oai_identifier_str oai:rdu.unc.edu.ar:11086/13418
network_acronym_str RDUUNC
repository_id_str 2572
network_name_str Repositorio Digital Universitario (UNC)
spelling Procesamiento de imágenes médicas para generación automática de reportesGaray, Lucas GonzaloMetodologías computacionalesInteligencia artificialProcesamiento del lenguaje naturalGeneración de lenguaje naturalVisión artificialTareas de visión artificialComprensión de escenasComputing methodologiesArtificial intelligenceNatural language processingNatural language generationComputer vision tasksScene understandingProcesamiento de imágenesGeneración de textoReportes médicosImágenes médicasRed convolucionalRed recurrenteTesis (Lic. en Ciencias. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.En el presente trabajo se plantea el problema de la generación automática de reportes médicos a partir de imágenes. La redacción de informes que interpretan las imágenes médicas consume gran parte del tiempo de los especialistas. Además, en muchos casos se trata de una tarea muy repetitiva. En este contexto, un texto generado automáticamente puede reducir el trabajo del médico, que en lugar de redactar el texto completo se enfocará en revisar y modificar un texto generado automáticamente. El objetivo de esta tesis es consolidar una implementación basada en redes neuronales para descripción textual de imágenes. Para ello, se utilizará una arquitectura provista para la descripción de imágenes genéricas y se aplicará en este dominio médico. Finalmente se hará una comparación con otras implementaciones específicas de dominio y se compararán los resultados de forma cuantitativa y cualitativa. La principal dificultad que se presenta es la escasez de datos disponibles, porque a pesar de que se generan grandes volúmenes de datos, no siempre se encuentran disponibles para su uso. Para resolver este problema se aplicarán técnicas tales como subsampling y suprasampling. Otro problema detectado refiere a la métrica estándar de evaluación, BLEU, la cual no mide la semejanza entre dos textos de la forma que esperaríamos. Para solucionar esto, se plantea el uso de la similitud coseno. Finalmente, se reportará el impacto de los word embeddings y el mecanismo de atención.In the present work we expose a system which aim is to automatically generate medical reports from medical images. The specialists spend a lot of time writing reports from images. Moreover, most of the cases this is a very repetitive task. In this context, an automatic generated draft could reduce the doctor’s workload, which will not write the whole report by himself, instead can review and modify the automatic generated draft. This thesis objective is to consolidate a neural network based implementation for image captioning. For this task, we will use a provided architecture for generic image captioning but will use it for medical domain. At the end, we will do a quantitative and qualitative comparison between our generic approach and some specific domain approaches. The main difficulty is the lack of available data, because despite of the huge amount of that is generated, not all of this data is available and with free use. To solve this problem we will apply some techniques such as subsampling and suprasampling. Another detected problem refers to the standard metric, BLEU, which doesn’t capture the similarity of two texts the way that we expected. To address this problem, we propose the cosine similarity. Finally, we report the impact the of specific domain word embeddings and the attention mechanism.Alonso Alemany, Laura2019info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/13418spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-29T13:43:01Zoai:rdu.unc.edu.ar:11086/13418Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:43:02.038Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse
dc.title.none.fl_str_mv Procesamiento de imágenes médicas para generación automática de reportes
title Procesamiento de imágenes médicas para generación automática de reportes
spellingShingle Procesamiento de imágenes médicas para generación automática de reportes
Garay, Lucas Gonzalo
Metodologías computacionales
Inteligencia artificial
Procesamiento del lenguaje natural
Generación de lenguaje natural
Visión artificial
Tareas de visión artificial
Comprensión de escenas
Computing methodologies
Artificial intelligence
Natural language processing
Natural language generation
Computer vision tasks
Scene understanding
Procesamiento de imágenes
Generación de texto
Reportes médicos
Imágenes médicas
Red convolucional
Red recurrente
title_short Procesamiento de imágenes médicas para generación automática de reportes
title_full Procesamiento de imágenes médicas para generación automática de reportes
title_fullStr Procesamiento de imágenes médicas para generación automática de reportes
title_full_unstemmed Procesamiento de imágenes médicas para generación automática de reportes
title_sort Procesamiento de imágenes médicas para generación automática de reportes
dc.creator.none.fl_str_mv Garay, Lucas Gonzalo
author Garay, Lucas Gonzalo
author_facet Garay, Lucas Gonzalo
author_role author
dc.contributor.none.fl_str_mv Alonso Alemany, Laura
dc.subject.none.fl_str_mv Metodologías computacionales
Inteligencia artificial
Procesamiento del lenguaje natural
Generación de lenguaje natural
Visión artificial
Tareas de visión artificial
Comprensión de escenas
Computing methodologies
Artificial intelligence
Natural language processing
Natural language generation
Computer vision tasks
Scene understanding
Procesamiento de imágenes
Generación de texto
Reportes médicos
Imágenes médicas
Red convolucional
Red recurrente
topic Metodologías computacionales
Inteligencia artificial
Procesamiento del lenguaje natural
Generación de lenguaje natural
Visión artificial
Tareas de visión artificial
Comprensión de escenas
Computing methodologies
Artificial intelligence
Natural language processing
Natural language generation
Computer vision tasks
Scene understanding
Procesamiento de imágenes
Generación de texto
Reportes médicos
Imágenes médicas
Red convolucional
Red recurrente
dc.description.none.fl_txt_mv Tesis (Lic. en Ciencias. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
En el presente trabajo se plantea el problema de la generación automática de reportes médicos a partir de imágenes. La redacción de informes que interpretan las imágenes médicas consume gran parte del tiempo de los especialistas. Además, en muchos casos se trata de una tarea muy repetitiva. En este contexto, un texto generado automáticamente puede reducir el trabajo del médico, que en lugar de redactar el texto completo se enfocará en revisar y modificar un texto generado automáticamente. El objetivo de esta tesis es consolidar una implementación basada en redes neuronales para descripción textual de imágenes. Para ello, se utilizará una arquitectura provista para la descripción de imágenes genéricas y se aplicará en este dominio médico. Finalmente se hará una comparación con otras implementaciones específicas de dominio y se compararán los resultados de forma cuantitativa y cualitativa. La principal dificultad que se presenta es la escasez de datos disponibles, porque a pesar de que se generan grandes volúmenes de datos, no siempre se encuentran disponibles para su uso. Para resolver este problema se aplicarán técnicas tales como subsampling y suprasampling. Otro problema detectado refiere a la métrica estándar de evaluación, BLEU, la cual no mide la semejanza entre dos textos de la forma que esperaríamos. Para solucionar esto, se plantea el uso de la similitud coseno. Finalmente, se reportará el impacto de los word embeddings y el mecanismo de atención.
In the present work we expose a system which aim is to automatically generate medical reports from medical images. The specialists spend a lot of time writing reports from images. Moreover, most of the cases this is a very repetitive task. In this context, an automatic generated draft could reduce the doctor’s workload, which will not write the whole report by himself, instead can review and modify the automatic generated draft. This thesis objective is to consolidate a neural network based implementation for image captioning. For this task, we will use a provided architecture for generic image captioning but will use it for medical domain. At the end, we will do a quantitative and qualitative comparison between our generic approach and some specific domain approaches. The main difficulty is the lack of available data, because despite of the huge amount of that is generated, not all of this data is available and with free use. To solve this problem we will apply some techniques such as subsampling and suprasampling. Another detected problem refers to the standard metric, BLEU, which doesn’t capture the similarity of two texts the way that we expected. To address this problem, we propose the cosine similarity. Finally, we report the impact the of specific domain word embeddings and the attention mechanism.
description Tesis (Lic. en Ciencias. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
publishDate 2019
dc.date.none.fl_str_mv 2019
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11086/13418
url http://hdl.handle.net/11086/13418
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositorio Digital Universitario (UNC)
instname:Universidad Nacional de Córdoba
instacron:UNC
reponame_str Repositorio Digital Universitario (UNC)
collection Repositorio Digital Universitario (UNC)
instname_str Universidad Nacional de Córdoba
instacron_str UNC
institution UNC
repository.name.fl_str_mv Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba
repository.mail.fl_str_mv oca.unc@gmail.com
_version_ 1844618942893522944
score 13.070432