Procesamiento de imágenes médicas para generación automática de reportes
- Autores
- Garay, Lucas Gonzalo
- Año de publicación
- 2019
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Alonso Alemany, Laura
- Descripción
- Tesis (Lic. en Ciencias. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.
En el presente trabajo se plantea el problema de la generación automática de reportes médicos a partir de imágenes. La redacción de informes que interpretan las imágenes médicas consume gran parte del tiempo de los especialistas. Además, en muchos casos se trata de una tarea muy repetitiva. En este contexto, un texto generado automáticamente puede reducir el trabajo del médico, que en lugar de redactar el texto completo se enfocará en revisar y modificar un texto generado automáticamente. El objetivo de esta tesis es consolidar una implementación basada en redes neuronales para descripción textual de imágenes. Para ello, se utilizará una arquitectura provista para la descripción de imágenes genéricas y se aplicará en este dominio médico. Finalmente se hará una comparación con otras implementaciones específicas de dominio y se compararán los resultados de forma cuantitativa y cualitativa. La principal dificultad que se presenta es la escasez de datos disponibles, porque a pesar de que se generan grandes volúmenes de datos, no siempre se encuentran disponibles para su uso. Para resolver este problema se aplicarán técnicas tales como subsampling y suprasampling. Otro problema detectado refiere a la métrica estándar de evaluación, BLEU, la cual no mide la semejanza entre dos textos de la forma que esperaríamos. Para solucionar esto, se plantea el uso de la similitud coseno. Finalmente, se reportará el impacto de los word embeddings y el mecanismo de atención.
In the present work we expose a system which aim is to automatically generate medical reports from medical images. The specialists spend a lot of time writing reports from images. Moreover, most of the cases this is a very repetitive task. In this context, an automatic generated draft could reduce the doctor’s workload, which will not write the whole report by himself, instead can review and modify the automatic generated draft. This thesis objective is to consolidate a neural network based implementation for image captioning. For this task, we will use a provided architecture for generic image captioning but will use it for medical domain. At the end, we will do a quantitative and qualitative comparison between our generic approach and some specific domain approaches. The main difficulty is the lack of available data, because despite of the huge amount of that is generated, not all of this data is available and with free use. To solve this problem we will apply some techniques such as subsampling and suprasampling. Another detected problem refers to the standard metric, BLEU, which doesn’t capture the similarity of two texts the way that we expected. To address this problem, we propose the cosine similarity. Finally, we report the impact the of specific domain word embeddings and the attention mechanism. - Materia
-
Metodologías computacionales
Inteligencia artificial
Procesamiento del lenguaje natural
Generación de lenguaje natural
Visión artificial
Tareas de visión artificial
Comprensión de escenas
Computing methodologies
Artificial intelligence
Natural language processing
Natural language generation
Computer vision tasks
Scene understanding
Procesamiento de imágenes
Generación de texto
Reportes médicos
Imágenes médicas
Red convolucional
Red recurrente - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- Repositorio
- Institución
- Universidad Nacional de Córdoba
- OAI Identificador
- oai:rdu.unc.edu.ar:11086/13418
Ver los metadatos del registro completo
id |
RDUUNC_57eecb3217d24057348eefb13d0b74f1 |
---|---|
oai_identifier_str |
oai:rdu.unc.edu.ar:11086/13418 |
network_acronym_str |
RDUUNC |
repository_id_str |
2572 |
network_name_str |
Repositorio Digital Universitario (UNC) |
spelling |
Procesamiento de imágenes médicas para generación automática de reportesGaray, Lucas GonzaloMetodologías computacionalesInteligencia artificialProcesamiento del lenguaje naturalGeneración de lenguaje naturalVisión artificialTareas de visión artificialComprensión de escenasComputing methodologiesArtificial intelligenceNatural language processingNatural language generationComputer vision tasksScene understandingProcesamiento de imágenesGeneración de textoReportes médicosImágenes médicasRed convolucionalRed recurrenteTesis (Lic. en Ciencias. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019.En el presente trabajo se plantea el problema de la generación automática de reportes médicos a partir de imágenes. La redacción de informes que interpretan las imágenes médicas consume gran parte del tiempo de los especialistas. Además, en muchos casos se trata de una tarea muy repetitiva. En este contexto, un texto generado automáticamente puede reducir el trabajo del médico, que en lugar de redactar el texto completo se enfocará en revisar y modificar un texto generado automáticamente. El objetivo de esta tesis es consolidar una implementación basada en redes neuronales para descripción textual de imágenes. Para ello, se utilizará una arquitectura provista para la descripción de imágenes genéricas y se aplicará en este dominio médico. Finalmente se hará una comparación con otras implementaciones específicas de dominio y se compararán los resultados de forma cuantitativa y cualitativa. La principal dificultad que se presenta es la escasez de datos disponibles, porque a pesar de que se generan grandes volúmenes de datos, no siempre se encuentran disponibles para su uso. Para resolver este problema se aplicarán técnicas tales como subsampling y suprasampling. Otro problema detectado refiere a la métrica estándar de evaluación, BLEU, la cual no mide la semejanza entre dos textos de la forma que esperaríamos. Para solucionar esto, se plantea el uso de la similitud coseno. Finalmente, se reportará el impacto de los word embeddings y el mecanismo de atención.In the present work we expose a system which aim is to automatically generate medical reports from medical images. The specialists spend a lot of time writing reports from images. Moreover, most of the cases this is a very repetitive task. In this context, an automatic generated draft could reduce the doctor’s workload, which will not write the whole report by himself, instead can review and modify the automatic generated draft. This thesis objective is to consolidate a neural network based implementation for image captioning. For this task, we will use a provided architecture for generic image captioning but will use it for medical domain. At the end, we will do a quantitative and qualitative comparison between our generic approach and some specific domain approaches. The main difficulty is the lack of available data, because despite of the huge amount of that is generated, not all of this data is available and with free use. To solve this problem we will apply some techniques such as subsampling and suprasampling. Another detected problem refers to the standard metric, BLEU, which doesn’t capture the similarity of two texts the way that we expected. To address this problem, we propose the cosine similarity. Finally, we report the impact the of specific domain word embeddings and the attention mechanism.Alonso Alemany, Laura2019info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://hdl.handle.net/11086/13418spainfo:eu-repo/semantics/openAccessreponame:Repositorio Digital Universitario (UNC)instname:Universidad Nacional de Córdobainstacron:UNC2025-09-29T13:43:01Zoai:rdu.unc.edu.ar:11086/13418Institucionalhttps://rdu.unc.edu.ar/Universidad públicaNo correspondehttp://rdu.unc.edu.ar/oai/snrdoca.unc@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:25722025-09-29 13:43:02.038Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdobafalse |
dc.title.none.fl_str_mv |
Procesamiento de imágenes médicas para generación automática de reportes |
title |
Procesamiento de imágenes médicas para generación automática de reportes |
spellingShingle |
Procesamiento de imágenes médicas para generación automática de reportes Garay, Lucas Gonzalo Metodologías computacionales Inteligencia artificial Procesamiento del lenguaje natural Generación de lenguaje natural Visión artificial Tareas de visión artificial Comprensión de escenas Computing methodologies Artificial intelligence Natural language processing Natural language generation Computer vision tasks Scene understanding Procesamiento de imágenes Generación de texto Reportes médicos Imágenes médicas Red convolucional Red recurrente |
title_short |
Procesamiento de imágenes médicas para generación automática de reportes |
title_full |
Procesamiento de imágenes médicas para generación automática de reportes |
title_fullStr |
Procesamiento de imágenes médicas para generación automática de reportes |
title_full_unstemmed |
Procesamiento de imágenes médicas para generación automática de reportes |
title_sort |
Procesamiento de imágenes médicas para generación automática de reportes |
dc.creator.none.fl_str_mv |
Garay, Lucas Gonzalo |
author |
Garay, Lucas Gonzalo |
author_facet |
Garay, Lucas Gonzalo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Alonso Alemany, Laura |
dc.subject.none.fl_str_mv |
Metodologías computacionales Inteligencia artificial Procesamiento del lenguaje natural Generación de lenguaje natural Visión artificial Tareas de visión artificial Comprensión de escenas Computing methodologies Artificial intelligence Natural language processing Natural language generation Computer vision tasks Scene understanding Procesamiento de imágenes Generación de texto Reportes médicos Imágenes médicas Red convolucional Red recurrente |
topic |
Metodologías computacionales Inteligencia artificial Procesamiento del lenguaje natural Generación de lenguaje natural Visión artificial Tareas de visión artificial Comprensión de escenas Computing methodologies Artificial intelligence Natural language processing Natural language generation Computer vision tasks Scene understanding Procesamiento de imágenes Generación de texto Reportes médicos Imágenes médicas Red convolucional Red recurrente |
dc.description.none.fl_txt_mv |
Tesis (Lic. en Ciencias. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019. En el presente trabajo se plantea el problema de la generación automática de reportes médicos a partir de imágenes. La redacción de informes que interpretan las imágenes médicas consume gran parte del tiempo de los especialistas. Además, en muchos casos se trata de una tarea muy repetitiva. En este contexto, un texto generado automáticamente puede reducir el trabajo del médico, que en lugar de redactar el texto completo se enfocará en revisar y modificar un texto generado automáticamente. El objetivo de esta tesis es consolidar una implementación basada en redes neuronales para descripción textual de imágenes. Para ello, se utilizará una arquitectura provista para la descripción de imágenes genéricas y se aplicará en este dominio médico. Finalmente se hará una comparación con otras implementaciones específicas de dominio y se compararán los resultados de forma cuantitativa y cualitativa. La principal dificultad que se presenta es la escasez de datos disponibles, porque a pesar de que se generan grandes volúmenes de datos, no siempre se encuentran disponibles para su uso. Para resolver este problema se aplicarán técnicas tales como subsampling y suprasampling. Otro problema detectado refiere a la métrica estándar de evaluación, BLEU, la cual no mide la semejanza entre dos textos de la forma que esperaríamos. Para solucionar esto, se plantea el uso de la similitud coseno. Finalmente, se reportará el impacto de los word embeddings y el mecanismo de atención. In the present work we expose a system which aim is to automatically generate medical reports from medical images. The specialists spend a lot of time writing reports from images. Moreover, most of the cases this is a very repetitive task. In this context, an automatic generated draft could reduce the doctor’s workload, which will not write the whole report by himself, instead can review and modify the automatic generated draft. This thesis objective is to consolidate a neural network based implementation for image captioning. For this task, we will use a provided architecture for generic image captioning but will use it for medical domain. At the end, we will do a quantitative and qualitative comparison between our generic approach and some specific domain approaches. The main difficulty is the lack of available data, because despite of the huge amount of that is generated, not all of this data is available and with free use. To solve this problem we will apply some techniques such as subsampling and suprasampling. Another detected problem refers to the standard metric, BLEU, which doesn’t capture the similarity of two texts the way that we expected. To address this problem, we propose the cosine similarity. Finally, we report the impact the of specific domain word embeddings and the attention mechanism. |
description |
Tesis (Lic. en Ciencias. de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2019. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11086/13418 |
url |
http://hdl.handle.net/11086/13418 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositorio Digital Universitario (UNC) instname:Universidad Nacional de Córdoba instacron:UNC |
reponame_str |
Repositorio Digital Universitario (UNC) |
collection |
Repositorio Digital Universitario (UNC) |
instname_str |
Universidad Nacional de Córdoba |
instacron_str |
UNC |
institution |
UNC |
repository.name.fl_str_mv |
Repositorio Digital Universitario (UNC) - Universidad Nacional de Córdoba |
repository.mail.fl_str_mv |
oca.unc@gmail.com |
_version_ |
1844618942893522944 |
score |
13.070432 |