Detección de negaciones en informes radiológicos escritos en español

Autores
Stricker, Vanesa
Año de publicación
2016
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
Cotik, Viviana Erica
Descripción
En el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados.
The identification of negations and their scope has been recognized as important in the processing of biomedical texts, since these determine whether the presence or absence of a clinical condition or finding is reported. Chapman et al. [5] have developed NegEx, an algorithm based on regular expressions in order to determine when a clinical condition or finding mentioned in clinical texts written in English is negated. NegEx has been adapted to other languages. Also machine learning techniques and methods based on syntactic and semantic information have been developed. In this work three approaches are presented in order to detect negations of finding in radiological reports written in Spanish: an adaptation of NegEx to Spanish is performed with two versions (one adequate for the radiological field, the other is suitable for other domains) and two syntactic methods are developed. One of them uses the Part-of-Speech tag of the words to detect negations, and rules are developed in order to determine whether the finding is under the scope of the negation, based on their positions within a sentence. The other consists in applying shallow parsing to the report sentences and use the information obtained to decide whether the sentences mention negated findings. NegEx adaptation, the simplest approach, obtains the best results.
Fil: Stricker, Vanesa. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
DETECCION DE NEGACIONES
INFORMES RADIOLOGICOS
ESPAÑOL
NEGATION DETECTION
RADIOLOGY REPORTS
NEGEX
SPANISH
NLP
POS TAGGING
SHALLOW PARSING
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nCOM000677_Stricker

id BDUBAFCEN_dfa3d821a51e57a71151708f5f042412
oai_identifier_str seminario:seminario_nCOM000677_Stricker
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Detección de negaciones en informes radiológicos escritos en españolStricker, VanesaDETECCION DE NEGACIONESINFORMES RADIOLOGICOSESPAÑOLNEGATION DETECTIONRADIOLOGY REPORTSNEGEXSPANISHNLPPOS TAGGINGSHALLOW PARSINGEn el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados.The identification of negations and their scope has been recognized as important in the processing of biomedical texts, since these determine whether the presence or absence of a clinical condition or finding is reported. Chapman et al. [5] have developed NegEx, an algorithm based on regular expressions in order to determine when a clinical condition or finding mentioned in clinical texts written in English is negated. NegEx has been adapted to other languages. Also machine learning techniques and methods based on syntactic and semantic information have been developed. In this work three approaches are presented in order to detect negations of finding in radiological reports written in Spanish: an adaptation of NegEx to Spanish is performed with two versions (one adequate for the radiological field, the other is suitable for other domains) and two syntactic methods are developed. One of them uses the Part-of-Speech tag of the words to detect negations, and rules are developed in order to determine whether the finding is under the scope of the negation, based on their positions within a sentence. The other consists in applying shallow parsing to the report sentences and use the information obtained to decide whether the sentences mention negated findings. NegEx adaptation, the simplest approach, obtains the best results.Fil: Stricker, Vanesa. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesCotik, Viviana Erica2016info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000677_Strickerspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:34Zseminario:seminario_nCOM000677_StrickerInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:35.59Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Detección de negaciones en informes radiológicos escritos en español
title Detección de negaciones en informes radiológicos escritos en español
spellingShingle Detección de negaciones en informes radiológicos escritos en español
Stricker, Vanesa
DETECCION DE NEGACIONES
INFORMES RADIOLOGICOS
ESPAÑOL
NEGATION DETECTION
RADIOLOGY REPORTS
NEGEX
SPANISH
NLP
POS TAGGING
SHALLOW PARSING
title_short Detección de negaciones en informes radiológicos escritos en español
title_full Detección de negaciones en informes radiológicos escritos en español
title_fullStr Detección de negaciones en informes radiológicos escritos en español
title_full_unstemmed Detección de negaciones en informes radiológicos escritos en español
title_sort Detección de negaciones en informes radiológicos escritos en español
dc.creator.none.fl_str_mv Stricker, Vanesa
author Stricker, Vanesa
author_facet Stricker, Vanesa
author_role author
dc.contributor.none.fl_str_mv Cotik, Viviana Erica
dc.subject.none.fl_str_mv DETECCION DE NEGACIONES
INFORMES RADIOLOGICOS
ESPAÑOL
NEGATION DETECTION
RADIOLOGY REPORTS
NEGEX
SPANISH
NLP
POS TAGGING
SHALLOW PARSING
topic DETECCION DE NEGACIONES
INFORMES RADIOLOGICOS
ESPAÑOL
NEGATION DETECTION
RADIOLOGY REPORTS
NEGEX
SPANISH
NLP
POS TAGGING
SHALLOW PARSING
dc.description.none.fl_txt_mv En el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados.
The identification of negations and their scope has been recognized as important in the processing of biomedical texts, since these determine whether the presence or absence of a clinical condition or finding is reported. Chapman et al. [5] have developed NegEx, an algorithm based on regular expressions in order to determine when a clinical condition or finding mentioned in clinical texts written in English is negated. NegEx has been adapted to other languages. Also machine learning techniques and methods based on syntactic and semantic information have been developed. In this work three approaches are presented in order to detect negations of finding in radiological reports written in Spanish: an adaptation of NegEx to Spanish is performed with two versions (one adequate for the radiological field, the other is suitable for other domains) and two syntactic methods are developed. One of them uses the Part-of-Speech tag of the words to detect negations, and rules are developed in order to determine whether the finding is under the scope of the negation, based on their positions within a sentence. The other consists in applying shallow parsing to the report sentences and use the information obtained to decide whether the sentences mention negated findings. NegEx adaptation, the simplest approach, obtains the best results.
Fil: Stricker, Vanesa. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description En el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados.
publishDate 2016
dc.date.none.fl_str_mv 2016
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nCOM000677_Stricker
url https://hdl.handle.net/20.500.12110/seminario_nCOM000677_Stricker
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618754155085824
score 13.070432