Detección de negaciones en informes radiológicos escritos en español

Autores: Stricker, Vanesa
Año de publicación: 2016
Idioma: español castellano
Tipo de recurso: tesis de grado
Estado: versión publicada
Colaborador/a o director/a de tesis: Cotik, Viviana Erica
Descripción: En el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados.
The identification of negations and their scope has been recognized as important in the processing of biomedical texts, since these determine whether the presence or absence of a clinical condition or finding is reported. Chapman et al. [5] have developed NegEx, an algorithm based on regular expressions in order to determine when a clinical condition or finding mentioned in clinical texts written in English is negated. NegEx has been adapted to other languages. Also machine learning techniques and methods based on syntactic and semantic information have been developed. In this work three approaches are presented in order to detect negations of finding in radiological reports written in Spanish: an adaptation of NegEx to Spanish is performed with two versions (one adequate for the radiological field, the other is suitable for other domains) and two syntactic methods are developed. One of them uses the Part-of-Speech tag of the words to detect negations, and rules are developed in order to determine whether the finding is under the scope of the negation, based on their positions within a sentence. The other consists in applying shallow parsing to the report sentences and use the information obtained to decide whether the sentences mention negated findings. NegEx adaptation, the simplest approach, obtains the best results.
Fil: Stricker, Vanesa. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia: DETECCION DE NEGACIONES
INFORMES RADIOLOGICOS
ESPAÑOL
NEGATION DETECTION
RADIOLOGY REPORTS
NEGEX
SPANISH
NLP
POS TAGGING
SHALLOW PARSING
Nivel de accesibilidad: acceso abierto
Condiciones de uso: https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Institución: Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador: seminario:seminario_nCOM000677_Stricker

Acceder

id	BDUBAFCEN_dfa3d821a51e57a71151708f5f042412
oai_identifier_str	seminario:seminario_nCOM000677_Stricker
network_acronym_str	BDUBAFCEN
repository_id_str	1896
network_name_str	Biblioteca Digital (UBA-FCEN)
spelling	Detección de negaciones en informes radiológicos escritos en españolStricker, VanesaDETECCION DE NEGACIONESINFORMES RADIOLOGICOSESPAÑOLNEGATION DETECTIONRADIOLOGY REPORTSNEGEXSPANISHNLPPOS TAGGINGSHALLOW PARSINGEn el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados.The identification of negations and their scope has been recognized as important in the processing of biomedical texts, since these determine whether the presence or absence of a clinical condition or finding is reported. Chapman et al. [5] have developed NegEx, an algorithm based on regular expressions in order to determine when a clinical condition or finding mentioned in clinical texts written in English is negated. NegEx has been adapted to other languages. Also machine learning techniques and methods based on syntactic and semantic information have been developed. In this work three approaches are presented in order to detect negations of finding in radiological reports written in Spanish: an adaptation of NegEx to Spanish is performed with two versions (one adequate for the radiological field, the other is suitable for other domains) and two syntactic methods are developed. One of them uses the Part-of-Speech tag of the words to detect negations, and rules are developed in order to determine whether the finding is under the scope of the negation, based on their positions within a sentence. The other consists in applying shallow parsing to the report sentences and use the information obtained to decide whether the sentences mention negated findings. NegEx adaptation, the simplest approach, obtains the best results.Fil: Stricker, Vanesa. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesCotik, Viviana Erica2016info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000677_Strickerspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2026-06-11T09:53:53Zseminario:seminario_nCOM000677_StrickerInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962026-06-11 09:53:54.338Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv	Detección de negaciones en informes radiológicos escritos en español
title	Detección de negaciones en informes radiológicos escritos en español
spellingShingle	Detección de negaciones en informes radiológicos escritos en español Stricker, Vanesa DETECCION DE NEGACIONES INFORMES RADIOLOGICOS ESPAÑOL NEGATION DETECTION RADIOLOGY REPORTS NEGEX SPANISH NLP POS TAGGING SHALLOW PARSING
title_short	Detección de negaciones en informes radiológicos escritos en español
title_full	Detección de negaciones en informes radiológicos escritos en español
title_fullStr	Detección de negaciones en informes radiológicos escritos en español
title_full_unstemmed	Detección de negaciones en informes radiológicos escritos en español
title_sort	Detección de negaciones en informes radiológicos escritos en español
dc.creator.none.fl_str_mv	Stricker, Vanesa
author	Stricker, Vanesa
author_facet	Stricker, Vanesa
author_role	author
dc.contributor.none.fl_str_mv	Cotik, Viviana Erica
dc.subject.none.fl_str_mv	DETECCION DE NEGACIONES INFORMES RADIOLOGICOS ESPAÑOL NEGATION DETECTION RADIOLOGY REPORTS NEGEX SPANISH NLP POS TAGGING SHALLOW PARSING
topic	DETECCION DE NEGACIONES INFORMES RADIOLOGICOS ESPAÑOL NEGATION DETECTION RADIOLOGY REPORTS NEGEX SPANISH NLP POS TAGGING SHALLOW PARSING
dc.description.none.fl_txt_mv	En el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados. The identification of negations and their scope has been recognized as important in the processing of biomedical texts, since these determine whether the presence or absence of a clinical condition or finding is reported. Chapman et al. [5] have developed NegEx, an algorithm based on regular expressions in order to determine when a clinical condition or finding mentioned in clinical texts written in English is negated. NegEx has been adapted to other languages. Also machine learning techniques and methods based on syntactic and semantic information have been developed. In this work three approaches are presented in order to detect negations of finding in radiological reports written in Spanish: an adaptation of NegEx to Spanish is performed with two versions (one adequate for the radiological field, the other is suitable for other domains) and two syntactic methods are developed. One of them uses the Part-of-Speech tag of the words to detect negations, and rules are developed in order to determine whether the finding is under the scope of the negation, based on their positions within a sentence. The other consists in applying shallow parsing to the report sentences and use the information obtained to decide whether the sentences mention negated findings. NegEx adaptation, the simplest approach, obtains the best results. Fil: Stricker, Vanesa. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description	En el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados.
publishDate	2016
dc.date.none.fl_str_mv	2016
dc.type.none.fl_str_mv	info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado
format	bachelorThesis
status_str	publishedVersion
dc.identifier.none.fl_str_mv	https://hdl.handle.net/20.500.12110/seminario_nCOM000677_Stricker
url	https://hdl.handle.net/20.500.12110/seminario_nCOM000677_Stricker
dc.language.none.fl_str_mv	spa
language	spa
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv	openAccess
rights_invalid_str_mv	https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv	reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN
reponame_str	Biblioteca Digital (UBA-FCEN)
collection	Biblioteca Digital (UBA-FCEN)
instname_str	Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str	UBA-FCEN
institution	UBA-FCEN
repository.name.fl_str_mv	Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv	ana@bl.fcen.uba.ar
_version_	1867707040955105280
score	12.98848

Detección de negaciones en informes radiológicos escritos en español

Publicaciones similares