Detección de negaciones en informes radiológicos escritos en español
- Autores
- Stricker, Vanesa
- Año de publicación
- 2016
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- Cotik, Viviana Erica
- Descripción
- En el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados.
The identification of negations and their scope has been recognized as important in the processing of biomedical texts, since these determine whether the presence or absence of a clinical condition or finding is reported. Chapman et al. [5] have developed NegEx, an algorithm based on regular expressions in order to determine when a clinical condition or finding mentioned in clinical texts written in English is negated. NegEx has been adapted to other languages. Also machine learning techniques and methods based on syntactic and semantic information have been developed. In this work three approaches are presented in order to detect negations of finding in radiological reports written in Spanish: an adaptation of NegEx to Spanish is performed with two versions (one adequate for the radiological field, the other is suitable for other domains) and two syntactic methods are developed. One of them uses the Part-of-Speech tag of the words to detect negations, and rules are developed in order to determine whether the finding is under the scope of the negation, based on their positions within a sentence. The other consists in applying shallow parsing to the report sentences and use the information obtained to decide whether the sentences mention negated findings. NegEx adaptation, the simplest approach, obtains the best results.
Fil: Stricker, Vanesa. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
DETECCION DE NEGACIONES
INFORMES RADIOLOGICOS
ESPAÑOL
NEGATION DETECTION
RADIOLOGY REPORTS
NEGEX
SPANISH
NLP
POS TAGGING
SHALLOW PARSING - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nCOM000677_Stricker
Ver los metadatos del registro completo
id |
BDUBAFCEN_dfa3d821a51e57a71151708f5f042412 |
---|---|
oai_identifier_str |
seminario:seminario_nCOM000677_Stricker |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Detección de negaciones en informes radiológicos escritos en españolStricker, VanesaDETECCION DE NEGACIONESINFORMES RADIOLOGICOSESPAÑOLNEGATION DETECTIONRADIOLOGY REPORTSNEGEXSPANISHNLPPOS TAGGINGSHALLOW PARSINGEn el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados.The identification of negations and their scope has been recognized as important in the processing of biomedical texts, since these determine whether the presence or absence of a clinical condition or finding is reported. Chapman et al. [5] have developed NegEx, an algorithm based on regular expressions in order to determine when a clinical condition or finding mentioned in clinical texts written in English is negated. NegEx has been adapted to other languages. Also machine learning techniques and methods based on syntactic and semantic information have been developed. In this work three approaches are presented in order to detect negations of finding in radiological reports written in Spanish: an adaptation of NegEx to Spanish is performed with two versions (one adequate for the radiological field, the other is suitable for other domains) and two syntactic methods are developed. One of them uses the Part-of-Speech tag of the words to detect negations, and rules are developed in order to determine whether the finding is under the scope of the negation, based on their positions within a sentence. The other consists in applying shallow parsing to the report sentences and use the information obtained to decide whether the sentences mention negated findings. NegEx adaptation, the simplest approach, obtains the best results.Fil: Stricker, Vanesa. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesCotik, Viviana Erica2016info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nCOM000677_Strickerspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:34Zseminario:seminario_nCOM000677_StrickerInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:35.59Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Detección de negaciones en informes radiológicos escritos en español |
title |
Detección de negaciones en informes radiológicos escritos en español |
spellingShingle |
Detección de negaciones en informes radiológicos escritos en español Stricker, Vanesa DETECCION DE NEGACIONES INFORMES RADIOLOGICOS ESPAÑOL NEGATION DETECTION RADIOLOGY REPORTS NEGEX SPANISH NLP POS TAGGING SHALLOW PARSING |
title_short |
Detección de negaciones en informes radiológicos escritos en español |
title_full |
Detección de negaciones en informes radiológicos escritos en español |
title_fullStr |
Detección de negaciones en informes radiológicos escritos en español |
title_full_unstemmed |
Detección de negaciones en informes radiológicos escritos en español |
title_sort |
Detección de negaciones en informes radiológicos escritos en español |
dc.creator.none.fl_str_mv |
Stricker, Vanesa |
author |
Stricker, Vanesa |
author_facet |
Stricker, Vanesa |
author_role |
author |
dc.contributor.none.fl_str_mv |
Cotik, Viviana Erica |
dc.subject.none.fl_str_mv |
DETECCION DE NEGACIONES INFORMES RADIOLOGICOS ESPAÑOL NEGATION DETECTION RADIOLOGY REPORTS NEGEX SPANISH NLP POS TAGGING SHALLOW PARSING |
topic |
DETECCION DE NEGACIONES INFORMES RADIOLOGICOS ESPAÑOL NEGATION DETECTION RADIOLOGY REPORTS NEGEX SPANISH NLP POS TAGGING SHALLOW PARSING |
dc.description.none.fl_txt_mv |
En el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados. The identification of negations and their scope has been recognized as important in the processing of biomedical texts, since these determine whether the presence or absence of a clinical condition or finding is reported. Chapman et al. [5] have developed NegEx, an algorithm based on regular expressions in order to determine when a clinical condition or finding mentioned in clinical texts written in English is negated. NegEx has been adapted to other languages. Also machine learning techniques and methods based on syntactic and semantic information have been developed. In this work three approaches are presented in order to detect negations of finding in radiological reports written in Spanish: an adaptation of NegEx to Spanish is performed with two versions (one adequate for the radiological field, the other is suitable for other domains) and two syntactic methods are developed. One of them uses the Part-of-Speech tag of the words to detect negations, and rules are developed in order to determine whether the finding is under the scope of the negation, based on their positions within a sentence. The other consists in applying shallow parsing to the report sentences and use the information obtained to decide whether the sentences mention negated findings. NegEx adaptation, the simplest approach, obtains the best results. Fil: Stricker, Vanesa. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
En el procesamiento de textos biomédicos se ha reconocido la importancia de identificar negaciones y su alcance, pues estas determinan si se informa de la presencia o ausencia de una condición clínica o finding. Chapman et al. [5] desarrollaron el algoritmo NegEx basado en expresiones regulares para determinar si una condición clínica o finding está negada en textos médicos escritos en inglés. NegEx fue adaptado a otros idiomas. También se han desarrollado métodos basados en aprendizaje automático y técnicas que usan información sintáctica y semántica. En este trabajo se presentan tres enfoques para detectar en informes radiológicos escritos en español si un finding está negado: se realiza una adaptación de NegEx para español con dos versiones (una adecuada para el ámbito radiológico, la otra adecuada para otros dominios) y se desarrollan dos métodos sintácticos. Uno utiliza el Part-of-Speech tag de las palabras para detectar las negaciones y se construyen reglas que determinen si el finding está alcanzado por la negación o no en base a sus posiciones dentro de una oración. El otro consiste en aplicar shallow parsing a las oraciones de los informes y utilizar la información obtenida para decidir si las oraciones mencionan findings negados o no. La adaptación de NegEx, el enfoque más simple, obtiene los mejores resultados. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nCOM000677_Stricker |
url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000677_Stricker |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1844618754155085824 |
score |
13.070432 |