Extracción de Candidatos a Términos del Dominio Médico a Partir de la categorización automática de Palabras

Autores
Koza, W.
Año de publicación
2012
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
Se presenta una serie de experimentos con el objetivo de desarrollar un método automático de extracción terminológica del dominio de la medicina. Uno de los inconvenientes típicos es el cambio constante de la terminología médica, que imposibilita mantener terminologías actualizadas inmediatamente por medios manuales. Se parte de la hipótesis de que las palabras incluidas en los textos médicos que no aparecen en el diccionario fuente del software analizador, denominadas PD, son, en su mayoría, expresiones específicas del dominio médico, por lo cual, una categorización automática de estas ayudaría en la extracción. Primeramente, se intenta deducir a qué categoría pertenecen las PD mediante reglas de formación de palabras (1er. Nivel de análisis) y sintácticas (2do. Nivel de análisis). Luego, se procede a la conformación de sintagmas nominales que involucren PD, para extraerlos como candidatos a términos del dominio. Finalmente, se evalúa la precisión de las categorizaciones y, posteriormente, con el asesoramiento de profesionales del área de medicina, se verifica la posibilidad que tienen los candidatos a términos extraídos de ser promovidos a términos. En trabajo computacional, se utilizan las herramientas Smorph [1] y Módulo Post-Smorph (MPS) [2]. Smorph realiza el análisis morfológico y MPS trabaja sobre gramáticas locales.
Sociedad Argentina de Informática e Investigación Operativa
Materia
Ciencias Informáticas
Terminología Médica
Extracción automática
Candidatos a término
Smorph
MPS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
SEDICI (UNLP)
Institución
Universidad Nacional de La Plata
OAI Identificador
oai:sedici.unlp.edu.ar:10915/124191

id SEDICI_463711b32334f79834dc64951721c754
oai_identifier_str oai:sedici.unlp.edu.ar:10915/124191
network_acronym_str SEDICI
repository_id_str 1329
network_name_str SEDICI (UNLP)
spelling Extracción de Candidatos a Términos del Dominio Médico a Partir de la categorización automática de PalabrasKoza, W.Ciencias InformáticasTerminología MédicaExtracción automáticaCandidatos a términoSmorphMPSSe presenta una serie de experimentos con el objetivo de desarrollar un método automático de extracción terminológica del dominio de la medicina. Uno de los inconvenientes típicos es el cambio constante de la terminología médica, que imposibilita mantener terminologías actualizadas inmediatamente por medios manuales. Se parte de la hipótesis de que las palabras incluidas en los textos médicos que no aparecen en el diccionario fuente del software analizador, denominadas PD, son, en su mayoría, expresiones específicas del dominio médico, por lo cual, una categorización automática de estas ayudaría en la extracción. Primeramente, se intenta deducir a qué categoría pertenecen las PD mediante reglas de formación de palabras (1er. Nivel de análisis) y sintácticas (2do. Nivel de análisis). Luego, se procede a la conformación de sintagmas nominales que involucren PD, para extraerlos como candidatos a términos del dominio. Finalmente, se evalúa la precisión de las categorizaciones y, posteriormente, con el asesoramiento de profesionales del área de medicina, se verifica la posibilidad que tienen los candidatos a términos extraídos de ser promovidos a términos. En trabajo computacional, se utilizan las herramientas Smorph [1] y Módulo Post-Smorph (MPS) [2]. Smorph realiza el análisis morfológico y MPS trabaja sobre gramáticas locales.Sociedad Argentina de Informática e Investigación Operativa2012-08info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf153-160http://sedici.unlp.edu.ar/handle/10915/124191spainfo:eu-repo/semantics/altIdentifier/url/https://41jaiio.sadio.org.ar/sites/default/files/11_CAIS_2012.pdfinfo:eu-repo/semantics/altIdentifier/issn/1853-1881info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:29:58Zoai:sedici.unlp.edu.ar:10915/124191Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:29:58.428SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv Extracción de Candidatos a Términos del Dominio Médico a Partir de la categorización automática de Palabras
title Extracción de Candidatos a Términos del Dominio Médico a Partir de la categorización automática de Palabras
spellingShingle Extracción de Candidatos a Términos del Dominio Médico a Partir de la categorización automática de Palabras
Koza, W.
Ciencias Informáticas
Terminología Médica
Extracción automática
Candidatos a término
Smorph
MPS
title_short Extracción de Candidatos a Términos del Dominio Médico a Partir de la categorización automática de Palabras
title_full Extracción de Candidatos a Términos del Dominio Médico a Partir de la categorización automática de Palabras
title_fullStr Extracción de Candidatos a Términos del Dominio Médico a Partir de la categorización automática de Palabras
title_full_unstemmed Extracción de Candidatos a Términos del Dominio Médico a Partir de la categorización automática de Palabras
title_sort Extracción de Candidatos a Términos del Dominio Médico a Partir de la categorización automática de Palabras
dc.creator.none.fl_str_mv Koza, W.
author Koza, W.
author_facet Koza, W.
author_role author
dc.subject.none.fl_str_mv Ciencias Informáticas
Terminología Médica
Extracción automática
Candidatos a término
Smorph
MPS
topic Ciencias Informáticas
Terminología Médica
Extracción automática
Candidatos a término
Smorph
MPS
dc.description.none.fl_txt_mv Se presenta una serie de experimentos con el objetivo de desarrollar un método automático de extracción terminológica del dominio de la medicina. Uno de los inconvenientes típicos es el cambio constante de la terminología médica, que imposibilita mantener terminologías actualizadas inmediatamente por medios manuales. Se parte de la hipótesis de que las palabras incluidas en los textos médicos que no aparecen en el diccionario fuente del software analizador, denominadas PD, son, en su mayoría, expresiones específicas del dominio médico, por lo cual, una categorización automática de estas ayudaría en la extracción. Primeramente, se intenta deducir a qué categoría pertenecen las PD mediante reglas de formación de palabras (1er. Nivel de análisis) y sintácticas (2do. Nivel de análisis). Luego, se procede a la conformación de sintagmas nominales que involucren PD, para extraerlos como candidatos a términos del dominio. Finalmente, se evalúa la precisión de las categorizaciones y, posteriormente, con el asesoramiento de profesionales del área de medicina, se verifica la posibilidad que tienen los candidatos a términos extraídos de ser promovidos a términos. En trabajo computacional, se utilizan las herramientas Smorph [1] y Módulo Post-Smorph (MPS) [2]. Smorph realiza el análisis morfológico y MPS trabaja sobre gramáticas locales.
Sociedad Argentina de Informática e Investigación Operativa
description Se presenta una serie de experimentos con el objetivo de desarrollar un método automático de extracción terminológica del dominio de la medicina. Uno de los inconvenientes típicos es el cambio constante de la terminología médica, que imposibilita mantener terminologías actualizadas inmediatamente por medios manuales. Se parte de la hipótesis de que las palabras incluidas en los textos médicos que no aparecen en el diccionario fuente del software analizador, denominadas PD, son, en su mayoría, expresiones específicas del dominio médico, por lo cual, una categorización automática de estas ayudaría en la extracción. Primeramente, se intenta deducir a qué categoría pertenecen las PD mediante reglas de formación de palabras (1er. Nivel de análisis) y sintácticas (2do. Nivel de análisis). Luego, se procede a la conformación de sintagmas nominales que involucren PD, para extraerlos como candidatos a términos del dominio. Finalmente, se evalúa la precisión de las categorizaciones y, posteriormente, con el asesoramiento de profesionales del área de medicina, se verifica la posibilidad que tienen los candidatos a términos extraídos de ser promovidos a términos. En trabajo computacional, se utilizan las herramientas Smorph [1] y Módulo Post-Smorph (MPS) [2]. Smorph realiza el análisis morfológico y MPS trabaja sobre gramáticas locales.
publishDate 2012
dc.date.none.fl_str_mv 2012-08
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
Objeto de conferencia
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv http://sedici.unlp.edu.ar/handle/10915/124191
url http://sedici.unlp.edu.ar/handle/10915/124191
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://41jaiio.sadio.org.ar/sites/default/files/11_CAIS_2012.pdf
info:eu-repo/semantics/altIdentifier/issn/1853-1881
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv application/pdf
153-160
dc.source.none.fl_str_mv reponame:SEDICI (UNLP)
instname:Universidad Nacional de La Plata
instacron:UNLP
reponame_str SEDICI (UNLP)
collection SEDICI (UNLP)
instname_str Universidad Nacional de La Plata
instacron_str UNLP
institution UNLP
repository.name.fl_str_mv SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv alira@sedici.unlp.edu.ar
_version_ 1844616178555682816
score 13.070432