Marcadores discursivos del español: Descripción y propuesta de detección automática

Autores
Koza, Walter Adrián
Año de publicación
2010
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
En este artículo se presenta un método de detección automática de los marcadores discursivos del español. Los marcadores discursivos son elementos marginales que establecen relaciones entre segmentos textuales con el objetivo de guiar y ordenar la lectura. El reconocimiento de estas construcciones es de gran importancia para varias tareas de la lingüística computacional. No obstante, uno de los problemas que puede suscitarse es el caso de construcciones ambiguas, es decir, sintagmas que actúan como marcadores discursivos en determinados contextos y en otros no. La puntuación cumple un papel importante para solucionar este tipo de inconvenientes y Prada formula una serie de hipótesis de desambiguación en las que hace hincapié en ella. El trabajo de implantación en máquina está basado en dichas hipótesis. En esta ocasión, se recurrió al software Smorph. Smorph es un analizador y generador textual que en una única etapa realiza la delimitación previa de los segmentos a considerar y el análisis morfológico. Con el método de detección propuesto, se logró una precisión del 98% y una cobertura del 97%.
This article presents a method for the automatic detection of discourse markers in the Spanish language. Discourse markers are marginal elements which establish relationships among text segments with the aim of signalling and organizing the reading. The recognition of these constructions is of great importance for several computational lingüistics tasks. Nevertheless, one of the problems possibly developing is that of ambiguous constructions, that is to say, syntagms acting as discourse markers in some given contexts but not in others. Punctuation leads an important role to solve this kind of drawbacks and Prada puts forward a series of disambiguation hypotheses, putting emphasis upon it. The implantation-in-machine work is based on such hypotheses. On this occasion, software Smorph was employed. Smorph is a text analyser and generator which performs the previous delimitation of the segments to be considered and the morphological analysis, all in only one stage. With the detection method proposed, a 98% precision and a 97% coverage were achieved.
Fil: Koza, Walter Adrián. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario; Argentina. Universidad Nacional de Rosario. Facultad de Humanidades y Artes. Centro de Est.de Adquisición del Lenguaje; Argentina
Materia
MARCADORES DISCURSIVOS
LINGÜÍSTICA COMPUTACIONAL
PUNTUACIÓN
COMA
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/242012

id CONICETDig_d4b1b11bc0953266b6c486925fbaaa60
oai_identifier_str oai:ri.conicet.gov.ar:11336/242012
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Marcadores discursivos del español: Descripción y propuesta de detección automáticaDiscourse markers in the Spanish language: Description and proposal of automatic detectionKoza, Walter AdriánMARCADORES DISCURSIVOSLINGÜÍSTICA COMPUTACIONALPUNTUACIÓNCOMAhttps://purl.org/becyt/ford/6.2https://purl.org/becyt/ford/6En este artículo se presenta un método de detección automática de los marcadores discursivos del español. Los marcadores discursivos son elementos marginales que establecen relaciones entre segmentos textuales con el objetivo de guiar y ordenar la lectura. El reconocimiento de estas construcciones es de gran importancia para varias tareas de la lingüística computacional. No obstante, uno de los problemas que puede suscitarse es el caso de construcciones ambiguas, es decir, sintagmas que actúan como marcadores discursivos en determinados contextos y en otros no. La puntuación cumple un papel importante para solucionar este tipo de inconvenientes y Prada formula una serie de hipótesis de desambiguación en las que hace hincapié en ella. El trabajo de implantación en máquina está basado en dichas hipótesis. En esta ocasión, se recurrió al software Smorph. Smorph es un analizador y generador textual que en una única etapa realiza la delimitación previa de los segmentos a considerar y el análisis morfológico. Con el método de detección propuesto, se logró una precisión del 98% y una cobertura del 97%.This article presents a method for the automatic detection of discourse markers in the Spanish language. Discourse markers are marginal elements which establish relationships among text segments with the aim of signalling and organizing the reading. The recognition of these constructions is of great importance for several computational lingüistics tasks. Nevertheless, one of the problems possibly developing is that of ambiguous constructions, that is to say, syntagms acting as discourse markers in some given contexts but not in others. Punctuation leads an important role to solve this kind of drawbacks and Prada puts forward a series of disambiguation hypotheses, putting emphasis upon it. The implantation-in-machine work is based on such hypotheses. On this occasion, software Smorph was employed. Smorph is a text analyser and generator which performs the previous delimitation of the segments to be considered and the morphological analysis, all in only one stage. With the detection method proposed, a 98% precision and a 97% coverage were achieved.Fil: Koza, Walter Adrián. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario; Argentina. Universidad Nacional de Rosario. Facultad de Humanidades y Artes. Centro de Est.de Adquisición del Lenguaje; ArgentinaUniversidad Nacional del Litoral; Universidad Nacional de Rosario2010-03info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/242012Koza, Walter Adrián; Marcadores discursivos del español: Descripción y propuesta de detección automática; Universidad Nacional del Litoral; Universidad Nacional de Rosario; Revista de Epistemología y Ciencias Humanas; 2; 3-2010; 109-1201852-625XCONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/https://www.revistaepistemologia.com.ar/wp-content/uploads/2018/09/www.revistaepistemologia.com.ar-r02-11.koza-.pdfinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-10T13:03:05Zoai:ri.conicet.gov.ar:11336/242012instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-10 13:03:05.546CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Marcadores discursivos del español: Descripción y propuesta de detección automática
Discourse markers in the Spanish language: Description and proposal of automatic detection
title Marcadores discursivos del español: Descripción y propuesta de detección automática
spellingShingle Marcadores discursivos del español: Descripción y propuesta de detección automática
Koza, Walter Adrián
MARCADORES DISCURSIVOS
LINGÜÍSTICA COMPUTACIONAL
PUNTUACIÓN
COMA
title_short Marcadores discursivos del español: Descripción y propuesta de detección automática
title_full Marcadores discursivos del español: Descripción y propuesta de detección automática
title_fullStr Marcadores discursivos del español: Descripción y propuesta de detección automática
title_full_unstemmed Marcadores discursivos del español: Descripción y propuesta de detección automática
title_sort Marcadores discursivos del español: Descripción y propuesta de detección automática
dc.creator.none.fl_str_mv Koza, Walter Adrián
author Koza, Walter Adrián
author_facet Koza, Walter Adrián
author_role author
dc.subject.none.fl_str_mv MARCADORES DISCURSIVOS
LINGÜÍSTICA COMPUTACIONAL
PUNTUACIÓN
COMA
topic MARCADORES DISCURSIVOS
LINGÜÍSTICA COMPUTACIONAL
PUNTUACIÓN
COMA
purl_subject.fl_str_mv https://purl.org/becyt/ford/6.2
https://purl.org/becyt/ford/6
dc.description.none.fl_txt_mv En este artículo se presenta un método de detección automática de los marcadores discursivos del español. Los marcadores discursivos son elementos marginales que establecen relaciones entre segmentos textuales con el objetivo de guiar y ordenar la lectura. El reconocimiento de estas construcciones es de gran importancia para varias tareas de la lingüística computacional. No obstante, uno de los problemas que puede suscitarse es el caso de construcciones ambiguas, es decir, sintagmas que actúan como marcadores discursivos en determinados contextos y en otros no. La puntuación cumple un papel importante para solucionar este tipo de inconvenientes y Prada formula una serie de hipótesis de desambiguación en las que hace hincapié en ella. El trabajo de implantación en máquina está basado en dichas hipótesis. En esta ocasión, se recurrió al software Smorph. Smorph es un analizador y generador textual que en una única etapa realiza la delimitación previa de los segmentos a considerar y el análisis morfológico. Con el método de detección propuesto, se logró una precisión del 98% y una cobertura del 97%.
This article presents a method for the automatic detection of discourse markers in the Spanish language. Discourse markers are marginal elements which establish relationships among text segments with the aim of signalling and organizing the reading. The recognition of these constructions is of great importance for several computational lingüistics tasks. Nevertheless, one of the problems possibly developing is that of ambiguous constructions, that is to say, syntagms acting as discourse markers in some given contexts but not in others. Punctuation leads an important role to solve this kind of drawbacks and Prada puts forward a series of disambiguation hypotheses, putting emphasis upon it. The implantation-in-machine work is based on such hypotheses. On this occasion, software Smorph was employed. Smorph is a text analyser and generator which performs the previous delimitation of the segments to be considered and the morphological analysis, all in only one stage. With the detection method proposed, a 98% precision and a 97% coverage were achieved.
Fil: Koza, Walter Adrián. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario; Argentina. Universidad Nacional de Rosario. Facultad de Humanidades y Artes. Centro de Est.de Adquisición del Lenguaje; Argentina
description En este artículo se presenta un método de detección automática de los marcadores discursivos del español. Los marcadores discursivos son elementos marginales que establecen relaciones entre segmentos textuales con el objetivo de guiar y ordenar la lectura. El reconocimiento de estas construcciones es de gran importancia para varias tareas de la lingüística computacional. No obstante, uno de los problemas que puede suscitarse es el caso de construcciones ambiguas, es decir, sintagmas que actúan como marcadores discursivos en determinados contextos y en otros no. La puntuación cumple un papel importante para solucionar este tipo de inconvenientes y Prada formula una serie de hipótesis de desambiguación en las que hace hincapié en ella. El trabajo de implantación en máquina está basado en dichas hipótesis. En esta ocasión, se recurrió al software Smorph. Smorph es un analizador y generador textual que en una única etapa realiza la delimitación previa de los segmentos a considerar y el análisis morfológico. Con el método de detección propuesto, se logró una precisión del 98% y una cobertura del 97%.
publishDate 2010
dc.date.none.fl_str_mv 2010-03
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/242012
Koza, Walter Adrián; Marcadores discursivos del español: Descripción y propuesta de detección automática; Universidad Nacional del Litoral; Universidad Nacional de Rosario; Revista de Epistemología y Ciencias Humanas; 2; 3-2010; 109-120
1852-625X
CONICET Digital
CONICET
url http://hdl.handle.net/11336/242012
identifier_str_mv Koza, Walter Adrián; Marcadores discursivos del español: Descripción y propuesta de detección automática; Universidad Nacional del Litoral; Universidad Nacional de Rosario; Revista de Epistemología y Ciencias Humanas; 2; 3-2010; 109-120
1852-625X
CONICET Digital
CONICET
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/https://www.revistaepistemologia.com.ar/wp-content/uploads/2018/09/www.revistaepistemologia.com.ar-r02-11.koza-.pdf
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional del Litoral; Universidad Nacional de Rosario
publisher.none.fl_str_mv Universidad Nacional del Litoral; Universidad Nacional de Rosario
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1842980059277688832
score 12.993085