Marcadores discursivos del español: Descripción y propuesta de detección automática
- Autores
- Koza, Walter Adrián
- Año de publicación
- 2010
- Idioma
- español castellano
- Tipo de recurso
- artículo
- Estado
- versión publicada
- Descripción
- En este artículo se presenta un método de detección automática de los marcadores discursivos del español. Los marcadores discursivos son elementos marginales que establecen relaciones entre segmentos textuales con el objetivo de guiar y ordenar la lectura. El reconocimiento de estas construcciones es de gran importancia para varias tareas de la lingüística computacional. No obstante, uno de los problemas que puede suscitarse es el caso de construcciones ambiguas, es decir, sintagmas que actúan como marcadores discursivos en determinados contextos y en otros no. La puntuación cumple un papel importante para solucionar este tipo de inconvenientes y Prada formula una serie de hipótesis de desambiguación en las que hace hincapié en ella. El trabajo de implantación en máquina está basado en dichas hipótesis. En esta ocasión, se recurrió al software Smorph. Smorph es un analizador y generador textual que en una única etapa realiza la delimitación previa de los segmentos a considerar y el análisis morfológico. Con el método de detección propuesto, se logró una precisión del 98% y una cobertura del 97%.
This article presents a method for the automatic detection of discourse markers in the Spanish language. Discourse markers are marginal elements which establish relationships among text segments with the aim of signalling and organizing the reading. The recognition of these constructions is of great importance for several computational lingüistics tasks. Nevertheless, one of the problems possibly developing is that of ambiguous constructions, that is to say, syntagms acting as discourse markers in some given contexts but not in others. Punctuation leads an important role to solve this kind of drawbacks and Prada puts forward a series of disambiguation hypotheses, putting emphasis upon it. The implantation-in-machine work is based on such hypotheses. On this occasion, software Smorph was employed. Smorph is a text analyser and generator which performs the previous delimitation of the segments to be considered and the morphological analysis, all in only one stage. With the detection method proposed, a 98% precision and a 97% coverage were achieved.
Fil: Koza, Walter Adrián. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario; Argentina. Universidad Nacional de Rosario. Facultad de Humanidades y Artes. Centro de Est.de Adquisición del Lenguaje; Argentina - Materia
-
MARCADORES DISCURSIVOS
LINGÜÍSTICA COMPUTACIONAL
PUNTUACIÓN
COMA - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
- Repositorio
- Institución
- Consejo Nacional de Investigaciones Científicas y Técnicas
- OAI Identificador
- oai:ri.conicet.gov.ar:11336/242012
Ver los metadatos del registro completo
id |
CONICETDig_d4b1b11bc0953266b6c486925fbaaa60 |
---|---|
oai_identifier_str |
oai:ri.conicet.gov.ar:11336/242012 |
network_acronym_str |
CONICETDig |
repository_id_str |
3498 |
network_name_str |
CONICET Digital (CONICET) |
spelling |
Marcadores discursivos del español: Descripción y propuesta de detección automáticaDiscourse markers in the Spanish language: Description and proposal of automatic detectionKoza, Walter AdriánMARCADORES DISCURSIVOSLINGÜÍSTICA COMPUTACIONALPUNTUACIÓNCOMAhttps://purl.org/becyt/ford/6.2https://purl.org/becyt/ford/6En este artículo se presenta un método de detección automática de los marcadores discursivos del español. Los marcadores discursivos son elementos marginales que establecen relaciones entre segmentos textuales con el objetivo de guiar y ordenar la lectura. El reconocimiento de estas construcciones es de gran importancia para varias tareas de la lingüística computacional. No obstante, uno de los problemas que puede suscitarse es el caso de construcciones ambiguas, es decir, sintagmas que actúan como marcadores discursivos en determinados contextos y en otros no. La puntuación cumple un papel importante para solucionar este tipo de inconvenientes y Prada formula una serie de hipótesis de desambiguación en las que hace hincapié en ella. El trabajo de implantación en máquina está basado en dichas hipótesis. En esta ocasión, se recurrió al software Smorph. Smorph es un analizador y generador textual que en una única etapa realiza la delimitación previa de los segmentos a considerar y el análisis morfológico. Con el método de detección propuesto, se logró una precisión del 98% y una cobertura del 97%.This article presents a method for the automatic detection of discourse markers in the Spanish language. Discourse markers are marginal elements which establish relationships among text segments with the aim of signalling and organizing the reading. The recognition of these constructions is of great importance for several computational lingüistics tasks. Nevertheless, one of the problems possibly developing is that of ambiguous constructions, that is to say, syntagms acting as discourse markers in some given contexts but not in others. Punctuation leads an important role to solve this kind of drawbacks and Prada puts forward a series of disambiguation hypotheses, putting emphasis upon it. The implantation-in-machine work is based on such hypotheses. On this occasion, software Smorph was employed. Smorph is a text analyser and generator which performs the previous delimitation of the segments to be considered and the morphological analysis, all in only one stage. With the detection method proposed, a 98% precision and a 97% coverage were achieved.Fil: Koza, Walter Adrián. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario; Argentina. Universidad Nacional de Rosario. Facultad de Humanidades y Artes. Centro de Est.de Adquisición del Lenguaje; ArgentinaUniversidad Nacional del Litoral; Universidad Nacional de Rosario2010-03info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/242012Koza, Walter Adrián; Marcadores discursivos del español: Descripción y propuesta de detección automática; Universidad Nacional del Litoral; Universidad Nacional de Rosario; Revista de Epistemología y Ciencias Humanas; 2; 3-2010; 109-1201852-625XCONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/https://www.revistaepistemologia.com.ar/wp-content/uploads/2018/09/www.revistaepistemologia.com.ar-r02-11.koza-.pdfinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-10T13:03:05Zoai:ri.conicet.gov.ar:11336/242012instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-10 13:03:05.546CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse |
dc.title.none.fl_str_mv |
Marcadores discursivos del español: Descripción y propuesta de detección automática Discourse markers in the Spanish language: Description and proposal of automatic detection |
title |
Marcadores discursivos del español: Descripción y propuesta de detección automática |
spellingShingle |
Marcadores discursivos del español: Descripción y propuesta de detección automática Koza, Walter Adrián MARCADORES DISCURSIVOS LINGÜÍSTICA COMPUTACIONAL PUNTUACIÓN COMA |
title_short |
Marcadores discursivos del español: Descripción y propuesta de detección automática |
title_full |
Marcadores discursivos del español: Descripción y propuesta de detección automática |
title_fullStr |
Marcadores discursivos del español: Descripción y propuesta de detección automática |
title_full_unstemmed |
Marcadores discursivos del español: Descripción y propuesta de detección automática |
title_sort |
Marcadores discursivos del español: Descripción y propuesta de detección automática |
dc.creator.none.fl_str_mv |
Koza, Walter Adrián |
author |
Koza, Walter Adrián |
author_facet |
Koza, Walter Adrián |
author_role |
author |
dc.subject.none.fl_str_mv |
MARCADORES DISCURSIVOS LINGÜÍSTICA COMPUTACIONAL PUNTUACIÓN COMA |
topic |
MARCADORES DISCURSIVOS LINGÜÍSTICA COMPUTACIONAL PUNTUACIÓN COMA |
purl_subject.fl_str_mv |
https://purl.org/becyt/ford/6.2 https://purl.org/becyt/ford/6 |
dc.description.none.fl_txt_mv |
En este artículo se presenta un método de detección automática de los marcadores discursivos del español. Los marcadores discursivos son elementos marginales que establecen relaciones entre segmentos textuales con el objetivo de guiar y ordenar la lectura. El reconocimiento de estas construcciones es de gran importancia para varias tareas de la lingüística computacional. No obstante, uno de los problemas que puede suscitarse es el caso de construcciones ambiguas, es decir, sintagmas que actúan como marcadores discursivos en determinados contextos y en otros no. La puntuación cumple un papel importante para solucionar este tipo de inconvenientes y Prada formula una serie de hipótesis de desambiguación en las que hace hincapié en ella. El trabajo de implantación en máquina está basado en dichas hipótesis. En esta ocasión, se recurrió al software Smorph. Smorph es un analizador y generador textual que en una única etapa realiza la delimitación previa de los segmentos a considerar y el análisis morfológico. Con el método de detección propuesto, se logró una precisión del 98% y una cobertura del 97%. This article presents a method for the automatic detection of discourse markers in the Spanish language. Discourse markers are marginal elements which establish relationships among text segments with the aim of signalling and organizing the reading. The recognition of these constructions is of great importance for several computational lingüistics tasks. Nevertheless, one of the problems possibly developing is that of ambiguous constructions, that is to say, syntagms acting as discourse markers in some given contexts but not in others. Punctuation leads an important role to solve this kind of drawbacks and Prada puts forward a series of disambiguation hypotheses, putting emphasis upon it. The implantation-in-machine work is based on such hypotheses. On this occasion, software Smorph was employed. Smorph is a text analyser and generator which performs the previous delimitation of the segments to be considered and the morphological analysis, all in only one stage. With the detection method proposed, a 98% precision and a 97% coverage were achieved. Fil: Koza, Walter Adrián. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario; Argentina. Universidad Nacional de Rosario. Facultad de Humanidades y Artes. Centro de Est.de Adquisición del Lenguaje; Argentina |
description |
En este artículo se presenta un método de detección automática de los marcadores discursivos del español. Los marcadores discursivos son elementos marginales que establecen relaciones entre segmentos textuales con el objetivo de guiar y ordenar la lectura. El reconocimiento de estas construcciones es de gran importancia para varias tareas de la lingüística computacional. No obstante, uno de los problemas que puede suscitarse es el caso de construcciones ambiguas, es decir, sintagmas que actúan como marcadores discursivos en determinados contextos y en otros no. La puntuación cumple un papel importante para solucionar este tipo de inconvenientes y Prada formula una serie de hipótesis de desambiguación en las que hace hincapié en ella. El trabajo de implantación en máquina está basado en dichas hipótesis. En esta ocasión, se recurrió al software Smorph. Smorph es un analizador y generador textual que en una única etapa realiza la delimitación previa de los segmentos a considerar y el análisis morfológico. Con el método de detección propuesto, se logró una precisión del 98% y una cobertura del 97%. |
publishDate |
2010 |
dc.date.none.fl_str_mv |
2010-03 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo |
format |
article |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11336/242012 Koza, Walter Adrián; Marcadores discursivos del español: Descripción y propuesta de detección automática; Universidad Nacional del Litoral; Universidad Nacional de Rosario; Revista de Epistemología y Ciencias Humanas; 2; 3-2010; 109-120 1852-625X CONICET Digital CONICET |
url |
http://hdl.handle.net/11336/242012 |
identifier_str_mv |
Koza, Walter Adrián; Marcadores discursivos del español: Descripción y propuesta de detección automática; Universidad Nacional del Litoral; Universidad Nacional de Rosario; Revista de Epistemología y Ciencias Humanas; 2; 3-2010; 109-120 1852-625X CONICET Digital CONICET |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/url/https://www.revistaepistemologia.com.ar/wp-content/uploads/2018/09/www.revistaepistemologia.com.ar-r02-11.koza-.pdf |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ |
dc.format.none.fl_str_mv |
application/pdf application/pdf application/pdf |
dc.publisher.none.fl_str_mv |
Universidad Nacional del Litoral; Universidad Nacional de Rosario |
publisher.none.fl_str_mv |
Universidad Nacional del Litoral; Universidad Nacional de Rosario |
dc.source.none.fl_str_mv |
reponame:CONICET Digital (CONICET) instname:Consejo Nacional de Investigaciones Científicas y Técnicas |
reponame_str |
CONICET Digital (CONICET) |
collection |
CONICET Digital (CONICET) |
instname_str |
Consejo Nacional de Investigaciones Científicas y Técnicas |
repository.name.fl_str_mv |
CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas |
repository.mail.fl_str_mv |
dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar |
_version_ |
1842980059277688832 |
score |
12.993085 |