Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping
- Autores
- Castel, Victor Miguel
- Año de publicación
- 2006
- Idioma
- inglés
- Tipo de recurso
- artículo
- Estado
- versión publicada
- Descripción
- The research article abstract (RAA) has been the focus of numerous investigations within both the Systemic Functional Linguistics (SFL) and the Natural Language Processing (NLP) communities, and from both the text generation and the text analysis/parsing perspectives. Given the complexity of the object of study, however, there is still a need for extensive studies of the RAA which provide detailed descriptive generalizations on the relationship between context and language which are corpus-based, formally defined and computationally implemented. These three conditions appear to be central to any Natural Language Generation (NLG) project whose long-term goal is simultaneously to model the systemic-functional unity and diversity found in RAAs, and to use the resulting model in the development of tools for interactive rhetorical and linguistic assistance in RAA writing. This is the leading goal of the RedACTe Project one of whose theoretical-descriptive results is presented here. The basic formal mechanism used by the Cardiff Grammar for the generation of text-sentences is adapted and extended to capture systematic correlations between higher (genre and register) and lower (lexicogrammar) strata features of RAAs of the RedACTe Project's sample disciplines. Generation rules are defined, both within any one stratum and between strata, for mapping genre onto semantics and semantics onto form - and so text proper.
El Abstract del Artículo de Investigación Científica en Inglés (AbAICI) ha sido, y aún lo es, el foco de atención de numerosas investigaciones tanto desde la perspectiva de la Lingüística Sistémica Funcional (SFL) como desde la perspectiva del Procesamiento Automático de Lenguas Naturales (NLP). Dada la complejidad del objeto de estudio, sin embargo, es todavía necesario llevar a cabo estudios extensivos del AbAICI que provean generalizaciones descriptivas detalladas acerca de la relación entre contexto y lengua que estén basadas en corpus, definidas formalmente e implementadas computacionalmente. Estas tres condiciones parecen ser centrales para cualquier proyecto de Generación de Lengua Natural (NLG) cuyo objetivo a largo plazo sea simultáneamente modelizar la unidad y la diversidad sistémico-funcional encontrada en los AbAICIs, y utilizar el modelo resultante en el desarrollo de herramientas para la asistencia retórica y lingüística en la escritura interactiva de AbAICIs. Este es el objetivo central del Proyecto RedACTe, uno de cuyos resultados teórico-descriptivos se presenta aquí. El mecanismo formal básico utilizado por la Gramática de Cardiff para la generación de oraciones-texto es adaptado y extendido para expresar correlaciones sistemáticas entre rasgos de estratos superiores (género y registro) y rasgos de estratos inferiores (léxico-gramática) de AbAICIs de la muestra disciplinar del Proyecto RedACTe. Definimos reglas de generación, tanto dentro de cada estrato como entre estratos, para la proyección del género en la semántica y la semántica en la forma, y así en el texto propiamente dicho
Fil: Castel, Victor Miguel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Mendoza. Instituto de Ciencias Humanas, Sociales y Ambientales; Argentina. Universidad Nacional de Cuyo; Argentina - Materia
-
Natural language generation
Natural language processing
Systemic functional linguistics
Corpus linguistics
Computational linguistics
Generación del lenguaje natural
Procesamiento del lenguaje natural
Lingüística sistémico-funcional
Lingüística de corpus
Lingüística computacional - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
- Repositorio
- Institución
- Consejo Nacional de Investigaciones Científicas y Técnicas
- OAI Identificador
- oai:ri.conicet.gov.ar:11336/40242
Ver los metadatos del registro completo
id |
CONICETDig_1a0e8b4a2368ead24bc7dcd841db3ba0 |
---|---|
oai_identifier_str |
oai:ri.conicet.gov.ar:11336/40242 |
network_acronym_str |
CONICETDig |
repository_id_str |
3498 |
network_name_str |
CONICET Digital (CONICET) |
spelling |
Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mappingGeneración de abstracts a partir de la estructura de género vía la léxico-gramática: Modelización de selección y proyección de rasgosCastel, Victor MiguelNatural language generationNatural language processingSystemic functional linguisticsCorpus linguisticsComputational linguisticsGeneración del lenguaje naturalProcesamiento del lenguaje naturalLingüística sistémico-funcionalLingüística de corpusLingüística computacionalhttps://purl.org/becyt/ford/6.2https://purl.org/becyt/ford/6The research article abstract (RAA) has been the focus of numerous investigations within both the Systemic Functional Linguistics (SFL) and the Natural Language Processing (NLP) communities, and from both the text generation and the text analysis/parsing perspectives. Given the complexity of the object of study, however, there is still a need for extensive studies of the RAA which provide detailed descriptive generalizations on the relationship between context and language which are corpus-based, formally defined and computationally implemented. These three conditions appear to be central to any Natural Language Generation (NLG) project whose long-term goal is simultaneously to model the systemic-functional unity and diversity found in RAAs, and to use the resulting model in the development of tools for interactive rhetorical and linguistic assistance in RAA writing. This is the leading goal of the RedACTe Project one of whose theoretical-descriptive results is presented here. The basic formal mechanism used by the Cardiff Grammar for the generation of text-sentences is adapted and extended to capture systematic correlations between higher (genre and register) and lower (lexicogrammar) strata features of RAAs of the RedACTe Project's sample disciplines. Generation rules are defined, both within any one stratum and between strata, for mapping genre onto semantics and semantics onto form - and so text proper.El Abstract del Artículo de Investigación Científica en Inglés (AbAICI) ha sido, y aún lo es, el foco de atención de numerosas investigaciones tanto desde la perspectiva de la Lingüística Sistémica Funcional (SFL) como desde la perspectiva del Procesamiento Automático de Lenguas Naturales (NLP). Dada la complejidad del objeto de estudio, sin embargo, es todavía necesario llevar a cabo estudios extensivos del AbAICI que provean generalizaciones descriptivas detalladas acerca de la relación entre contexto y lengua que estén basadas en corpus, definidas formalmente e implementadas computacionalmente. Estas tres condiciones parecen ser centrales para cualquier proyecto de Generación de Lengua Natural (NLG) cuyo objetivo a largo plazo sea simultáneamente modelizar la unidad y la diversidad sistémico-funcional encontrada en los AbAICIs, y utilizar el modelo resultante en el desarrollo de herramientas para la asistencia retórica y lingüística en la escritura interactiva de AbAICIs. Este es el objetivo central del Proyecto RedACTe, uno de cuyos resultados teórico-descriptivos se presenta aquí. El mecanismo formal básico utilizado por la Gramática de Cardiff para la generación de oraciones-texto es adaptado y extendido para expresar correlaciones sistemáticas entre rasgos de estratos superiores (género y registro) y rasgos de estratos inferiores (léxico-gramática) de AbAICIs de la muestra disciplinar del Proyecto RedACTe. Definimos reglas de generación, tanto dentro de cada estrato como entre estratos, para la proyección del género en la semántica y la semántica en la forma, y así en el texto propiamente dichoFil: Castel, Victor Miguel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Mendoza. Instituto de Ciencias Humanas, Sociales y Ambientales; Argentina. Universidad Nacional de Cuyo; ArgentinaUniversidad Católica de Valparaíso2006-12info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/40242Castel, Victor Miguel; Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping; Universidad Católica de Valparaíso; Revista signos; 39; 62; 12-2006; 326-3540035-04510718-0934CONICET DigitalCONICETenginfo:eu-repo/semantics/altIdentifier/doi/10.4067/S0718-09342006000300001info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-03T09:55:05Zoai:ri.conicet.gov.ar:11336/40242instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-03 09:55:05.293CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse |
dc.title.none.fl_str_mv |
Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping Generación de abstracts a partir de la estructura de género vía la léxico-gramática: Modelización de selección y proyección de rasgos |
title |
Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping |
spellingShingle |
Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping Castel, Victor Miguel Natural language generation Natural language processing Systemic functional linguistics Corpus linguistics Computational linguistics Generación del lenguaje natural Procesamiento del lenguaje natural Lingüística sistémico-funcional Lingüística de corpus Lingüística computacional |
title_short |
Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping |
title_full |
Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping |
title_fullStr |
Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping |
title_full_unstemmed |
Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping |
title_sort |
Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping |
dc.creator.none.fl_str_mv |
Castel, Victor Miguel |
author |
Castel, Victor Miguel |
author_facet |
Castel, Victor Miguel |
author_role |
author |
dc.subject.none.fl_str_mv |
Natural language generation Natural language processing Systemic functional linguistics Corpus linguistics Computational linguistics Generación del lenguaje natural Procesamiento del lenguaje natural Lingüística sistémico-funcional Lingüística de corpus Lingüística computacional |
topic |
Natural language generation Natural language processing Systemic functional linguistics Corpus linguistics Computational linguistics Generación del lenguaje natural Procesamiento del lenguaje natural Lingüística sistémico-funcional Lingüística de corpus Lingüística computacional |
purl_subject.fl_str_mv |
https://purl.org/becyt/ford/6.2 https://purl.org/becyt/ford/6 |
dc.description.none.fl_txt_mv |
The research article abstract (RAA) has been the focus of numerous investigations within both the Systemic Functional Linguistics (SFL) and the Natural Language Processing (NLP) communities, and from both the text generation and the text analysis/parsing perspectives. Given the complexity of the object of study, however, there is still a need for extensive studies of the RAA which provide detailed descriptive generalizations on the relationship between context and language which are corpus-based, formally defined and computationally implemented. These three conditions appear to be central to any Natural Language Generation (NLG) project whose long-term goal is simultaneously to model the systemic-functional unity and diversity found in RAAs, and to use the resulting model in the development of tools for interactive rhetorical and linguistic assistance in RAA writing. This is the leading goal of the RedACTe Project one of whose theoretical-descriptive results is presented here. The basic formal mechanism used by the Cardiff Grammar for the generation of text-sentences is adapted and extended to capture systematic correlations between higher (genre and register) and lower (lexicogrammar) strata features of RAAs of the RedACTe Project's sample disciplines. Generation rules are defined, both within any one stratum and between strata, for mapping genre onto semantics and semantics onto form - and so text proper. El Abstract del Artículo de Investigación Científica en Inglés (AbAICI) ha sido, y aún lo es, el foco de atención de numerosas investigaciones tanto desde la perspectiva de la Lingüística Sistémica Funcional (SFL) como desde la perspectiva del Procesamiento Automático de Lenguas Naturales (NLP). Dada la complejidad del objeto de estudio, sin embargo, es todavía necesario llevar a cabo estudios extensivos del AbAICI que provean generalizaciones descriptivas detalladas acerca de la relación entre contexto y lengua que estén basadas en corpus, definidas formalmente e implementadas computacionalmente. Estas tres condiciones parecen ser centrales para cualquier proyecto de Generación de Lengua Natural (NLG) cuyo objetivo a largo plazo sea simultáneamente modelizar la unidad y la diversidad sistémico-funcional encontrada en los AbAICIs, y utilizar el modelo resultante en el desarrollo de herramientas para la asistencia retórica y lingüística en la escritura interactiva de AbAICIs. Este es el objetivo central del Proyecto RedACTe, uno de cuyos resultados teórico-descriptivos se presenta aquí. El mecanismo formal básico utilizado por la Gramática de Cardiff para la generación de oraciones-texto es adaptado y extendido para expresar correlaciones sistemáticas entre rasgos de estratos superiores (género y registro) y rasgos de estratos inferiores (léxico-gramática) de AbAICIs de la muestra disciplinar del Proyecto RedACTe. Definimos reglas de generación, tanto dentro de cada estrato como entre estratos, para la proyección del género en la semántica y la semántica en la forma, y así en el texto propiamente dicho Fil: Castel, Victor Miguel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Mendoza. Instituto de Ciencias Humanas, Sociales y Ambientales; Argentina. Universidad Nacional de Cuyo; Argentina |
description |
The research article abstract (RAA) has been the focus of numerous investigations within both the Systemic Functional Linguistics (SFL) and the Natural Language Processing (NLP) communities, and from both the text generation and the text analysis/parsing perspectives. Given the complexity of the object of study, however, there is still a need for extensive studies of the RAA which provide detailed descriptive generalizations on the relationship between context and language which are corpus-based, formally defined and computationally implemented. These three conditions appear to be central to any Natural Language Generation (NLG) project whose long-term goal is simultaneously to model the systemic-functional unity and diversity found in RAAs, and to use the resulting model in the development of tools for interactive rhetorical and linguistic assistance in RAA writing. This is the leading goal of the RedACTe Project one of whose theoretical-descriptive results is presented here. The basic formal mechanism used by the Cardiff Grammar for the generation of text-sentences is adapted and extended to capture systematic correlations between higher (genre and register) and lower (lexicogrammar) strata features of RAAs of the RedACTe Project's sample disciplines. Generation rules are defined, both within any one stratum and between strata, for mapping genre onto semantics and semantics onto form - and so text proper. |
publishDate |
2006 |
dc.date.none.fl_str_mv |
2006-12 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo |
format |
article |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11336/40242 Castel, Victor Miguel; Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping; Universidad Católica de Valparaíso; Revista signos; 39; 62; 12-2006; 326-354 0035-0451 0718-0934 CONICET Digital CONICET |
url |
http://hdl.handle.net/11336/40242 |
identifier_str_mv |
Castel, Victor Miguel; Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping; Universidad Católica de Valparaíso; Revista signos; 39; 62; 12-2006; 326-354 0035-0451 0718-0934 CONICET Digital CONICET |
dc.language.none.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/doi/10.4067/S0718-09342006000300001 |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ |
dc.format.none.fl_str_mv |
application/pdf application/pdf |
dc.publisher.none.fl_str_mv |
Universidad Católica de Valparaíso |
publisher.none.fl_str_mv |
Universidad Católica de Valparaíso |
dc.source.none.fl_str_mv |
reponame:CONICET Digital (CONICET) instname:Consejo Nacional de Investigaciones Científicas y Técnicas |
reponame_str |
CONICET Digital (CONICET) |
collection |
CONICET Digital (CONICET) |
instname_str |
Consejo Nacional de Investigaciones Científicas y Técnicas |
repository.name.fl_str_mv |
CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas |
repository.mail.fl_str_mv |
dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar |
_version_ |
1842269322903289856 |
score |
13.13397 |