Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping

Autores
Castel, Victor Miguel
Año de publicación
2006
Idioma
inglés
Tipo de recurso
artículo
Estado
versión publicada
Descripción
The research article abstract (RAA) has been the focus of numerous investigations within both the Systemic Functional Linguistics (SFL) and the Natural Language Processing (NLP) communities, and from both the text generation and the text analysis/parsing perspectives. Given the complexity of the object of study, however, there is still a need for extensive studies of the RAA which provide detailed descriptive generalizations on the relationship between context and language which are corpus-based, formally defined and computationally implemented. These three conditions appear to be central to any Natural Language Generation (NLG) project whose long-term goal is simultaneously to model the systemic-functional unity and diversity found in RAAs, and to use the resulting model in the development of tools for interactive rhetorical and linguistic assistance in RAA writing. This is the leading goal of the RedACTe Project one of whose theoretical-descriptive results is presented here. The basic formal mechanism used by the Cardiff Grammar for the generation of text-sentences is adapted and extended to capture systematic correlations between higher (genre and register) and lower (lexicogrammar) strata features of RAAs of the RedACTe Project's sample disciplines. Generation rules are defined, both within any one stratum and between strata, for mapping genre onto semantics and semantics onto form - and so text proper.
El Abstract del Artículo de Investigación Científica en Inglés (AbAICI) ha sido, y aún lo es, el foco de atención de numerosas investigaciones tanto desde la perspectiva de la Lingüística Sistémica Funcional (SFL) como desde la perspectiva del Procesamiento Automático de Lenguas Naturales (NLP). Dada la complejidad del objeto de estudio, sin embargo, es todavía necesario llevar a cabo estudios extensivos del AbAICI que provean generalizaciones descriptivas detalladas acerca de la relación entre contexto y lengua que estén basadas en corpus, definidas formalmente e implementadas computacionalmente. Estas tres condiciones parecen ser centrales para cualquier proyecto de Generación de Lengua Natural (NLG) cuyo objetivo a largo plazo sea simultáneamente modelizar la unidad y la diversidad sistémico-funcional encontrada en los AbAICIs, y utilizar el modelo resultante en el desarrollo de herramientas para la asistencia retórica y lingüística en la escritura interactiva de AbAICIs. Este es el objetivo central del Proyecto RedACTe, uno de cuyos resultados teórico-descriptivos se presenta aquí. El mecanismo formal básico utilizado por la Gramática de Cardiff para la generación de oraciones-texto es adaptado y extendido para expresar correlaciones sistemáticas entre rasgos de estratos superiores (género y registro) y rasgos de estratos inferiores (léxico-gramática) de AbAICIs de la muestra disciplinar del Proyecto RedACTe. Definimos reglas de generación, tanto dentro de cada estrato como entre estratos, para la proyección del género en la semántica y la semántica en la forma, y así en el texto propiamente dicho
Fil: Castel, Victor Miguel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Mendoza. Instituto de Ciencias Humanas, Sociales y Ambientales; Argentina. Universidad Nacional de Cuyo; Argentina
Materia
Natural language generation
Natural language processing
Systemic functional linguistics
Corpus linguistics
Computational linguistics
Generación del lenguaje natural
Procesamiento del lenguaje natural
Lingüística sistémico-funcional
Lingüística de corpus
Lingüística computacional
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/40242

id CONICETDig_1a0e8b4a2368ead24bc7dcd841db3ba0
oai_identifier_str oai:ri.conicet.gov.ar:11336/40242
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mappingGeneración de abstracts a partir de la estructura de género vía la léxico-gramática: Modelización de selección y proyección de rasgosCastel, Victor MiguelNatural language generationNatural language processingSystemic functional linguisticsCorpus linguisticsComputational linguisticsGeneración del lenguaje naturalProcesamiento del lenguaje naturalLingüística sistémico-funcionalLingüística de corpusLingüística computacionalhttps://purl.org/becyt/ford/6.2https://purl.org/becyt/ford/6The research article abstract (RAA) has been the focus of numerous investigations within both the Systemic Functional Linguistics (SFL) and the Natural Language Processing (NLP) communities, and from both the text generation and the text analysis/parsing perspectives. Given the complexity of the object of study, however, there is still a need for extensive studies of the RAA which provide detailed descriptive generalizations on the relationship between context and language which are corpus-based, formally defined and computationally implemented. These three conditions appear to be central to any Natural Language Generation (NLG) project whose long-term goal is simultaneously to model the systemic-functional unity and diversity found in RAAs, and to use the resulting model in the development of tools for interactive rhetorical and linguistic assistance in RAA writing. This is the leading goal of the RedACTe Project one of whose theoretical-descriptive results is presented here. The basic formal mechanism used by the Cardiff Grammar for the generation of text-sentences is adapted and extended to capture systematic correlations between higher (genre and register) and lower (lexicogrammar) strata features of RAAs of the RedACTe Project's sample disciplines. Generation rules are defined, both within any one stratum and between strata, for mapping genre onto semantics and semantics onto form - and so text proper.El Abstract del Artículo de Investigación Científica en Inglés (AbAICI) ha sido, y aún lo es, el foco de atención de numerosas investigaciones tanto desde la perspectiva de la Lingüística Sistémica Funcional (SFL) como desde la perspectiva del Procesamiento Automático de Lenguas Naturales (NLP). Dada la complejidad del objeto de estudio, sin embargo, es todavía necesario llevar a cabo estudios extensivos del AbAICI que provean generalizaciones descriptivas detalladas acerca de la relación entre contexto y lengua que estén basadas en corpus, definidas formalmente e implementadas computacionalmente. Estas tres condiciones parecen ser centrales para cualquier proyecto de Generación de Lengua Natural (NLG) cuyo objetivo a largo plazo sea simultáneamente modelizar la unidad y la diversidad sistémico-funcional encontrada en los AbAICIs, y utilizar el modelo resultante en el desarrollo de herramientas para la asistencia retórica y lingüística en la escritura interactiva de AbAICIs. Este es el objetivo central del Proyecto RedACTe, uno de cuyos resultados teórico-descriptivos se presenta aquí. El mecanismo formal básico utilizado por la Gramática de Cardiff para la generación de oraciones-texto es adaptado y extendido para expresar correlaciones sistemáticas entre rasgos de estratos superiores (género y registro) y rasgos de estratos inferiores (léxico-gramática) de AbAICIs de la muestra disciplinar del Proyecto RedACTe. Definimos reglas de generación, tanto dentro de cada estrato como entre estratos, para la proyección del género en la semántica y la semántica en la forma, y así en el texto propiamente dichoFil: Castel, Victor Miguel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Mendoza. Instituto de Ciencias Humanas, Sociales y Ambientales; Argentina. Universidad Nacional de Cuyo; ArgentinaUniversidad Católica de Valparaíso2006-12info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/40242Castel, Victor Miguel; Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping; Universidad Católica de Valparaíso; Revista signos; 39; 62; 12-2006; 326-3540035-04510718-0934CONICET DigitalCONICETenginfo:eu-repo/semantics/altIdentifier/doi/10.4067/S0718-09342006000300001info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-03T09:55:05Zoai:ri.conicet.gov.ar:11336/40242instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-03 09:55:05.293CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping
Generación de abstracts a partir de la estructura de género vía la léxico-gramática: Modelización de selección y proyección de rasgos
title Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping
spellingShingle Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping
Castel, Victor Miguel
Natural language generation
Natural language processing
Systemic functional linguistics
Corpus linguistics
Computational linguistics
Generación del lenguaje natural
Procesamiento del lenguaje natural
Lingüística sistémico-funcional
Lingüística de corpus
Lingüística computacional
title_short Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping
title_full Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping
title_fullStr Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping
title_full_unstemmed Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping
title_sort Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping
dc.creator.none.fl_str_mv Castel, Victor Miguel
author Castel, Victor Miguel
author_facet Castel, Victor Miguel
author_role author
dc.subject.none.fl_str_mv Natural language generation
Natural language processing
Systemic functional linguistics
Corpus linguistics
Computational linguistics
Generación del lenguaje natural
Procesamiento del lenguaje natural
Lingüística sistémico-funcional
Lingüística de corpus
Lingüística computacional
topic Natural language generation
Natural language processing
Systemic functional linguistics
Corpus linguistics
Computational linguistics
Generación del lenguaje natural
Procesamiento del lenguaje natural
Lingüística sistémico-funcional
Lingüística de corpus
Lingüística computacional
purl_subject.fl_str_mv https://purl.org/becyt/ford/6.2
https://purl.org/becyt/ford/6
dc.description.none.fl_txt_mv The research article abstract (RAA) has been the focus of numerous investigations within both the Systemic Functional Linguistics (SFL) and the Natural Language Processing (NLP) communities, and from both the text generation and the text analysis/parsing perspectives. Given the complexity of the object of study, however, there is still a need for extensive studies of the RAA which provide detailed descriptive generalizations on the relationship between context and language which are corpus-based, formally defined and computationally implemented. These three conditions appear to be central to any Natural Language Generation (NLG) project whose long-term goal is simultaneously to model the systemic-functional unity and diversity found in RAAs, and to use the resulting model in the development of tools for interactive rhetorical and linguistic assistance in RAA writing. This is the leading goal of the RedACTe Project one of whose theoretical-descriptive results is presented here. The basic formal mechanism used by the Cardiff Grammar for the generation of text-sentences is adapted and extended to capture systematic correlations between higher (genre and register) and lower (lexicogrammar) strata features of RAAs of the RedACTe Project's sample disciplines. Generation rules are defined, both within any one stratum and between strata, for mapping genre onto semantics and semantics onto form - and so text proper.
El Abstract del Artículo de Investigación Científica en Inglés (AbAICI) ha sido, y aún lo es, el foco de atención de numerosas investigaciones tanto desde la perspectiva de la Lingüística Sistémica Funcional (SFL) como desde la perspectiva del Procesamiento Automático de Lenguas Naturales (NLP). Dada la complejidad del objeto de estudio, sin embargo, es todavía necesario llevar a cabo estudios extensivos del AbAICI que provean generalizaciones descriptivas detalladas acerca de la relación entre contexto y lengua que estén basadas en corpus, definidas formalmente e implementadas computacionalmente. Estas tres condiciones parecen ser centrales para cualquier proyecto de Generación de Lengua Natural (NLG) cuyo objetivo a largo plazo sea simultáneamente modelizar la unidad y la diversidad sistémico-funcional encontrada en los AbAICIs, y utilizar el modelo resultante en el desarrollo de herramientas para la asistencia retórica y lingüística en la escritura interactiva de AbAICIs. Este es el objetivo central del Proyecto RedACTe, uno de cuyos resultados teórico-descriptivos se presenta aquí. El mecanismo formal básico utilizado por la Gramática de Cardiff para la generación de oraciones-texto es adaptado y extendido para expresar correlaciones sistemáticas entre rasgos de estratos superiores (género y registro) y rasgos de estratos inferiores (léxico-gramática) de AbAICIs de la muestra disciplinar del Proyecto RedACTe. Definimos reglas de generación, tanto dentro de cada estrato como entre estratos, para la proyección del género en la semántica y la semántica en la forma, y así en el texto propiamente dicho
Fil: Castel, Victor Miguel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Mendoza. Instituto de Ciencias Humanas, Sociales y Ambientales; Argentina. Universidad Nacional de Cuyo; Argentina
description The research article abstract (RAA) has been the focus of numerous investigations within both the Systemic Functional Linguistics (SFL) and the Natural Language Processing (NLP) communities, and from both the text generation and the text analysis/parsing perspectives. Given the complexity of the object of study, however, there is still a need for extensive studies of the RAA which provide detailed descriptive generalizations on the relationship between context and language which are corpus-based, formally defined and computationally implemented. These three conditions appear to be central to any Natural Language Generation (NLG) project whose long-term goal is simultaneously to model the systemic-functional unity and diversity found in RAAs, and to use the resulting model in the development of tools for interactive rhetorical and linguistic assistance in RAA writing. This is the leading goal of the RedACTe Project one of whose theoretical-descriptive results is presented here. The basic formal mechanism used by the Cardiff Grammar for the generation of text-sentences is adapted and extended to capture systematic correlations between higher (genre and register) and lower (lexicogrammar) strata features of RAAs of the RedACTe Project's sample disciplines. Generation rules are defined, both within any one stratum and between strata, for mapping genre onto semantics and semantics onto form - and so text proper.
publishDate 2006
dc.date.none.fl_str_mv 2006-12
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/40242
Castel, Victor Miguel; Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping; Universidad Católica de Valparaíso; Revista signos; 39; 62; 12-2006; 326-354
0035-0451
0718-0934
CONICET Digital
CONICET
url http://hdl.handle.net/11336/40242
identifier_str_mv Castel, Victor Miguel; Generating abstracts from genre structure through lexicogrammar: Modelling of feature selection and mapping; Universidad Católica de Valparaíso; Revista signos; 39; 62; 12-2006; 326-354
0035-0451
0718-0934
CONICET Digital
CONICET
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/doi/10.4067/S0718-09342006000300001
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad Católica de Valparaíso
publisher.none.fl_str_mv Universidad Católica de Valparaíso
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1842269322903289856
score 13.13397