Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos

Autores: Muñoz, Verónica Lilian
Año de publicación: 2013
Idioma: español castellano
Tipo de recurso: artículo
Estado: versión publicada
Descripción: La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores.
Corpus linguistics has gained impetus as a research methodology in the area of foreign language teaching. This approach involves the empirical study of large linguistic databases based on real language, as well as the quantification of language use using statistical procedures. The purpose of this paper is to introduce basic aspects underlying corpus linguistics as an approach to language research, to describe the criteria used for corpus construction, and to describe the procedures followed to build a specialized corpus (Corpus of English Popularization Articles in Agriculture - CEPAA). This corpus was built in the context of an English reading course addressed to agriculture students at UNRC. The compilation of the CEPAA was based on the design criteria specified by corpus linguistics. The criteria are representativeness, balance, diversity of publication sources, availability of texts in electronic form, period, size, use of complete texts, variety of writers, and dialect. The CEPAA is representative of a genre (semi-popularization articles), a register (science), a discipline (agriculture), a specific domain (corn production), and a language (English). The articles were collected from the 2008-2009 issues of twelve popularization magazines published online by eleven American universities. A total number of 700 full texts of different lengths were assembled from the twelve publications, totaling 455,366 words. The corpus represents 292 writers.
Fil: Muñoz, Verónica Lilian. Universidad Nacional de Rio Cuarto; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Materia: ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA
CONSTRUCCIÓN DE CORPUS
Nivel de accesibilidad: acceso abierto
Condiciones de uso: https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
Institución: Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador: oai:ri.conicet.gov.ar:11336/22927

Acceder

id	CONICETDig_11fe3489b538d0401045ab93f4d91f4a
oai_identifier_str	oai:ri.conicet.gov.ar:11336/22927
network_acronym_str	CONICETDig
repository_id_str	3498
network_name_str	CONICET Digital (CONICET)
spelling	Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicosBuilding a corpus of semi-popularization articles: theoretical and methodological aspectsMuñoz, Verónica LilianARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICACONSTRUCCIÓN DE CORPUShttps://purl.org/becyt/ford/6.2https://purl.org/becyt/ford/6La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores.Corpus linguistics has gained impetus as a research methodology in the area of foreign language teaching. This approach involves the empirical study of large linguistic databases based on real language, as well as the quantification of language use using statistical procedures. The purpose of this paper is to introduce basic aspects underlying corpus linguistics as an approach to language research, to describe the criteria used for corpus construction, and to describe the procedures followed to build a specialized corpus (Corpus of English Popularization Articles in Agriculture - CEPAA). This corpus was built in the context of an English reading course addressed to agriculture students at UNRC. The compilation of the CEPAA was based on the design criteria specified by corpus linguistics. The criteria are representativeness, balance, diversity of publication sources, availability of texts in electronic form, period, size, use of complete texts, variety of writers, and dialect. The CEPAA is representative of a genre (semi-popularization articles), a register (science), a discipline (agriculture), a specific domain (corn production), and a language (English). The articles were collected from the 2008-2009 issues of twelve popularization magazines published online by eleven American universities. A total number of 700 full texts of different lengths were assembled from the twelve publications, totaling 455,366 words. The corpus represents 292 writers.Fil: Muñoz, Verónica Lilian. Universidad Nacional de Rio Cuarto; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaUniversidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación2013info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/22927Muñoz, Verónica Lilian; Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos; Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación; Contextos de Educación; XIII; -1-2013; 56-642314-3932CONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/http://www.hum.unrc.edu.ar/publicaciones/contextos/articulos/vol13/munioz.htmlinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2026-06-04T10:55:22Zoai:ri.conicet.gov.ar:11336/22927instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982026-06-04 10:55:22.23CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv	Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos Building a corpus of semi-popularization articles: theoretical and methodological aspects
title	Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
spellingShingle	Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos Muñoz, Verónica Lilian ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA CONSTRUCCIÓN DE CORPUS
title_short	Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
title_full	Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
title_fullStr	Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
title_full_unstemmed	Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
title_sort	Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
dc.creator.none.fl_str_mv	Muñoz, Verónica Lilian
author	Muñoz, Verónica Lilian
author_facet	Muñoz, Verónica Lilian
author_role	author
dc.subject.none.fl_str_mv	ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA CONSTRUCCIÓN DE CORPUS
topic	ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA CONSTRUCCIÓN DE CORPUS
purl_subject.fl_str_mv	https://purl.org/becyt/ford/6.2 https://purl.org/becyt/ford/6
dc.description.none.fl_txt_mv	La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores. Corpus linguistics has gained impetus as a research methodology in the area of foreign language teaching. This approach involves the empirical study of large linguistic databases based on real language, as well as the quantification of language use using statistical procedures. The purpose of this paper is to introduce basic aspects underlying corpus linguistics as an approach to language research, to describe the criteria used for corpus construction, and to describe the procedures followed to build a specialized corpus (Corpus of English Popularization Articles in Agriculture - CEPAA). This corpus was built in the context of an English reading course addressed to agriculture students at UNRC. The compilation of the CEPAA was based on the design criteria specified by corpus linguistics. The criteria are representativeness, balance, diversity of publication sources, availability of texts in electronic form, period, size, use of complete texts, variety of writers, and dialect. The CEPAA is representative of a genre (semi-popularization articles), a register (science), a discipline (agriculture), a specific domain (corn production), and a language (English). The articles were collected from the 2008-2009 issues of twelve popularization magazines published online by eleven American universities. A total number of 700 full texts of different lengths were assembled from the twelve publications, totaling 455,366 words. The corpus represents 292 writers. Fil: Muñoz, Verónica Lilian. Universidad Nacional de Rio Cuarto; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
description	La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores.
publishDate	2013
dc.date.none.fl_str_mv	2013
dc.type.none.fl_str_mv	info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo
format	article
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://hdl.handle.net/11336/22927 Muñoz, Verónica Lilian; Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos; Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación; Contextos de Educación; XIII; -1-2013; 56-64 2314-3932 CONICET Digital CONICET
url	http://hdl.handle.net/11336/22927
identifier_str_mv	Muñoz, Verónica Lilian; Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos; Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación; Contextos de Educación; XIII; -1-2013; 56-64 2314-3932 CONICET Digital CONICET
dc.language.none.fl_str_mv	spa
language	spa
dc.relation.none.fl_str_mv	info:eu-repo/semantics/altIdentifier/url/http://www.hum.unrc.edu.ar/publicaciones/contextos/articulos/vol13/munioz.html
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv	openAccess
rights_invalid_str_mv	https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv	application/pdf application/pdf
dc.publisher.none.fl_str_mv	Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación
publisher.none.fl_str_mv	Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación
dc.source.none.fl_str_mv	reponame:CONICET Digital (CONICET) instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str	CONICET Digital (CONICET)
collection	CONICET Digital (CONICET)
instname_str	Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv	CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv	dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_	1867098437254643712
score	12.832306

Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos

Publicaciones similares