Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos

Autores
Muñoz, Verónica Lilian
Año de publicación
2013
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores.
Corpus linguistics has gained impetus as a research methodology in the area of foreign language teaching. This approach involves the empirical study of large linguistic databases based on real language, as well as the quantification of language use using statistical procedures. The purpose of this paper is to introduce basic aspects underlying corpus linguistics as an approach to language research, to describe the criteria used for corpus construction, and to describe the procedures followed to build a specialized corpus (Corpus of English Popularization Articles in Agriculture - CEPAA). This corpus was built in the context of an English reading course addressed to agriculture students at UNRC. The compilation of the CEPAA was based on the design criteria specified by corpus linguistics. The criteria are representativeness, balance, diversity of publication sources, availability of texts in electronic form, period, size, use of complete texts, variety of writers, and dialect. The CEPAA is representative of a genre (semi-popularization articles), a register (science), a discipline (agriculture), a specific domain (corn production), and a language (English). The articles were collected from the 2008-2009 issues of twelve popularization magazines published online by eleven American universities. A total number of 700 full texts of different lengths were assembled from the twelve publications, totaling 455,366 words. The corpus represents 292 writers.
Fil: Muñoz, Verónica Lilian. Universidad Nacional de Rio Cuarto; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
Materia
ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA
CONSTRUCCIÓN DE CORPUS
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/22927

id CONICETDig_11fe3489b538d0401045ab93f4d91f4a
oai_identifier_str oai:ri.conicet.gov.ar:11336/22927
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicosBuilding a corpus of semi-popularization articles: theoretical and methodological aspectsMuñoz, Verónica LilianARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICACONSTRUCCIÓN DE CORPUShttps://purl.org/becyt/ford/6.2https://purl.org/becyt/ford/6La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores.Corpus linguistics has gained impetus as a research methodology in the area of foreign language teaching. This approach involves the empirical study of large linguistic databases based on real language, as well as the quantification of language use using statistical procedures. The purpose of this paper is to introduce basic aspects underlying corpus linguistics as an approach to language research, to describe the criteria used for corpus construction, and to describe the procedures followed to build a specialized corpus (Corpus of English Popularization Articles in Agriculture - CEPAA). This corpus was built in the context of an English reading course addressed to agriculture students at UNRC. The compilation of the CEPAA was based on the design criteria specified by corpus linguistics. The criteria are representativeness, balance, diversity of publication sources, availability of texts in electronic form, period, size, use of complete texts, variety of writers, and dialect. The CEPAA is representative of a genre (semi-popularization articles), a register (science), a discipline (agriculture), a specific domain (corn production), and a language (English). The articles were collected from the 2008-2009 issues of twelve popularization magazines published online by eleven American universities. A total number of 700 full texts of different lengths were assembled from the twelve publications, totaling 455,366 words. The corpus represents 292 writers.Fil: Muñoz, Verónica Lilian. Universidad Nacional de Rio Cuarto; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaUniversidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación2013info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/22927Muñoz, Verónica Lilian; Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos; Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación; Contextos de Educación; XIII; -1-2013; 56-642314-3932CONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/http://www.hum.unrc.edu.ar/publicaciones/contextos/articulos/vol13/munioz.htmlinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-29T09:44:09Zoai:ri.conicet.gov.ar:11336/22927instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-29 09:44:09.883CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
Building a corpus of semi-popularization articles: theoretical and methodological aspects
title Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
spellingShingle Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
Muñoz, Verónica Lilian
ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA
CONSTRUCCIÓN DE CORPUS
title_short Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
title_full Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
title_fullStr Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
title_full_unstemmed Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
title_sort Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
dc.creator.none.fl_str_mv Muñoz, Verónica Lilian
author Muñoz, Verónica Lilian
author_facet Muñoz, Verónica Lilian
author_role author
dc.subject.none.fl_str_mv ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA
CONSTRUCCIÓN DE CORPUS
topic ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA
CONSTRUCCIÓN DE CORPUS
purl_subject.fl_str_mv https://purl.org/becyt/ford/6.2
https://purl.org/becyt/ford/6
dc.description.none.fl_txt_mv La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores.
Corpus linguistics has gained impetus as a research methodology in the area of foreign language teaching. This approach involves the empirical study of large linguistic databases based on real language, as well as the quantification of language use using statistical procedures. The purpose of this paper is to introduce basic aspects underlying corpus linguistics as an approach to language research, to describe the criteria used for corpus construction, and to describe the procedures followed to build a specialized corpus (Corpus of English Popularization Articles in Agriculture - CEPAA). This corpus was built in the context of an English reading course addressed to agriculture students at UNRC. The compilation of the CEPAA was based on the design criteria specified by corpus linguistics. The criteria are representativeness, balance, diversity of publication sources, availability of texts in electronic form, period, size, use of complete texts, variety of writers, and dialect. The CEPAA is representative of a genre (semi-popularization articles), a register (science), a discipline (agriculture), a specific domain (corn production), and a language (English). The articles were collected from the 2008-2009 issues of twelve popularization magazines published online by eleven American universities. A total number of 700 full texts of different lengths were assembled from the twelve publications, totaling 455,366 words. The corpus represents 292 writers.
Fil: Muñoz, Verónica Lilian. Universidad Nacional de Rio Cuarto; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
description La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores.
publishDate 2013
dc.date.none.fl_str_mv 2013
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/22927
Muñoz, Verónica Lilian; Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos; Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación; Contextos de Educación; XIII; -1-2013; 56-64
2314-3932
CONICET Digital
CONICET
url http://hdl.handle.net/11336/22927
identifier_str_mv Muñoz, Verónica Lilian; Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos; Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación; Contextos de Educación; XIII; -1-2013; 56-64
2314-3932
CONICET Digital
CONICET
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/http://www.hum.unrc.edu.ar/publicaciones/contextos/articulos/vol13/munioz.html
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación
publisher.none.fl_str_mv Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1844613389886685184
score 13.070432