Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos
- Autores
- Muñoz, Verónica Lilian
- Año de publicación
- 2013
- Idioma
- español castellano
- Tipo de recurso
- artículo
- Estado
- versión publicada
- Descripción
- La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores.
Corpus linguistics has gained impetus as a research methodology in the area of foreign language teaching. This approach involves the empirical study of large linguistic databases based on real language, as well as the quantification of language use using statistical procedures. The purpose of this paper is to introduce basic aspects underlying corpus linguistics as an approach to language research, to describe the criteria used for corpus construction, and to describe the procedures followed to build a specialized corpus (Corpus of English Popularization Articles in Agriculture - CEPAA). This corpus was built in the context of an English reading course addressed to agriculture students at UNRC. The compilation of the CEPAA was based on the design criteria specified by corpus linguistics. The criteria are representativeness, balance, diversity of publication sources, availability of texts in electronic form, period, size, use of complete texts, variety of writers, and dialect. The CEPAA is representative of a genre (semi-popularization articles), a register (science), a discipline (agriculture), a specific domain (corn production), and a language (English). The articles were collected from the 2008-2009 issues of twelve popularization magazines published online by eleven American universities. A total number of 700 full texts of different lengths were assembled from the twelve publications, totaling 455,366 words. The corpus represents 292 writers.
Fil: Muñoz, Verónica Lilian. Universidad Nacional de Rio Cuarto; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina - Materia
-
ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA
CONSTRUCCIÓN DE CORPUS - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
- Repositorio
- Institución
- Consejo Nacional de Investigaciones Científicas y Técnicas
- OAI Identificador
- oai:ri.conicet.gov.ar:11336/22927
Ver los metadatos del registro completo
id |
CONICETDig_11fe3489b538d0401045ab93f4d91f4a |
---|---|
oai_identifier_str |
oai:ri.conicet.gov.ar:11336/22927 |
network_acronym_str |
CONICETDig |
repository_id_str |
3498 |
network_name_str |
CONICET Digital (CONICET) |
spelling |
Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicosBuilding a corpus of semi-popularization articles: theoretical and methodological aspectsMuñoz, Verónica LilianARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICACONSTRUCCIÓN DE CORPUShttps://purl.org/becyt/ford/6.2https://purl.org/becyt/ford/6La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores.Corpus linguistics has gained impetus as a research methodology in the area of foreign language teaching. This approach involves the empirical study of large linguistic databases based on real language, as well as the quantification of language use using statistical procedures. The purpose of this paper is to introduce basic aspects underlying corpus linguistics as an approach to language research, to describe the criteria used for corpus construction, and to describe the procedures followed to build a specialized corpus (Corpus of English Popularization Articles in Agriculture - CEPAA). This corpus was built in the context of an English reading course addressed to agriculture students at UNRC. The compilation of the CEPAA was based on the design criteria specified by corpus linguistics. The criteria are representativeness, balance, diversity of publication sources, availability of texts in electronic form, period, size, use of complete texts, variety of writers, and dialect. The CEPAA is representative of a genre (semi-popularization articles), a register (science), a discipline (agriculture), a specific domain (corn production), and a language (English). The articles were collected from the 2008-2009 issues of twelve popularization magazines published online by eleven American universities. A total number of 700 full texts of different lengths were assembled from the twelve publications, totaling 455,366 words. The corpus represents 292 writers.Fil: Muñoz, Verónica Lilian. Universidad Nacional de Rio Cuarto; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaUniversidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación2013info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/22927Muñoz, Verónica Lilian; Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos; Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación; Contextos de Educación; XIII; -1-2013; 56-642314-3932CONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/http://www.hum.unrc.edu.ar/publicaciones/contextos/articulos/vol13/munioz.htmlinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-29T09:44:09Zoai:ri.conicet.gov.ar:11336/22927instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-29 09:44:09.883CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse |
dc.title.none.fl_str_mv |
Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos Building a corpus of semi-popularization articles: theoretical and methodological aspects |
title |
Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos |
spellingShingle |
Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos Muñoz, Verónica Lilian ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA CONSTRUCCIÓN DE CORPUS |
title_short |
Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos |
title_full |
Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos |
title_fullStr |
Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos |
title_full_unstemmed |
Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos |
title_sort |
Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos |
dc.creator.none.fl_str_mv |
Muñoz, Verónica Lilian |
author |
Muñoz, Verónica Lilian |
author_facet |
Muñoz, Verónica Lilian |
author_role |
author |
dc.subject.none.fl_str_mv |
ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA CONSTRUCCIÓN DE CORPUS |
topic |
ARTÍCULO DE SEMI-DIVULGACIÓN CIENTÍFICA CONSTRUCCIÓN DE CORPUS |
purl_subject.fl_str_mv |
https://purl.org/becyt/ford/6.2 https://purl.org/becyt/ford/6 |
dc.description.none.fl_txt_mv |
La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores. Corpus linguistics has gained impetus as a research methodology in the area of foreign language teaching. This approach involves the empirical study of large linguistic databases based on real language, as well as the quantification of language use using statistical procedures. The purpose of this paper is to introduce basic aspects underlying corpus linguistics as an approach to language research, to describe the criteria used for corpus construction, and to describe the procedures followed to build a specialized corpus (Corpus of English Popularization Articles in Agriculture - CEPAA). This corpus was built in the context of an English reading course addressed to agriculture students at UNRC. The compilation of the CEPAA was based on the design criteria specified by corpus linguistics. The criteria are representativeness, balance, diversity of publication sources, availability of texts in electronic form, period, size, use of complete texts, variety of writers, and dialect. The CEPAA is representative of a genre (semi-popularization articles), a register (science), a discipline (agriculture), a specific domain (corn production), and a language (English). The articles were collected from the 2008-2009 issues of twelve popularization magazines published online by eleven American universities. A total number of 700 full texts of different lengths were assembled from the twelve publications, totaling 455,366 words. The corpus represents 292 writers. Fil: Muñoz, Verónica Lilian. Universidad Nacional de Rio Cuarto; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina |
description |
La lingüística de corpus es una metodología de investigación que ha ganado protagonismo en el área de la enseñanza de lenguas extranjeras. Este marco metodológico permite el estudio empírico de grandes bases de datos lingüísticos fundados en el uso real de la lengua, y la cuantificación del uso de la lengua utilizando métodos estadísticos. En este trabajo se introducen aspectos básicos de la lingüística de corpus como metodología de investigación, se describen lineamientos para la construcción de un corpus y se presentan los pasos seguidos para la compilación de un corpus especializado (Corpus of English Popularization Articles in Agriculture - CEPAA). El corpus fue construido para responder a las necesidades de un curso de lectura en inglés destinado a alumnos de Ingeniería Agronómica de la UNRC. La construcción del CEPAA se sustentó en los criterios de diseño y compilación especificados por la lingüística de corpus. Dichos criterios son representatividad, balance, diversidad de fuentes de publicación, disponibilidad de textos en formato electrónico, período, tamaño, uso de textos completos, variedad de escritores, y dialecto. El CEPAA es representativo de un género (artículos de semi-divulgación), un registro (científico), una disciplina (ciencias agrarias), un tema específico (producción de granos), y un idioma (inglés). Los artículos fueron recolectados de las ediciones correspondientes a los períodos 2008 y 2009 de doce revistas de divulgación publicadas online por once universidades de los Estados Unidos. Se recolectaron 700 artículos de diferentes extensiones, sumando un total de 455.366 palabras. El corpus representa una totalidad de 292 escritores. |
publishDate |
2013 |
dc.date.none.fl_str_mv |
2013 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo |
format |
article |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://hdl.handle.net/11336/22927 Muñoz, Verónica Lilian; Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos; Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación; Contextos de Educación; XIII; -1-2013; 56-64 2314-3932 CONICET Digital CONICET |
url |
http://hdl.handle.net/11336/22927 |
identifier_str_mv |
Muñoz, Verónica Lilian; Construcción de un corpus de artículos de semidivulgación: aspectos teóricos y metodológicos; Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación; Contextos de Educación; XIII; -1-2013; 56-64 2314-3932 CONICET Digital CONICET |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/url/http://www.hum.unrc.edu.ar/publicaciones/contextos/articulos/vol13/munioz.html |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ |
dc.format.none.fl_str_mv |
application/pdf application/pdf |
dc.publisher.none.fl_str_mv |
Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación |
publisher.none.fl_str_mv |
Universidad Nacional de Río Cuarto. Facultad de Ciencias Humanas. Departamento de Ciencias de la Educación |
dc.source.none.fl_str_mv |
reponame:CONICET Digital (CONICET) instname:Consejo Nacional de Investigaciones Científicas y Técnicas |
reponame_str |
CONICET Digital (CONICET) |
collection |
CONICET Digital (CONICET) |
instname_str |
Consejo Nacional de Investigaciones Científicas y Técnicas |
repository.name.fl_str_mv |
CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas |
repository.mail.fl_str_mv |
dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar |
_version_ |
1844613389886685184 |
score |
13.070432 |