Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp

Autores
Cantamutto, Lucía Marina; Vela Delfa, Cristina
Año de publicación
2023
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
La recolección de conjuntos de datos de interacciones reales es un paso ineludible en muchas investigaciones que buscan comprender los usos lingüísticos. En el campo del análisis del discurso digital, esto resulta complejo tanto por las características cambiantes de las aplicaciones como por las decisiones éticas que suponen. Este artículo tiene un doble objetivo. En primer lugar, ofrecer un estado de la cuestión sobre los conjuntos de datos de intercambios digitales por WhatsApp y, en segundo lugar, sistematizar diferentes técnicas de recolección de estas muestras, utilizadas en investigaciones previas. La metodología empleada es el análisis de contenido de cien tesis y artículos de investigación recuperados de portales científicos. Se realizó un análisis descriptivo que consideró, entre otras variables, la cantidad de datos recogidos, la técnica de recolección de datos utilizada, la forma de contacto con los participantes y el acceso en línea a los corpus lingüísticos. Los resultados muestran la existencia de algunos corpus anotados y disponibles en lenguas diferentes a la española. Asimismo, se observa, en la mayoría de los antecedentes, la combinación de diferentes técnicas para recoger un conjunto amplio de datos lingüísticos y multimodales. En tal sentido, se sistematizan las principales alternativas metodológicas con las que es posible recolectar datos de interacciones digitales por WhatsApp.
The collection of datasets from real interactions is an unavoidable step in many research works aiming to understand language use. In the field of digital discourse analysis, data collection is complex due to the fast-paced changes in the applications and the ethical decisions involved. This work has two goals. First, we seek to show an overview of the literature on datasets of digital exchanges by WhatsApp. Then, we aim to systematize different sampling techniques used in previous research. We thus proceeded by applying content analysis to 100 research articles and theses retrieved from open access portals. We conducted a descriptive analysis that included the amount of data collected, the technique employed in the collection of the data, the method used to contact participants, and the online access to the linguistic corpora, among other variables. The results show the existence of some corpora annotated and available in languages other than Spanish. In addition, most of the literature shows a combination of different techniques to collect a wide set of linguistic and multimodal data. Then, we systematize the main methodological alternatives for data collection from digital interactions by WhatsApp, with the participant observation method standing out.
Fil: Cantamutto, Lucía Marina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Rio Negro. Sede Atlantica. Centro Interdisciplinario de Estudios Sobre Derechos, Inclusión y Sociedad.; Argentina
Fil: Vela Delfa, Cristina. Universidad de Valladolid; España
Materia
DISCURSO DIGITAL
CORPUS LINGÜÍSTICO
MENSAJERÍA INSTÁNTANEA
INTERACCIÓN DIGITAL
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/223054

id CONICETDig_ba9283194872cf2e6517d2a3f89670bc
oai_identifier_str oai:ri.conicet.gov.ar:11336/223054
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsAppCorpus of digital interactions: systematization of techniques to collect data on WhatsAppCorpus de interações digitais: sistematização de técnicas para coleta de dados no WhatsAppCantamutto, Lucía MarinaVela Delfa, CristinaDISCURSO DIGITALCORPUS LINGÜÍSTICOMENSAJERÍA INSTÁNTANEAINTERACCIÓN DIGITALhttps://purl.org/becyt/ford/6.2https://purl.org/becyt/ford/6La recolección de conjuntos de datos de interacciones reales es un paso ineludible en muchas investigaciones que buscan comprender los usos lingüísticos. En el campo del análisis del discurso digital, esto resulta complejo tanto por las características cambiantes de las aplicaciones como por las decisiones éticas que suponen. Este artículo tiene un doble objetivo. En primer lugar, ofrecer un estado de la cuestión sobre los conjuntos de datos de intercambios digitales por WhatsApp y, en segundo lugar, sistematizar diferentes técnicas de recolección de estas muestras, utilizadas en investigaciones previas. La metodología empleada es el análisis de contenido de cien tesis y artículos de investigación recuperados de portales científicos. Se realizó un análisis descriptivo que consideró, entre otras variables, la cantidad de datos recogidos, la técnica de recolección de datos utilizada, la forma de contacto con los participantes y el acceso en línea a los corpus lingüísticos. Los resultados muestran la existencia de algunos corpus anotados y disponibles en lenguas diferentes a la española. Asimismo, se observa, en la mayoría de los antecedentes, la combinación de diferentes técnicas para recoger un conjunto amplio de datos lingüísticos y multimodales. En tal sentido, se sistematizan las principales alternativas metodológicas con las que es posible recolectar datos de interacciones digitales por WhatsApp.The collection of datasets from real interactions is an unavoidable step in many research works aiming to understand language use. In the field of digital discourse analysis, data collection is complex due to the fast-paced changes in the applications and the ethical decisions involved. This work has two goals. First, we seek to show an overview of the literature on datasets of digital exchanges by WhatsApp. Then, we aim to systematize different sampling techniques used in previous research. We thus proceeded by applying content analysis to 100 research articles and theses retrieved from open access portals. We conducted a descriptive analysis that included the amount of data collected, the technique employed in the collection of the data, the method used to contact participants, and the online access to the linguistic corpora, among other variables. The results show the existence of some corpora annotated and available in languages other than Spanish. In addition, most of the literature shows a combination of different techniques to collect a wide set of linguistic and multimodal data. Then, we systematize the main methodological alternatives for data collection from digital interactions by WhatsApp, with the participant observation method standing out.Fil: Cantamutto, Lucía Marina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Rio Negro. Sede Atlantica. Centro Interdisciplinario de Estudios Sobre Derechos, Inclusión y Sociedad.; ArgentinaFil: Vela Delfa, Cristina. Universidad de Valladolid; EspañaPontificia Universidad Católica de Chile2023-01info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/223054Cantamutto, Lucía Marina; Vela Delfa, Cristina; Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp; Pontificia Universidad Católica de Chile; Cuadernos.info; 54; 1-2023; 117-1390719-367xCONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/http://cuadernos.info/index.php/cdi/article/view/53165info:eu-repo/semantics/altIdentifier/doi/10.7764/cdi.54.53165info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-03T10:06:41Zoai:ri.conicet.gov.ar:11336/223054instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-03 10:06:41.572CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp
Corpus of digital interactions: systematization of techniques to collect data on WhatsApp
Corpus de interações digitais: sistematização de técnicas para coleta de dados no WhatsApp
title Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp
spellingShingle Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp
Cantamutto, Lucía Marina
DISCURSO DIGITAL
CORPUS LINGÜÍSTICO
MENSAJERÍA INSTÁNTANEA
INTERACCIÓN DIGITAL
title_short Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp
title_full Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp
title_fullStr Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp
title_full_unstemmed Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp
title_sort Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp
dc.creator.none.fl_str_mv Cantamutto, Lucía Marina
Vela Delfa, Cristina
author Cantamutto, Lucía Marina
author_facet Cantamutto, Lucía Marina
Vela Delfa, Cristina
author_role author
author2 Vela Delfa, Cristina
author2_role author
dc.subject.none.fl_str_mv DISCURSO DIGITAL
CORPUS LINGÜÍSTICO
MENSAJERÍA INSTÁNTANEA
INTERACCIÓN DIGITAL
topic DISCURSO DIGITAL
CORPUS LINGÜÍSTICO
MENSAJERÍA INSTÁNTANEA
INTERACCIÓN DIGITAL
purl_subject.fl_str_mv https://purl.org/becyt/ford/6.2
https://purl.org/becyt/ford/6
dc.description.none.fl_txt_mv La recolección de conjuntos de datos de interacciones reales es un paso ineludible en muchas investigaciones que buscan comprender los usos lingüísticos. En el campo del análisis del discurso digital, esto resulta complejo tanto por las características cambiantes de las aplicaciones como por las decisiones éticas que suponen. Este artículo tiene un doble objetivo. En primer lugar, ofrecer un estado de la cuestión sobre los conjuntos de datos de intercambios digitales por WhatsApp y, en segundo lugar, sistematizar diferentes técnicas de recolección de estas muestras, utilizadas en investigaciones previas. La metodología empleada es el análisis de contenido de cien tesis y artículos de investigación recuperados de portales científicos. Se realizó un análisis descriptivo que consideró, entre otras variables, la cantidad de datos recogidos, la técnica de recolección de datos utilizada, la forma de contacto con los participantes y el acceso en línea a los corpus lingüísticos. Los resultados muestran la existencia de algunos corpus anotados y disponibles en lenguas diferentes a la española. Asimismo, se observa, en la mayoría de los antecedentes, la combinación de diferentes técnicas para recoger un conjunto amplio de datos lingüísticos y multimodales. En tal sentido, se sistematizan las principales alternativas metodológicas con las que es posible recolectar datos de interacciones digitales por WhatsApp.
The collection of datasets from real interactions is an unavoidable step in many research works aiming to understand language use. In the field of digital discourse analysis, data collection is complex due to the fast-paced changes in the applications and the ethical decisions involved. This work has two goals. First, we seek to show an overview of the literature on datasets of digital exchanges by WhatsApp. Then, we aim to systematize different sampling techniques used in previous research. We thus proceeded by applying content analysis to 100 research articles and theses retrieved from open access portals. We conducted a descriptive analysis that included the amount of data collected, the technique employed in the collection of the data, the method used to contact participants, and the online access to the linguistic corpora, among other variables. The results show the existence of some corpora annotated and available in languages other than Spanish. In addition, most of the literature shows a combination of different techniques to collect a wide set of linguistic and multimodal data. Then, we systematize the main methodological alternatives for data collection from digital interactions by WhatsApp, with the participant observation method standing out.
Fil: Cantamutto, Lucía Marina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Rio Negro. Sede Atlantica. Centro Interdisciplinario de Estudios Sobre Derechos, Inclusión y Sociedad.; Argentina
Fil: Vela Delfa, Cristina. Universidad de Valladolid; España
description La recolección de conjuntos de datos de interacciones reales es un paso ineludible en muchas investigaciones que buscan comprender los usos lingüísticos. En el campo del análisis del discurso digital, esto resulta complejo tanto por las características cambiantes de las aplicaciones como por las decisiones éticas que suponen. Este artículo tiene un doble objetivo. En primer lugar, ofrecer un estado de la cuestión sobre los conjuntos de datos de intercambios digitales por WhatsApp y, en segundo lugar, sistematizar diferentes técnicas de recolección de estas muestras, utilizadas en investigaciones previas. La metodología empleada es el análisis de contenido de cien tesis y artículos de investigación recuperados de portales científicos. Se realizó un análisis descriptivo que consideró, entre otras variables, la cantidad de datos recogidos, la técnica de recolección de datos utilizada, la forma de contacto con los participantes y el acceso en línea a los corpus lingüísticos. Los resultados muestran la existencia de algunos corpus anotados y disponibles en lenguas diferentes a la española. Asimismo, se observa, en la mayoría de los antecedentes, la combinación de diferentes técnicas para recoger un conjunto amplio de datos lingüísticos y multimodales. En tal sentido, se sistematizan las principales alternativas metodológicas con las que es posible recolectar datos de interacciones digitales por WhatsApp.
publishDate 2023
dc.date.none.fl_str_mv 2023-01
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/223054
Cantamutto, Lucía Marina; Vela Delfa, Cristina; Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp; Pontificia Universidad Católica de Chile; Cuadernos.info; 54; 1-2023; 117-139
0719-367x
CONICET Digital
CONICET
url http://hdl.handle.net/11336/223054
identifier_str_mv Cantamutto, Lucía Marina; Vela Delfa, Cristina; Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp; Pontificia Universidad Católica de Chile; Cuadernos.info; 54; 1-2023; 117-139
0719-367x
CONICET Digital
CONICET
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/http://cuadernos.info/index.php/cdi/article/view/53165
info:eu-repo/semantics/altIdentifier/doi/10.7764/cdi.54.53165
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Pontificia Universidad Católica de Chile
publisher.none.fl_str_mv Pontificia Universidad Católica de Chile
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1842269969691181056
score 13.13397