Claves para analizar datos en Twitter: Recolección y procesamiento de corpus

Autores: Bonilla Neira, Laura Cristina
Año de publicación: 2022
Idioma: español castellano
Tipo de recurso: artículo
Estado: versión publicada
Descripción: El objetivo de este trabajo es presentar una propuesta metodológica para el análisis de datos de Twitter con un enfoque mixto. Específicamente, el procedimiento de recolección y procesamiento de la información se caracteriza por retomar recursos cualitativos y cuantitativos, así como por la construcción de un corpus manejable para un posterior análisis cualitativo. El procedimiento para abordar los discursos digitales de Twitter consiste en: 1) registro de la etnografía virtual, 2) recolección de los datos por medio de la API de Twitter usando Python; 3) visualización y filtrado de los datos con Open Refine; 4) construcción del corpus 5) categorización y etiquetado de los enunciados verbo-icónicos con Atlas.ti. El trabajo reconstruye el recorrido metodológico llevado a cabo en una investigación doctoral en curso con enfoque cualitativo, de la cual se extraen los ejemplos, con el fin de ofrecer una ruta accesible que pueda ser replicada en investigaciones con este tipo de datos.
This paper aims to present a methodological proposal for the analysis of Twitter data from a mixed approach. Specifically, the procedure for collecting and processing information is characterized by the use of qualitative and quantitative resources, as well as the construction of a manageable corpus for subsequent qualitative analysis. The procedure to approach Twitter digital discourses consists of the following route: 1) virtual ethnography registration; 2) data collection through the Twitter API using Python; 3) visualisation and filtering of the data with Open Refine; 4) corpus construction; 5) categorisation and labelling of the iconic verb utterances with Atlas. ti. The paper reconstructs the methodological path carried out in ongoing doctoral research with a qualitative approach, from which the examples are extracted, to offer an accessible route that can be replicated in research with this type of data.
L'objectif de cet article est de présenter une proposition méthodologique pour l'analyse des données Twitter avec une approche mixte. Plus précisément, la procédure de collecte et de traitement des données est caractérisée par la réutilisation de ressources qualitatives et quantitatives, ainsi que par la construction d'un corpus gérable pour une analyse qualitative ultérieure. La procédure pour aborder des discours numériques de Twitter consiste à : 1) enregistrement de l'ethnographie virtuelle, 2) collecte des données au moyen de l'API Twitter en utilisant Python ; 3) visualisation et filtrage des données avec Open Refine ; 4) construction du corpus 5) catégorisation et étiquetage des énoncés verbo-iconiques avec Atlas.ti. L'article reconstruit le parcours méthodologique réalisé dans une recherche doctorale en cours avec une approche qualitative, d'où sont extraits les exemples, afin d'en offrir un parcours accessible et rééditable dans les recherches avec ce type de données.
O objetivo deste trabalho é apresentar uma proposta metodológica para a análise de dados do Twitter com uma abordagem mista. Especificamente, o procedimento de coleta e tratamento da informação caracteriza-se pela utilização de recursos qualitativos e quantitativos, bem como pela construção de um corpus gerenciável para posterior análise qualitativa. O procedimento de abordagem dos discursos digitais do Twitter consiste em: 1) registro da etnografia virtual; 2) coleta de dados por meio da API do Twitter utilizando Python; 3) visualização e filtragem de dados com Open Refine; 4) construção do corpus 5) categorização e rotulagem dos enunciados verboicônicos com o Atlas.ti. O trabalho reconstrói o percurso metodológico realizado em uma pesquisa de doutorado em andamento com abordagem qualitativa, de onde são extraídos os exemplos, a fim de oferecer um percurso acessível que possa ser replicado em pesquisas com esse tipo de dado.
Fil: Bonilla Neira, Laura Cristina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad de Buenos Aires. Facultad de Filosofía y Letras. Instituto de Lingüística; Argentina
Materia: CONSTRUCCIÓN DE CORPUS
DISCURSO DIGITAL
ANÁLISIS DEL DISCURSO
METODOLOGÍA
NETNOGRAFÍA
TWITTER
Nivel de accesibilidad: acceso abierto
Condiciones de uso: https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
Institución: Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador: oai:ri.conicet.gov.ar:11336/217899

Acceder

id	CONICETDig_3709ec95b194b79578af2cc01c195585
oai_identifier_str	oai:ri.conicet.gov.ar:11336/217899
network_acronym_str	CONICETDig
repository_id_str	3498
network_name_str	CONICET Digital (CONICET)
spelling	Claves para analizar datos en Twitter: Recolección y procesamiento de corpusKeys for Analyzing Data on Twitter: Corpus Collection and ProcessingChaves para analisar dados no Twitter: Coleta e processamento de corpusClés de l'analyse des données sur Twitter: Collecte et traitement du corpusBonilla Neira, Laura CristinaCONSTRUCCIÓN DE CORPUSDISCURSO DIGITALANÁLISIS DEL DISCURSOMETODOLOGÍANETNOGRAFÍATWITTERhttps://purl.org/becyt/ford/6.2https://purl.org/becyt/ford/6El objetivo de este trabajo es presentar una propuesta metodológica para el análisis de datos de Twitter con un enfoque mixto. Específicamente, el procedimiento de recolección y procesamiento de la información se caracteriza por retomar recursos cualitativos y cuantitativos, así como por la construcción de un corpus manejable para un posterior análisis cualitativo. El procedimiento para abordar los discursos digitales de Twitter consiste en: 1) registro de la etnografía virtual, 2) recolección de los datos por medio de la API de Twitter usando Python; 3) visualización y filtrado de los datos con Open Refine; 4) construcción del corpus 5) categorización y etiquetado de los enunciados verbo-icónicos con Atlas.ti. El trabajo reconstruye el recorrido metodológico llevado a cabo en una investigación doctoral en curso con enfoque cualitativo, de la cual se extraen los ejemplos, con el fin de ofrecer una ruta accesible que pueda ser replicada en investigaciones con este tipo de datos.This paper aims to present a methodological proposal for the analysis of Twitter data from a mixed approach. Specifically, the procedure for collecting and processing information is characterized by the use of qualitative and quantitative resources, as well as the construction of a manageable corpus for subsequent qualitative analysis. The procedure to approach Twitter digital discourses consists of the following route: 1) virtual ethnography registration; 2) data collection through the Twitter API using Python; 3) visualisation and filtering of the data with Open Refine; 4) corpus construction; 5) categorisation and labelling of the iconic verb utterances with Atlas. ti. The paper reconstructs the methodological path carried out in ongoing doctoral research with a qualitative approach, from which the examples are extracted, to offer an accessible route that can be replicated in research with this type of data.L'objectif de cet article est de présenter une proposition méthodologique pour l'analyse des données Twitter avec une approche mixte. Plus précisément, la procédure de collecte et de traitement des données est caractérisée par la réutilisation de ressources qualitatives et quantitatives, ainsi que par la construction d'un corpus gérable pour une analyse qualitative ultérieure. La procédure pour aborder des discours numériques de Twitter consiste à : 1) enregistrement de l'ethnographie virtuelle, 2) collecte des données au moyen de l'API Twitter en utilisant Python ; 3) visualisation et filtrage des données avec Open Refine ; 4) construction du corpus 5) catégorisation et étiquetage des énoncés verbo-iconiques avec Atlas.ti. L'article reconstruit le parcours méthodologique réalisé dans une recherche doctorale en cours avec une approche qualitative, d'où sont extraits les exemples, afin d'en offrir un parcours accessible et rééditable dans les recherches avec ce type de données.O objetivo deste trabalho é apresentar uma proposta metodológica para a análise de dados do Twitter com uma abordagem mista. Especificamente, o procedimento de coleta e tratamento da informação caracteriza-se pela utilização de recursos qualitativos e quantitativos, bem como pela construção de um corpus gerenciável para posterior análise qualitativa. O procedimento de abordagem dos discursos digitais do Twitter consiste em: 1) registro da etnografia virtual; 2) coleta de dados por meio da API do Twitter utilizando Python; 3) visualização e filtragem de dados com Open Refine; 4) construção do corpus 5) categorização e rotulagem dos enunciados verboicônicos com o Atlas.ti. O trabalho reconstrói o percurso metodológico realizado em uma pesquisa de doutorado em andamento com abordagem qualitativa, de onde são extraídos os exemplos, a fim de oferecer um percurso acessível que possa ser replicado em pesquisas com esse tipo de dado.Fil: Bonilla Neira, Laura Cristina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad de Buenos Aires. Facultad de Filosofía y Letras. Instituto de Lingüística; ArgentinaUniversidad Pedagógica y Tecnológica de Colombia2022-02info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/217899Bonilla Neira, Laura Cristina; Claves para analizar datos en Twitter: Recolección y procesamiento de corpus; Universidad Pedagógica y Tecnológica de Colombia; Cuadernos de Linguistica Hispanica; 39; 2-2022; 1-210121-053X2346-1829CONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/http://periodicos.letras.ufmg.br/index.php/relin/article/view/18055info:eu-repo/semantics/altIdentifier/doi/10.19053/0121053X.n39.2022.14283info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2026-06-04T11:03:46Zoai:ri.conicet.gov.ar:11336/217899instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982026-06-04 11:03:47.192CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv	Claves para analizar datos en Twitter: Recolección y procesamiento de corpus Keys for Analyzing Data on Twitter: Corpus Collection and Processing Chaves para analisar dados no Twitter: Coleta e processamento de corpus Clés de l'analyse des données sur Twitter: Collecte et traitement du corpus
title	Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
spellingShingle	Claves para analizar datos en Twitter: Recolección y procesamiento de corpus Bonilla Neira, Laura Cristina CONSTRUCCIÓN DE CORPUS DISCURSO DIGITAL ANÁLISIS DEL DISCURSO METODOLOGÍA NETNOGRAFÍA TWITTER
title_short	Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
title_full	Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
title_fullStr	Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
title_full_unstemmed	Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
title_sort	Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
dc.creator.none.fl_str_mv	Bonilla Neira, Laura Cristina
author	Bonilla Neira, Laura Cristina
author_facet	Bonilla Neira, Laura Cristina
author_role	author
dc.subject.none.fl_str_mv	CONSTRUCCIÓN DE CORPUS DISCURSO DIGITAL ANÁLISIS DEL DISCURSO METODOLOGÍA NETNOGRAFÍA TWITTER
topic	CONSTRUCCIÓN DE CORPUS DISCURSO DIGITAL ANÁLISIS DEL DISCURSO METODOLOGÍA NETNOGRAFÍA TWITTER
purl_subject.fl_str_mv	https://purl.org/becyt/ford/6.2 https://purl.org/becyt/ford/6
dc.description.none.fl_txt_mv	El objetivo de este trabajo es presentar una propuesta metodológica para el análisis de datos de Twitter con un enfoque mixto. Específicamente, el procedimiento de recolección y procesamiento de la información se caracteriza por retomar recursos cualitativos y cuantitativos, así como por la construcción de un corpus manejable para un posterior análisis cualitativo. El procedimiento para abordar los discursos digitales de Twitter consiste en: 1) registro de la etnografía virtual, 2) recolección de los datos por medio de la API de Twitter usando Python; 3) visualización y filtrado de los datos con Open Refine; 4) construcción del corpus 5) categorización y etiquetado de los enunciados verbo-icónicos con Atlas.ti. El trabajo reconstruye el recorrido metodológico llevado a cabo en una investigación doctoral en curso con enfoque cualitativo, de la cual se extraen los ejemplos, con el fin de ofrecer una ruta accesible que pueda ser replicada en investigaciones con este tipo de datos. This paper aims to present a methodological proposal for the analysis of Twitter data from a mixed approach. Specifically, the procedure for collecting and processing information is characterized by the use of qualitative and quantitative resources, as well as the construction of a manageable corpus for subsequent qualitative analysis. The procedure to approach Twitter digital discourses consists of the following route: 1) virtual ethnography registration; 2) data collection through the Twitter API using Python; 3) visualisation and filtering of the data with Open Refine; 4) corpus construction; 5) categorisation and labelling of the iconic verb utterances with Atlas. ti. The paper reconstructs the methodological path carried out in ongoing doctoral research with a qualitative approach, from which the examples are extracted, to offer an accessible route that can be replicated in research with this type of data. L'objectif de cet article est de présenter une proposition méthodologique pour l'analyse des données Twitter avec une approche mixte. Plus précisément, la procédure de collecte et de traitement des données est caractérisée par la réutilisation de ressources qualitatives et quantitatives, ainsi que par la construction d'un corpus gérable pour une analyse qualitative ultérieure. La procédure pour aborder des discours numériques de Twitter consiste à : 1) enregistrement de l'ethnographie virtuelle, 2) collecte des données au moyen de l'API Twitter en utilisant Python ; 3) visualisation et filtrage des données avec Open Refine ; 4) construction du corpus 5) catégorisation et étiquetage des énoncés verbo-iconiques avec Atlas.ti. L'article reconstruit le parcours méthodologique réalisé dans une recherche doctorale en cours avec une approche qualitative, d'où sont extraits les exemples, afin d'en offrir un parcours accessible et rééditable dans les recherches avec ce type de données. O objetivo deste trabalho é apresentar uma proposta metodológica para a análise de dados do Twitter com uma abordagem mista. Especificamente, o procedimento de coleta e tratamento da informação caracteriza-se pela utilização de recursos qualitativos e quantitativos, bem como pela construção de um corpus gerenciável para posterior análise qualitativa. O procedimento de abordagem dos discursos digitais do Twitter consiste em: 1) registro da etnografia virtual; 2) coleta de dados por meio da API do Twitter utilizando Python; 3) visualização e filtragem de dados com Open Refine; 4) construção do corpus 5) categorização e rotulagem dos enunciados verboicônicos com o Atlas.ti. O trabalho reconstrói o percurso metodológico realizado em uma pesquisa de doutorado em andamento com abordagem qualitativa, de onde são extraídos os exemplos, a fim de oferecer um percurso acessível que possa ser replicado em pesquisas com esse tipo de dado. Fil: Bonilla Neira, Laura Cristina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad de Buenos Aires. Facultad de Filosofía y Letras. Instituto de Lingüística; Argentina
description	El objetivo de este trabajo es presentar una propuesta metodológica para el análisis de datos de Twitter con un enfoque mixto. Específicamente, el procedimiento de recolección y procesamiento de la información se caracteriza por retomar recursos cualitativos y cuantitativos, así como por la construcción de un corpus manejable para un posterior análisis cualitativo. El procedimiento para abordar los discursos digitales de Twitter consiste en: 1) registro de la etnografía virtual, 2) recolección de los datos por medio de la API de Twitter usando Python; 3) visualización y filtrado de los datos con Open Refine; 4) construcción del corpus 5) categorización y etiquetado de los enunciados verbo-icónicos con Atlas.ti. El trabajo reconstruye el recorrido metodológico llevado a cabo en una investigación doctoral en curso con enfoque cualitativo, de la cual se extraen los ejemplos, con el fin de ofrecer una ruta accesible que pueda ser replicada en investigaciones con este tipo de datos.
publishDate	2022
dc.date.none.fl_str_mv	2022-02
dc.type.none.fl_str_mv	info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_6501 info:ar-repo/semantics/articulo
format	article
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://hdl.handle.net/11336/217899 Bonilla Neira, Laura Cristina; Claves para analizar datos en Twitter: Recolección y procesamiento de corpus; Universidad Pedagógica y Tecnológica de Colombia; Cuadernos de Linguistica Hispanica; 39; 2-2022; 1-21 0121-053X 2346-1829 CONICET Digital CONICET
url	http://hdl.handle.net/11336/217899
identifier_str_mv	Bonilla Neira, Laura Cristina; Claves para analizar datos en Twitter: Recolección y procesamiento de corpus; Universidad Pedagógica y Tecnológica de Colombia; Cuadernos de Linguistica Hispanica; 39; 2-2022; 1-21 0121-053X 2346-1829 CONICET Digital CONICET
dc.language.none.fl_str_mv	spa
language	spa
dc.relation.none.fl_str_mv	info:eu-repo/semantics/altIdentifier/url/http://periodicos.letras.ufmg.br/index.php/relin/article/view/18055 info:eu-repo/semantics/altIdentifier/doi/10.19053/0121053X.n39.2022.14283
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv	openAccess
rights_invalid_str_mv	https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv	application/pdf application/pdf
dc.publisher.none.fl_str_mv	Universidad Pedagógica y Tecnológica de Colombia
publisher.none.fl_str_mv	Universidad Pedagógica y Tecnológica de Colombia
dc.source.none.fl_str_mv	reponame:CONICET Digital (CONICET) instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str	CONICET Digital (CONICET)
collection	CONICET Digital (CONICET)
instname_str	Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv	CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv	dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_	1867098868391346176
score	12.832306

Claves para analizar datos en Twitter: Recolección y procesamiento de corpus

Publicaciones similares