Claves para analizar datos en Twitter: Recolección y procesamiento de corpus

Autores
Bonilla Neira, Laura Cristina
Año de publicación
2022
Idioma
español castellano
Tipo de recurso
artículo
Estado
versión publicada
Descripción
El objetivo de este trabajo es presentar una propuesta metodológica para el análisis de datos de Twitter con un enfoque mixto. Específicamente, el procedimiento de recolección y procesamiento de la información se caracteriza por retomar recursos cualitativos y cuantitativos, así como por la construcción de un corpus manejable para un posterior análisis cualitativo. El procedimiento para abordar los discursos digitales de Twitter consiste en: 1) registro de la etnografía virtual, 2) recolección de los datos por medio de la API de Twitter usando Python; 3) visualización y filtrado de los datos con Open Refine; 4) construcción del corpus 5) categorización y etiquetado de los enunciados verbo-icónicos con Atlas.ti. El trabajo reconstruye el recorrido metodológico llevado a cabo en una investigación doctoral en curso con enfoque cualitativo, de la cual se extraen los ejemplos, con el fin de ofrecer una ruta accesible que pueda ser replicada en investigaciones con este tipo de datos.
This paper aims to present a methodological proposal for the analysis of Twitter data from a mixed approach. Specifically, the procedure for collecting and processing information is characterized by the use of qualitative and quantitative resources, as well as the construction of a manageable corpus for subsequent qualitative analysis. The procedure to approach Twitter digital discourses consists of the following route: 1) virtual ethnography registration; 2) data collection through the Twitter API using Python; 3) visualisation and filtering of the data with Open Refine; 4) corpus construction; 5) categorisation and labelling of the iconic verb utterances with Atlas. ti. The paper reconstructs the methodological path carried out in ongoing doctoral research with a qualitative approach, from which the examples are extracted, to offer an accessible route that can be replicated in research with this type of data.
L'objectif de cet article est de présenter une proposition méthodologique pour l'analyse des données Twitter avec une approche mixte. Plus précisément, la procédure de collecte et de traitement des données est caractérisée par la réutilisation de ressources qualitatives et quantitatives, ainsi que par la construction d'un corpus gérable pour une analyse qualitative ultérieure. La procédure pour aborder des discours numériques de Twitter consiste à : 1) enregistrement de l'ethnographie virtuelle, 2) collecte des données au moyen de l'API Twitter en utilisant Python ; 3) visualisation et filtrage des données avec Open Refine ; 4) construction du corpus 5) catégorisation et étiquetage des énoncés verbo-iconiques avec Atlas.ti. L'article reconstruit le parcours méthodologique réalisé dans une recherche doctorale en cours avec une approche qualitative, d'où sont extraits les exemples, afin d'en offrir un parcours accessible et rééditable dans les recherches avec ce type de données.
O objetivo deste trabalho é apresentar uma proposta metodológica para a análise de dados do Twitter com uma abordagem mista. Especificamente, o procedimento de coleta e tratamento da informação caracteriza-se pela utilização de recursos qualitativos e quantitativos, bem como pela construção de um corpus gerenciável para posterior análise qualitativa. O procedimento de abordagem dos discursos digitais do Twitter consiste em: 1) registro da etnografia virtual; 2) coleta de dados por meio da API do Twitter utilizando Python; 3) visualização e filtragem de dados com Open Refine; 4) construção do corpus 5) categorização e rotulagem dos enunciados verboicônicos com o Atlas.ti. O trabalho reconstrói o percurso metodológico realizado em uma pesquisa de doutorado em andamento com abordagem qualitativa, de onde são extraídos os exemplos, a fim de oferecer um percurso acessível que possa ser replicado em pesquisas com esse tipo de dado.
Fil: Bonilla Neira, Laura Cristina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad de Buenos Aires. Facultad de Filosofía y Letras. Instituto de Lingüística; Argentina
Materia
CONSTRUCCIÓN DE CORPUS
DISCURSO DIGITAL
ANÁLISIS DEL DISCURSO
METODOLOGÍA
NETNOGRAFÍA
TWITTER
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
CONICET Digital (CONICET)
Institución
Consejo Nacional de Investigaciones Científicas y Técnicas
OAI Identificador
oai:ri.conicet.gov.ar:11336/217899

id CONICETDig_3709ec95b194b79578af2cc01c195585
oai_identifier_str oai:ri.conicet.gov.ar:11336/217899
network_acronym_str CONICETDig
repository_id_str 3498
network_name_str CONICET Digital (CONICET)
spelling Claves para analizar datos en Twitter: Recolección y procesamiento de corpusKeys for Analyzing Data on Twitter: Corpus Collection and ProcessingChaves para analisar dados no Twitter: Coleta e processamento de corpusClés de l'analyse des données sur Twitter: Collecte et traitement du corpusBonilla Neira, Laura CristinaCONSTRUCCIÓN DE CORPUSDISCURSO DIGITALANÁLISIS DEL DISCURSOMETODOLOGÍANETNOGRAFÍATWITTERhttps://purl.org/becyt/ford/6.2https://purl.org/becyt/ford/6El objetivo de este trabajo es presentar una propuesta metodológica para el análisis de datos de Twitter con un enfoque mixto. Específicamente, el procedimiento de recolección y procesamiento de la información se caracteriza por retomar recursos cualitativos y cuantitativos, así como por la construcción de un corpus manejable para un posterior análisis cualitativo. El procedimiento para abordar los discursos digitales de Twitter consiste en: 1) registro de la etnografía virtual, 2) recolección de los datos por medio de la API de Twitter usando Python; 3) visualización y filtrado de los datos con Open Refine; 4) construcción del corpus 5) categorización y etiquetado de los enunciados verbo-icónicos con Atlas.ti. El trabajo reconstruye el recorrido metodológico llevado a cabo en una investigación doctoral en curso con enfoque cualitativo, de la cual se extraen los ejemplos, con el fin de ofrecer una ruta accesible que pueda ser replicada en investigaciones con este tipo de datos.This paper aims to present a methodological proposal for the analysis of Twitter data from a mixed approach. Specifically, the procedure for collecting and processing information is characterized by the use of qualitative and quantitative resources, as well as the construction of a manageable corpus for subsequent qualitative analysis. The procedure to approach Twitter digital discourses consists of the following route: 1) virtual ethnography registration; 2) data collection through the Twitter API using Python; 3) visualisation and filtering of the data with Open Refine; 4) corpus construction; 5) categorisation and labelling of the iconic verb utterances with Atlas. ti. The paper reconstructs the methodological path carried out in ongoing doctoral research with a qualitative approach, from which the examples are extracted, to offer an accessible route that can be replicated in research with this type of data.L'objectif de cet article est de présenter une proposition méthodologique pour l'analyse des données Twitter avec une approche mixte. Plus précisément, la procédure de collecte et de traitement des données est caractérisée par la réutilisation de ressources qualitatives et quantitatives, ainsi que par la construction d'un corpus gérable pour une analyse qualitative ultérieure. La procédure pour aborder des discours numériques de Twitter consiste à : 1) enregistrement de l'ethnographie virtuelle, 2) collecte des données au moyen de l'API Twitter en utilisant Python ; 3) visualisation et filtrage des données avec Open Refine ; 4) construction du corpus 5) catégorisation et étiquetage des énoncés verbo-iconiques avec Atlas.ti. L'article reconstruit le parcours méthodologique réalisé dans une recherche doctorale en cours avec une approche qualitative, d'où sont extraits les exemples, afin d'en offrir un parcours accessible et rééditable dans les recherches avec ce type de données.O objetivo deste trabalho é apresentar uma proposta metodológica para a análise de dados do Twitter com uma abordagem mista. Especificamente, o procedimento de coleta e tratamento da informação caracteriza-se pela utilização de recursos qualitativos e quantitativos, bem como pela construção de um corpus gerenciável para posterior análise qualitativa. O procedimento de abordagem dos discursos digitais do Twitter consiste em: 1) registro da etnografia virtual; 2) coleta de dados por meio da API do Twitter utilizando Python; 3) visualização e filtragem de dados com Open Refine; 4) construção do corpus 5) categorização e rotulagem dos enunciados verboicônicos com o Atlas.ti. O trabalho reconstrói o percurso metodológico realizado em uma pesquisa de doutorado em andamento com abordagem qualitativa, de onde são extraídos os exemplos, a fim de oferecer um percurso acessível que possa ser replicado em pesquisas com esse tipo de dado.Fil: Bonilla Neira, Laura Cristina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad de Buenos Aires. Facultad de Filosofía y Letras. Instituto de Lingüística; ArgentinaUniversidad Pedagógica y Tecnológica de Colombia2022-02info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_6501info:ar-repo/semantics/articuloapplication/pdfapplication/pdfhttp://hdl.handle.net/11336/217899Bonilla Neira, Laura Cristina; Claves para analizar datos en Twitter: Recolección y procesamiento de corpus; Universidad Pedagógica y Tecnológica de Colombia; Cuadernos de Linguistica Hispanica; 39; 2-2022; 1-210121-053X2346-1829CONICET DigitalCONICETspainfo:eu-repo/semantics/altIdentifier/url/http://periodicos.letras.ufmg.br/index.php/relin/article/view/18055info:eu-repo/semantics/altIdentifier/doi/10.19053/0121053X.n39.2022.14283info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/reponame:CONICET Digital (CONICET)instname:Consejo Nacional de Investigaciones Científicas y Técnicas2025-09-17T11:12:53Zoai:ri.conicet.gov.ar:11336/217899instacron:CONICETInstitucionalhttp://ri.conicet.gov.ar/Organismo científico-tecnológicoNo correspondehttp://ri.conicet.gov.ar/oai/requestdasensio@conicet.gov.ar; lcarlino@conicet.gov.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:34982025-09-17 11:12:53.681CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicasfalse
dc.title.none.fl_str_mv Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
Keys for Analyzing Data on Twitter: Corpus Collection and Processing
Chaves para analisar dados no Twitter: Coleta e processamento de corpus
Clés de l'analyse des données sur Twitter: Collecte et traitement du corpus
title Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
spellingShingle Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
Bonilla Neira, Laura Cristina
CONSTRUCCIÓN DE CORPUS
DISCURSO DIGITAL
ANÁLISIS DEL DISCURSO
METODOLOGÍA
NETNOGRAFÍA
TWITTER
title_short Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
title_full Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
title_fullStr Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
title_full_unstemmed Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
title_sort Claves para analizar datos en Twitter: Recolección y procesamiento de corpus
dc.creator.none.fl_str_mv Bonilla Neira, Laura Cristina
author Bonilla Neira, Laura Cristina
author_facet Bonilla Neira, Laura Cristina
author_role author
dc.subject.none.fl_str_mv CONSTRUCCIÓN DE CORPUS
DISCURSO DIGITAL
ANÁLISIS DEL DISCURSO
METODOLOGÍA
NETNOGRAFÍA
TWITTER
topic CONSTRUCCIÓN DE CORPUS
DISCURSO DIGITAL
ANÁLISIS DEL DISCURSO
METODOLOGÍA
NETNOGRAFÍA
TWITTER
purl_subject.fl_str_mv https://purl.org/becyt/ford/6.2
https://purl.org/becyt/ford/6
dc.description.none.fl_txt_mv El objetivo de este trabajo es presentar una propuesta metodológica para el análisis de datos de Twitter con un enfoque mixto. Específicamente, el procedimiento de recolección y procesamiento de la información se caracteriza por retomar recursos cualitativos y cuantitativos, así como por la construcción de un corpus manejable para un posterior análisis cualitativo. El procedimiento para abordar los discursos digitales de Twitter consiste en: 1) registro de la etnografía virtual, 2) recolección de los datos por medio de la API de Twitter usando Python; 3) visualización y filtrado de los datos con Open Refine; 4) construcción del corpus 5) categorización y etiquetado de los enunciados verbo-icónicos con Atlas.ti. El trabajo reconstruye el recorrido metodológico llevado a cabo en una investigación doctoral en curso con enfoque cualitativo, de la cual se extraen los ejemplos, con el fin de ofrecer una ruta accesible que pueda ser replicada en investigaciones con este tipo de datos.
This paper aims to present a methodological proposal for the analysis of Twitter data from a mixed approach. Specifically, the procedure for collecting and processing information is characterized by the use of qualitative and quantitative resources, as well as the construction of a manageable corpus for subsequent qualitative analysis. The procedure to approach Twitter digital discourses consists of the following route: 1) virtual ethnography registration; 2) data collection through the Twitter API using Python; 3) visualisation and filtering of the data with Open Refine; 4) corpus construction; 5) categorisation and labelling of the iconic verb utterances with Atlas. ti. The paper reconstructs the methodological path carried out in ongoing doctoral research with a qualitative approach, from which the examples are extracted, to offer an accessible route that can be replicated in research with this type of data.
L'objectif de cet article est de présenter une proposition méthodologique pour l'analyse des données Twitter avec une approche mixte. Plus précisément, la procédure de collecte et de traitement des données est caractérisée par la réutilisation de ressources qualitatives et quantitatives, ainsi que par la construction d'un corpus gérable pour une analyse qualitative ultérieure. La procédure pour aborder des discours numériques de Twitter consiste à : 1) enregistrement de l'ethnographie virtuelle, 2) collecte des données au moyen de l'API Twitter en utilisant Python ; 3) visualisation et filtrage des données avec Open Refine ; 4) construction du corpus 5) catégorisation et étiquetage des énoncés verbo-iconiques avec Atlas.ti. L'article reconstruit le parcours méthodologique réalisé dans une recherche doctorale en cours avec une approche qualitative, d'où sont extraits les exemples, afin d'en offrir un parcours accessible et rééditable dans les recherches avec ce type de données.
O objetivo deste trabalho é apresentar uma proposta metodológica para a análise de dados do Twitter com uma abordagem mista. Especificamente, o procedimento de coleta e tratamento da informação caracteriza-se pela utilização de recursos qualitativos e quantitativos, bem como pela construção de um corpus gerenciável para posterior análise qualitativa. O procedimento de abordagem dos discursos digitais do Twitter consiste em: 1) registro da etnografia virtual; 2) coleta de dados por meio da API do Twitter utilizando Python; 3) visualização e filtragem de dados com Open Refine; 4) construção do corpus 5) categorização e rotulagem dos enunciados verboicônicos com o Atlas.ti. O trabalho reconstrói o percurso metodológico realizado em uma pesquisa de doutorado em andamento com abordagem qualitativa, de onde são extraídos os exemplos, a fim de oferecer um percurso acessível que possa ser replicado em pesquisas com esse tipo de dado.
Fil: Bonilla Neira, Laura Cristina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad de Buenos Aires. Facultad de Filosofía y Letras. Instituto de Lingüística; Argentina
description El objetivo de este trabajo es presentar una propuesta metodológica para el análisis de datos de Twitter con un enfoque mixto. Específicamente, el procedimiento de recolección y procesamiento de la información se caracteriza por retomar recursos cualitativos y cuantitativos, así como por la construcción de un corpus manejable para un posterior análisis cualitativo. El procedimiento para abordar los discursos digitales de Twitter consiste en: 1) registro de la etnografía virtual, 2) recolección de los datos por medio de la API de Twitter usando Python; 3) visualización y filtrado de los datos con Open Refine; 4) construcción del corpus 5) categorización y etiquetado de los enunciados verbo-icónicos con Atlas.ti. El trabajo reconstruye el recorrido metodológico llevado a cabo en una investigación doctoral en curso con enfoque cualitativo, de la cual se extraen los ejemplos, con el fin de ofrecer una ruta accesible que pueda ser replicada en investigaciones con este tipo de datos.
publishDate 2022
dc.date.none.fl_str_mv 2022-02
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_6501
info:ar-repo/semantics/articulo
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv http://hdl.handle.net/11336/217899
Bonilla Neira, Laura Cristina; Claves para analizar datos en Twitter: Recolección y procesamiento de corpus; Universidad Pedagógica y Tecnológica de Colombia; Cuadernos de Linguistica Hispanica; 39; 2-2022; 1-21
0121-053X
2346-1829
CONICET Digital
CONICET
url http://hdl.handle.net/11336/217899
identifier_str_mv Bonilla Neira, Laura Cristina; Claves para analizar datos en Twitter: Recolección y procesamiento de corpus; Universidad Pedagógica y Tecnológica de Colombia; Cuadernos de Linguistica Hispanica; 39; 2-2022; 1-21
0121-053X
2346-1829
CONICET Digital
CONICET
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/semantics/altIdentifier/url/http://periodicos.letras.ufmg.br/index.php/relin/article/view/18055
info:eu-repo/semantics/altIdentifier/doi/10.19053/0121053X.n39.2022.14283
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad Pedagógica y Tecnológica de Colombia
publisher.none.fl_str_mv Universidad Pedagógica y Tecnológica de Colombia
dc.source.none.fl_str_mv reponame:CONICET Digital (CONICET)
instname:Consejo Nacional de Investigaciones Científicas y Técnicas
reponame_str CONICET Digital (CONICET)
collection CONICET Digital (CONICET)
instname_str Consejo Nacional de Investigaciones Científicas y Técnicas
repository.name.fl_str_mv CONICET Digital (CONICET) - Consejo Nacional de Investigaciones Científicas y Técnicas
repository.mail.fl_str_mv dasensio@conicet.gov.ar; lcarlino@conicet.gov.ar
_version_ 1843606463456477184
score 13.001348