Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019

Autores
Piñeyrúa, Florencia
Año de publicación
2021
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión aceptada
Colaborador/a o director/a de tesis
Rosati, Germán
Focás, Brenda
Descripción
Tesis de Licenciatura
La tesina es un trabajo exploratorio donde mostramos la aplicación de técnicas de procesamiento de lenguaje natural y web scraping sobre un corpus de noticias digitales. El objetivo general es explorar la aplicación de una técnica de procesamiento de lenguaje natural (modelado de tópicos) para estudiar el contenido de noticias digitales. Para ello, utilizamos como soporte empírico las piezas periodísticas publicadas desde julio a septiembre 2019 en los portales Clarín, La Nación, Infobae, Página 12, Télam, Perfil, Crónica y Minuto Uno. Se utilizan datos primarios construidos a partir de la técnica de web scraping. La metodología aplicada combina el análisis descriptivo y una técnica de procesamiento de lenguaje natural para la detección de tópicos (topic modelling) y, en particular, con la implementación del método Latent Dirichlet Allocation (LDA). Los resultados de la modelización de tópicos muestran que los principales temas de la agenda mediática digital son las elecciones, los espectáculos, el deporte, la seguridad, la política exterior, la obra pública y la economía. En el contexto de las elecciones Primarias Abiertas Simultáneas y Obligatorias la frecuencia de publicación de las noticias securitarias fue de casi 2 de cada 10 piezas periodísticas. La principal conclusión de este trabajo es que la combinación de la técnica web scraping y procesamiento de lenguaje natural pueden ser de utilidad para incrementar la escalabilidad (aumentar la captura de información y reducir los tiempos de selección y análisis de tópicos) en los estudios de contenido de noticias.
Fil: Piñeyrúa, Florencia. Universidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios Sociales; Argentina
Materia
SOCIOLOGÍA
ANÁLISIS DE REDES
FLUJO DE NOTICIAS
MEDIOS DE INFORMACIÓN
PERIÓDICO
SEGURIDAD
CLARÍN (FIRMA)
LA NACIÓN (FIRMA)
INFOBAE (FIRMA)
PÁGINA/12 (FIRMA)
TÉLAM (FIRMA)
PERFIL (FIRMA)
CRÓNICA (FIRMA)
MINUTO UNO (FIRMA)
ARGENTINA
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
Repositorio Institucional (UNSAM)
Institución
Universidad Nacional de General San Martín
OAI Identificador
oai:ri.unsam.edu.ar:123456789/1651

id RIUNSAM_c81db8d2f7504547d19ef488dcb84b10
oai_identifier_str oai:ri.unsam.edu.ar:123456789/1651
network_acronym_str RIUNSAM
repository_id_str s
network_name_str Repositorio Institucional (UNSAM)
spelling Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019Piñeyrúa, FlorenciaSOCIOLOGÍAANÁLISIS DE REDESFLUJO DE NOTICIASMEDIOS DE INFORMACIÓNPERIÓDICOSEGURIDADCLARÍN (FIRMA)LA NACIÓN (FIRMA)INFOBAE (FIRMA)PÁGINA/12 (FIRMA)TÉLAM (FIRMA)PERFIL (FIRMA)CRÓNICA (FIRMA)MINUTO UNO (FIRMA)ARGENTINATesis de LicenciaturaLa tesina es un trabajo exploratorio donde mostramos la aplicación de técnicas de procesamiento de lenguaje natural y web scraping sobre un corpus de noticias digitales. El objetivo general es explorar la aplicación de una técnica de procesamiento de lenguaje natural (modelado de tópicos) para estudiar el contenido de noticias digitales. Para ello, utilizamos como soporte empírico las piezas periodísticas publicadas desde julio a septiembre 2019 en los portales Clarín, La Nación, Infobae, Página 12, Télam, Perfil, Crónica y Minuto Uno. Se utilizan datos primarios construidos a partir de la técnica de web scraping. La metodología aplicada combina el análisis descriptivo y una técnica de procesamiento de lenguaje natural para la detección de tópicos (topic modelling) y, en particular, con la implementación del método Latent Dirichlet Allocation (LDA). Los resultados de la modelización de tópicos muestran que los principales temas de la agenda mediática digital son las elecciones, los espectáculos, el deporte, la seguridad, la política exterior, la obra pública y la economía. En el contexto de las elecciones Primarias Abiertas Simultáneas y Obligatorias la frecuencia de publicación de las noticias securitarias fue de casi 2 de cada 10 piezas periodísticas. La principal conclusión de este trabajo es que la combinación de la técnica web scraping y procesamiento de lenguaje natural pueden ser de utilidad para incrementar la escalabilidad (aumentar la captura de información y reducir los tiempos de selección y análisis de tópicos) en los estudios de contenido de noticias.Fil: Piñeyrúa, Florencia. Universidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios Sociales; ArgentinaUniversidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios SocialesRosati, GermánFocás, Brenda2021info:eu-repo/semantics/acceptedVersioninfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdf62 p.application/pdfPiñeyrúa, F. (2021). Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 [[Tesis de Licenciatura, Universidad Nacional de San Martín]. Disponible en Repositorio Institucional UNSAMTLIC_EIDAES_2021_PFhttps://ri.unsam.edu.ar/handle/123456789/1651spaARGinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/ar/Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5)reponame:Repositorio Institucional (UNSAM)instname:Universidad Nacional de General San Martín2025-10-16T10:11:47Zoai:ri.unsam.edu.ar:123456789/1651instacron:UNSAMInstitucionalhttp://ri.unsam.edu.arUniversidad públicaNo correspondehttp://ri.unsam.edu.ar/oai/lpastran@unsam.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:s2025-10-16 10:12:29.636Repositorio Institucional (UNSAM) - Universidad Nacional de General San Martínfalse
dc.title.none.fl_str_mv Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019
title Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019
spellingShingle Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019
Piñeyrúa, Florencia
SOCIOLOGÍA
ANÁLISIS DE REDES
FLUJO DE NOTICIAS
MEDIOS DE INFORMACIÓN
PERIÓDICO
SEGURIDAD
CLARÍN (FIRMA)
LA NACIÓN (FIRMA)
INFOBAE (FIRMA)
PÁGINA/12 (FIRMA)
TÉLAM (FIRMA)
PERFIL (FIRMA)
CRÓNICA (FIRMA)
MINUTO UNO (FIRMA)
ARGENTINA
title_short Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019
title_full Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019
title_fullStr Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019
title_full_unstemmed Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019
title_sort Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019
dc.creator.none.fl_str_mv Piñeyrúa, Florencia
author Piñeyrúa, Florencia
author_facet Piñeyrúa, Florencia
author_role author
dc.contributor.none.fl_str_mv Rosati, Germán
Focás, Brenda
dc.subject.none.fl_str_mv SOCIOLOGÍA
ANÁLISIS DE REDES
FLUJO DE NOTICIAS
MEDIOS DE INFORMACIÓN
PERIÓDICO
SEGURIDAD
CLARÍN (FIRMA)
LA NACIÓN (FIRMA)
INFOBAE (FIRMA)
PÁGINA/12 (FIRMA)
TÉLAM (FIRMA)
PERFIL (FIRMA)
CRÓNICA (FIRMA)
MINUTO UNO (FIRMA)
ARGENTINA
topic SOCIOLOGÍA
ANÁLISIS DE REDES
FLUJO DE NOTICIAS
MEDIOS DE INFORMACIÓN
PERIÓDICO
SEGURIDAD
CLARÍN (FIRMA)
LA NACIÓN (FIRMA)
INFOBAE (FIRMA)
PÁGINA/12 (FIRMA)
TÉLAM (FIRMA)
PERFIL (FIRMA)
CRÓNICA (FIRMA)
MINUTO UNO (FIRMA)
ARGENTINA
dc.description.none.fl_txt_mv Tesis de Licenciatura
La tesina es un trabajo exploratorio donde mostramos la aplicación de técnicas de procesamiento de lenguaje natural y web scraping sobre un corpus de noticias digitales. El objetivo general es explorar la aplicación de una técnica de procesamiento de lenguaje natural (modelado de tópicos) para estudiar el contenido de noticias digitales. Para ello, utilizamos como soporte empírico las piezas periodísticas publicadas desde julio a septiembre 2019 en los portales Clarín, La Nación, Infobae, Página 12, Télam, Perfil, Crónica y Minuto Uno. Se utilizan datos primarios construidos a partir de la técnica de web scraping. La metodología aplicada combina el análisis descriptivo y una técnica de procesamiento de lenguaje natural para la detección de tópicos (topic modelling) y, en particular, con la implementación del método Latent Dirichlet Allocation (LDA). Los resultados de la modelización de tópicos muestran que los principales temas de la agenda mediática digital son las elecciones, los espectáculos, el deporte, la seguridad, la política exterior, la obra pública y la economía. En el contexto de las elecciones Primarias Abiertas Simultáneas y Obligatorias la frecuencia de publicación de las noticias securitarias fue de casi 2 de cada 10 piezas periodísticas. La principal conclusión de este trabajo es que la combinación de la técnica web scraping y procesamiento de lenguaje natural pueden ser de utilidad para incrementar la escalabilidad (aumentar la captura de información y reducir los tiempos de selección y análisis de tópicos) en los estudios de contenido de noticias.
Fil: Piñeyrúa, Florencia. Universidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios Sociales; Argentina
description Tesis de Licenciatura
publishDate 2021
dc.date.none.fl_str_mv 2021
dc.type.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
info:eu-repo/semantics/bachelorThesis
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
status_str acceptedVersion
format bachelorThesis
dc.identifier.none.fl_str_mv Piñeyrúa, F. (2021). Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 [[Tesis de Licenciatura, Universidad Nacional de San Martín]. Disponible en Repositorio Institucional UNSAM
TLIC_EIDAES_2021_PF
https://ri.unsam.edu.ar/handle/123456789/1651
identifier_str_mv Piñeyrúa, F. (2021). Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 [[Tesis de Licenciatura, Universidad Nacional de San Martín]. Disponible en Repositorio Institucional UNSAM
TLIC_EIDAES_2021_PF
url https://ri.unsam.edu.ar/handle/123456789/1651
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5)
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5)
dc.format.none.fl_str_mv application/pdf
62 p.
application/pdf
dc.coverage.none.fl_str_mv ARG
dc.publisher.none.fl_str_mv Universidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios Sociales
publisher.none.fl_str_mv Universidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios Sociales
dc.source.none.fl_str_mv reponame:Repositorio Institucional (UNSAM)
instname:Universidad Nacional de General San Martín
reponame_str Repositorio Institucional (UNSAM)
collection Repositorio Institucional (UNSAM)
instname_str Universidad Nacional de General San Martín
repository.name.fl_str_mv Repositorio Institucional (UNSAM) - Universidad Nacional de General San Martín
repository.mail.fl_str_mv lpastran@unsam.edu.ar
_version_ 1846146209826209792
score 12.712165