Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019
- Autores
- Piñeyrúa, Florencia
- Año de publicación
- 2021
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión aceptada
- Colaborador/a o director/a de tesis
- Rosati, Germán
Focás, Brenda - Descripción
- Tesis de Licenciatura
La tesina es un trabajo exploratorio donde mostramos la aplicación de técnicas de procesamiento de lenguaje natural y web scraping sobre un corpus de noticias digitales. El objetivo general es explorar la aplicación de una técnica de procesamiento de lenguaje natural (modelado de tópicos) para estudiar el contenido de noticias digitales. Para ello, utilizamos como soporte empírico las piezas periodísticas publicadas desde julio a septiembre 2019 en los portales Clarín, La Nación, Infobae, Página 12, Télam, Perfil, Crónica y Minuto Uno. Se utilizan datos primarios construidos a partir de la técnica de web scraping. La metodología aplicada combina el análisis descriptivo y una técnica de procesamiento de lenguaje natural para la detección de tópicos (topic modelling) y, en particular, con la implementación del método Latent Dirichlet Allocation (LDA). Los resultados de la modelización de tópicos muestran que los principales temas de la agenda mediática digital son las elecciones, los espectáculos, el deporte, la seguridad, la política exterior, la obra pública y la economía. En el contexto de las elecciones Primarias Abiertas Simultáneas y Obligatorias la frecuencia de publicación de las noticias securitarias fue de casi 2 de cada 10 piezas periodísticas. La principal conclusión de este trabajo es que la combinación de la técnica web scraping y procesamiento de lenguaje natural pueden ser de utilidad para incrementar la escalabilidad (aumentar la captura de información y reducir los tiempos de selección y análisis de tópicos) en los estudios de contenido de noticias.
Fil: Piñeyrúa, Florencia. Universidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios Sociales; Argentina - Materia
-
SOCIOLOGÍA
ANÁLISIS DE REDES
FLUJO DE NOTICIAS
MEDIOS DE INFORMACIÓN
PERIÓDICO
SEGURIDAD
CLARÍN (FIRMA)
LA NACIÓN (FIRMA)
INFOBAE (FIRMA)
PÁGINA/12 (FIRMA)
TÉLAM (FIRMA)
PERFIL (FIRMA)
CRÓNICA (FIRMA)
MINUTO UNO (FIRMA)
ARGENTINA - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/2.5/ar/
- Repositorio
- Institución
- Universidad Nacional de General San Martín
- OAI Identificador
- oai:ri.unsam.edu.ar:123456789/1651
Ver los metadatos del registro completo
id |
RIUNSAM_c81db8d2f7504547d19ef488dcb84b10 |
---|---|
oai_identifier_str |
oai:ri.unsam.edu.ar:123456789/1651 |
network_acronym_str |
RIUNSAM |
repository_id_str |
s |
network_name_str |
Repositorio Institucional (UNSAM) |
spelling |
Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019Piñeyrúa, FlorenciaSOCIOLOGÍAANÁLISIS DE REDESFLUJO DE NOTICIASMEDIOS DE INFORMACIÓNPERIÓDICOSEGURIDADCLARÍN (FIRMA)LA NACIÓN (FIRMA)INFOBAE (FIRMA)PÁGINA/12 (FIRMA)TÉLAM (FIRMA)PERFIL (FIRMA)CRÓNICA (FIRMA)MINUTO UNO (FIRMA)ARGENTINATesis de LicenciaturaLa tesina es un trabajo exploratorio donde mostramos la aplicación de técnicas de procesamiento de lenguaje natural y web scraping sobre un corpus de noticias digitales. El objetivo general es explorar la aplicación de una técnica de procesamiento de lenguaje natural (modelado de tópicos) para estudiar el contenido de noticias digitales. Para ello, utilizamos como soporte empírico las piezas periodísticas publicadas desde julio a septiembre 2019 en los portales Clarín, La Nación, Infobae, Página 12, Télam, Perfil, Crónica y Minuto Uno. Se utilizan datos primarios construidos a partir de la técnica de web scraping. La metodología aplicada combina el análisis descriptivo y una técnica de procesamiento de lenguaje natural para la detección de tópicos (topic modelling) y, en particular, con la implementación del método Latent Dirichlet Allocation (LDA). Los resultados de la modelización de tópicos muestran que los principales temas de la agenda mediática digital son las elecciones, los espectáculos, el deporte, la seguridad, la política exterior, la obra pública y la economía. En el contexto de las elecciones Primarias Abiertas Simultáneas y Obligatorias la frecuencia de publicación de las noticias securitarias fue de casi 2 de cada 10 piezas periodísticas. La principal conclusión de este trabajo es que la combinación de la técnica web scraping y procesamiento de lenguaje natural pueden ser de utilidad para incrementar la escalabilidad (aumentar la captura de información y reducir los tiempos de selección y análisis de tópicos) en los estudios de contenido de noticias.Fil: Piñeyrúa, Florencia. Universidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios Sociales; ArgentinaUniversidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios SocialesRosati, GermánFocás, Brenda2021info:eu-repo/semantics/acceptedVersioninfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdf62 p.application/pdfPiñeyrúa, F. (2021). Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 [[Tesis de Licenciatura, Universidad Nacional de San Martín]. Disponible en Repositorio Institucional UNSAMTLIC_EIDAES_2021_PFhttps://ri.unsam.edu.ar/handle/123456789/1651spaARGinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/ar/Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5)reponame:Repositorio Institucional (UNSAM)instname:Universidad Nacional de General San Martín2025-10-16T10:11:47Zoai:ri.unsam.edu.ar:123456789/1651instacron:UNSAMInstitucionalhttp://ri.unsam.edu.arUniversidad públicaNo correspondehttp://ri.unsam.edu.ar/oai/lpastran@unsam.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:s2025-10-16 10:12:29.636Repositorio Institucional (UNSAM) - Universidad Nacional de General San Martínfalse |
dc.title.none.fl_str_mv |
Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 |
title |
Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 |
spellingShingle |
Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 Piñeyrúa, Florencia SOCIOLOGÍA ANÁLISIS DE REDES FLUJO DE NOTICIAS MEDIOS DE INFORMACIÓN PERIÓDICO SEGURIDAD CLARÍN (FIRMA) LA NACIÓN (FIRMA) INFOBAE (FIRMA) PÁGINA/12 (FIRMA) TÉLAM (FIRMA) PERFIL (FIRMA) CRÓNICA (FIRMA) MINUTO UNO (FIRMA) ARGENTINA |
title_short |
Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 |
title_full |
Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 |
title_fullStr |
Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 |
title_full_unstemmed |
Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 |
title_sort |
Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 |
dc.creator.none.fl_str_mv |
Piñeyrúa, Florencia |
author |
Piñeyrúa, Florencia |
author_facet |
Piñeyrúa, Florencia |
author_role |
author |
dc.contributor.none.fl_str_mv |
Rosati, Germán Focás, Brenda |
dc.subject.none.fl_str_mv |
SOCIOLOGÍA ANÁLISIS DE REDES FLUJO DE NOTICIAS MEDIOS DE INFORMACIÓN PERIÓDICO SEGURIDAD CLARÍN (FIRMA) LA NACIÓN (FIRMA) INFOBAE (FIRMA) PÁGINA/12 (FIRMA) TÉLAM (FIRMA) PERFIL (FIRMA) CRÓNICA (FIRMA) MINUTO UNO (FIRMA) ARGENTINA |
topic |
SOCIOLOGÍA ANÁLISIS DE REDES FLUJO DE NOTICIAS MEDIOS DE INFORMACIÓN PERIÓDICO SEGURIDAD CLARÍN (FIRMA) LA NACIÓN (FIRMA) INFOBAE (FIRMA) PÁGINA/12 (FIRMA) TÉLAM (FIRMA) PERFIL (FIRMA) CRÓNICA (FIRMA) MINUTO UNO (FIRMA) ARGENTINA |
dc.description.none.fl_txt_mv |
Tesis de Licenciatura La tesina es un trabajo exploratorio donde mostramos la aplicación de técnicas de procesamiento de lenguaje natural y web scraping sobre un corpus de noticias digitales. El objetivo general es explorar la aplicación de una técnica de procesamiento de lenguaje natural (modelado de tópicos) para estudiar el contenido de noticias digitales. Para ello, utilizamos como soporte empírico las piezas periodísticas publicadas desde julio a septiembre 2019 en los portales Clarín, La Nación, Infobae, Página 12, Télam, Perfil, Crónica y Minuto Uno. Se utilizan datos primarios construidos a partir de la técnica de web scraping. La metodología aplicada combina el análisis descriptivo y una técnica de procesamiento de lenguaje natural para la detección de tópicos (topic modelling) y, en particular, con la implementación del método Latent Dirichlet Allocation (LDA). Los resultados de la modelización de tópicos muestran que los principales temas de la agenda mediática digital son las elecciones, los espectáculos, el deporte, la seguridad, la política exterior, la obra pública y la economía. En el contexto de las elecciones Primarias Abiertas Simultáneas y Obligatorias la frecuencia de publicación de las noticias securitarias fue de casi 2 de cada 10 piezas periodísticas. La principal conclusión de este trabajo es que la combinación de la técnica web scraping y procesamiento de lenguaje natural pueden ser de utilidad para incrementar la escalabilidad (aumentar la captura de información y reducir los tiempos de selección y análisis de tópicos) en los estudios de contenido de noticias. Fil: Piñeyrúa, Florencia. Universidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios Sociales; Argentina |
description |
Tesis de Licenciatura |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/acceptedVersion info:eu-repo/semantics/bachelorThesis http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
status_str |
acceptedVersion |
format |
bachelorThesis |
dc.identifier.none.fl_str_mv |
Piñeyrúa, F. (2021). Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 [[Tesis de Licenciatura, Universidad Nacional de San Martín]. Disponible en Repositorio Institucional UNSAM TLIC_EIDAES_2021_PF https://ri.unsam.edu.ar/handle/123456789/1651 |
identifier_str_mv |
Piñeyrúa, F. (2021). Procesamiento del lenguaje natural aplicado al estudio de tópicos de noticias de seguridad en Argentina : julio a septiembre 2019 [[Tesis de Licenciatura, Universidad Nacional de San Martín]. Disponible en Repositorio Institucional UNSAM TLIC_EIDAES_2021_PF |
url |
https://ri.unsam.edu.ar/handle/123456789/1651 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5) |
dc.format.none.fl_str_mv |
application/pdf 62 p. application/pdf |
dc.coverage.none.fl_str_mv |
ARG |
dc.publisher.none.fl_str_mv |
Universidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios Sociales |
publisher.none.fl_str_mv |
Universidad Nacional de San Martín. Escuela Interdisciplinaria de Altos Estudios Sociales |
dc.source.none.fl_str_mv |
reponame:Repositorio Institucional (UNSAM) instname:Universidad Nacional de General San Martín |
reponame_str |
Repositorio Institucional (UNSAM) |
collection |
Repositorio Institucional (UNSAM) |
instname_str |
Universidad Nacional de General San Martín |
repository.name.fl_str_mv |
Repositorio Institucional (UNSAM) - Universidad Nacional de General San Martín |
repository.mail.fl_str_mv |
lpastran@unsam.edu.ar |
_version_ |
1846146209826209792 |
score |
12.712165 |