Clasificación automática de textos periodísticos usando Random Forest
- Autores
- Salinas, Juan; Izetta, Javier
- Año de publicación
- 2016
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- En los últimos anos el periodismo regional, al igual que en todas partes del mundo, pasó de su formato clásico de publicación al electrónico. Así las webs de noticias regionales también se ven obligadas a evolucionar y mejorar sus prestaciones a través de una mejor organización y categorización previa de toda la información disponible para el lector. En este trabajo se propone abordar la clasificación automática de textos periodísticos digitales a través del Aprendizaje Automatizado. Se presentan dos clasificadores automáticos de textos periodísticos extraídos de paginas webs de noticias del NOA basados en Random Forest y se proponen dos técnicas para la reducción de dimensionalidad del espacio de características. Estos clasificadores fueron evaluados con distintas colecciones de noticias demostrando un buen desempeño.
XVII Workshop Agentes y Sistemas Inteligentes (WASI).
Red de Universidades con Carreras en Informática (RedUNCI) - Materia
-
Ciencias Informáticas
archivo digital
Periodismo
aprendizaje automatizado
stemming - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/55733
Ver los metadatos del registro completo
id |
SEDICI_8087a839e3f3ff676503a2d744add891 |
---|---|
oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/55733 |
network_acronym_str |
SEDICI |
repository_id_str |
1329 |
network_name_str |
SEDICI (UNLP) |
spelling |
Clasificación automática de textos periodísticos usando Random ForestSalinas, JuanIzetta, JavierCiencias Informáticasarchivo digitalPeriodismoaprendizaje automatizadostemmingEn los últimos anos el periodismo regional, al igual que en todas partes del mundo, pasó de su formato clásico de publicación al electrónico. Así las webs de noticias regionales también se ven obligadas a evolucionar y mejorar sus prestaciones a través de una mejor organización y categorización previa de toda la información disponible para el lector. En este trabajo se propone abordar la clasificación automática de textos periodísticos digitales a través del Aprendizaje Automatizado. Se presentan dos clasificadores automáticos de textos periodísticos extraídos de paginas webs de noticias del NOA basados en Random Forest y se proponen dos técnicas para la reducción de dimensionalidad del espacio de características. Estos clasificadores fueron evaluados con distintas colecciones de noticias demostrando un buen desempeño.XVII Workshop Agentes y Sistemas Inteligentes (WASI).Red de Universidades con Carreras en Informática (RedUNCI)2016-10info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf34-44http://sedici.unlp.edu.ar/handle/10915/55733spainfo:eu-repo/semantics/reference/hdl/10915/55718info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-09-29T11:05:48Zoai:sedici.unlp.edu.ar:10915/55733Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-09-29 11:05:48.94SEDICI (UNLP) - Universidad Nacional de La Platafalse |
dc.title.none.fl_str_mv |
Clasificación automática de textos periodísticos usando Random Forest |
title |
Clasificación automática de textos periodísticos usando Random Forest |
spellingShingle |
Clasificación automática de textos periodísticos usando Random Forest Salinas, Juan Ciencias Informáticas archivo digital Periodismo aprendizaje automatizado stemming |
title_short |
Clasificación automática de textos periodísticos usando Random Forest |
title_full |
Clasificación automática de textos periodísticos usando Random Forest |
title_fullStr |
Clasificación automática de textos periodísticos usando Random Forest |
title_full_unstemmed |
Clasificación automática de textos periodísticos usando Random Forest |
title_sort |
Clasificación automática de textos periodísticos usando Random Forest |
dc.creator.none.fl_str_mv |
Salinas, Juan Izetta, Javier |
author |
Salinas, Juan |
author_facet |
Salinas, Juan Izetta, Javier |
author_role |
author |
author2 |
Izetta, Javier |
author2_role |
author |
dc.subject.none.fl_str_mv |
Ciencias Informáticas archivo digital Periodismo aprendizaje automatizado stemming |
topic |
Ciencias Informáticas archivo digital Periodismo aprendizaje automatizado stemming |
dc.description.none.fl_txt_mv |
En los últimos anos el periodismo regional, al igual que en todas partes del mundo, pasó de su formato clásico de publicación al electrónico. Así las webs de noticias regionales también se ven obligadas a evolucionar y mejorar sus prestaciones a través de una mejor organización y categorización previa de toda la información disponible para el lector. En este trabajo se propone abordar la clasificación automática de textos periodísticos digitales a través del Aprendizaje Automatizado. Se presentan dos clasificadores automáticos de textos periodísticos extraídos de paginas webs de noticias del NOA basados en Random Forest y se proponen dos técnicas para la reducción de dimensionalidad del espacio de características. Estos clasificadores fueron evaluados con distintas colecciones de noticias demostrando un buen desempeño. XVII Workshop Agentes y Sistemas Inteligentes (WASI). Red de Universidades con Carreras en Informática (RedUNCI) |
description |
En los últimos anos el periodismo regional, al igual que en todas partes del mundo, pasó de su formato clásico de publicación al electrónico. Así las webs de noticias regionales también se ven obligadas a evolucionar y mejorar sus prestaciones a través de una mejor organización y categorización previa de toda la información disponible para el lector. En este trabajo se propone abordar la clasificación automática de textos periodísticos digitales a través del Aprendizaje Automatizado. Se presentan dos clasificadores automáticos de textos periodísticos extraídos de paginas webs de noticias del NOA basados en Random Forest y se proponen dos técnicas para la reducción de dimensionalidad del espacio de características. Estos clasificadores fueron evaluados con distintas colecciones de noticias demostrando un buen desempeño. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016-10 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
format |
conferenceObject |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/55733 |
url |
http://sedici.unlp.edu.ar/handle/10915/55733 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
info:eu-repo/semantics/reference/hdl/10915/55718 |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
dc.format.none.fl_str_mv |
application/pdf 34-44 |
dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
reponame_str |
SEDICI (UNLP) |
collection |
SEDICI (UNLP) |
instname_str |
Universidad Nacional de La Plata |
instacron_str |
UNLP |
institution |
UNLP |
repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
_version_ |
1844615928608718848 |
score |
13.070432 |