Análisis automático de grandes volúmenes de datos en redes sociales mediante minería de textos combinado con algoritmos inteligentes

Autores
Tessore, Juan Pablo; Esnaola, Leonardo Martín; Russo, Claudia Cecilia; Ramón, Hugo D.; Pompei, Sabrina
Año de publicación
2018
Idioma
español castellano
Tipo de recurso
documento de conferencia
Estado
versión publicada
Descripción
El presente trabajo propone construir un clasificador automático de opiniones, que permitirá realizar análisis automáticos a bajo costo del juicio de los consumidores acerca de productos o servicios. Dicho clasificador será entrenado a partir de los comentarios en lenguaje informal presente en redes sociales. Para alcanzar el objetivo descripto, en primer lugar, se prevé construir una base de datos que reúna diversos fragmentos de texto en idioma español, incorporando los modismos propios de nuestra región. En segundo lugar, a través de un proceso incremental de limpieza y normalización de cada fragmento de texto, que incluye actividades como la eliminación de hashtags, enlaces, emoticones, etc.; corrección ortográfica; etiquetado sintáctico (también conocido como “Part Of Speech Tagging”, o simplemente “POS tagging”); desambiguación, entre otras. Una vez realizada la recopilación y normalizado el contenido, se definirá un criterio de clasificación de dichos fragmentos, de manera de establecer clases que permitan agrupar los mismos según su afinidad, es decir a partir de características comunes. Finalmente, a partir del diseño, desarrollo e implementación de un algoritmo inteligente se buscará determinar el grado de pertenencia a cada uno de los grupos definidos de cualquier texto arbitrario.
Eje temático: Agentes y Sistemas Inteligentes.
Materia
Ciencias de la Computación
Inteligencia Artificial
redes sociales
text mining
big data
Nivel de accesibilidad
acceso abierto
Condiciones de uso
http://creativecommons.org/licenses/by-nc-sa/3.0/
Repositorio
CIC Digital (CICBA)
Institución
Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
OAI Identificador
oai:digital.cic.gba.gob.ar:11746/8247

id CICBA_ea1dbe2ecfd893214a388fb9538a6895
oai_identifier_str oai:digital.cic.gba.gob.ar:11746/8247
network_acronym_str CICBA
repository_id_str 9441
network_name_str CIC Digital (CICBA)
spelling Análisis automático de grandes volúmenes de datos en redes sociales mediante minería de textos combinado con algoritmos inteligentesTessore, Juan PabloEsnaola, Leonardo MartínRusso, Claudia CeciliaRamón, Hugo D.Pompei, SabrinaCiencias de la ComputaciónInteligencia Artificialredes socialestext miningbig dataEl presente trabajo propone construir un clasificador automático de opiniones, que permitirá realizar análisis automáticos a bajo costo del juicio de los consumidores acerca de productos o servicios. Dicho clasificador será entrenado a partir de los comentarios en lenguaje informal presente en redes sociales. Para alcanzar el objetivo descripto, en primer lugar, se prevé construir una base de datos que reúna diversos fragmentos de texto en idioma español, incorporando los modismos propios de nuestra región. En segundo lugar, a través de un proceso incremental de limpieza y normalización de cada fragmento de texto, que incluye actividades como la eliminación de hashtags, enlaces, emoticones, etc.; corrección ortográfica; etiquetado sintáctico (también conocido como “Part Of Speech Tagging”, o simplemente “POS tagging”); desambiguación, entre otras. Una vez realizada la recopilación y normalizado el contenido, se definirá un criterio de clasificación de dichos fragmentos, de manera de establecer clases que permitan agrupar los mismos según su afinidad, es decir a partir de características comunes. Finalmente, a partir del diseño, desarrollo e implementación de un algoritmo inteligente se buscará determinar el grado de pertenencia a cada uno de los grupos definidos de cualquier texto arbitrario.Eje temático: Agentes y Sistemas Inteligentes.2018-04info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdfhttps://digital.cic.gba.gob.ar/handle/11746/8247spainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/3.0/reponame:CIC Digital (CICBA)instname:Comisión de Investigaciones Científicas de la Provincia de Buenos Airesinstacron:CICBA2025-09-04T09:43:09Zoai:digital.cic.gba.gob.ar:11746/8247Institucionalhttp://digital.cic.gba.gob.arOrganismo científico-tecnológicoNo correspondehttp://digital.cic.gba.gob.ar/oai/snrdmarisa.degiusti@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:94412025-09-04 09:43:10.128CIC Digital (CICBA) - Comisión de Investigaciones Científicas de la Provincia de Buenos Airesfalse
dc.title.none.fl_str_mv Análisis automático de grandes volúmenes de datos en redes sociales mediante minería de textos combinado con algoritmos inteligentes
title Análisis automático de grandes volúmenes de datos en redes sociales mediante minería de textos combinado con algoritmos inteligentes
spellingShingle Análisis automático de grandes volúmenes de datos en redes sociales mediante minería de textos combinado con algoritmos inteligentes
Tessore, Juan Pablo
Ciencias de la Computación
Inteligencia Artificial
redes sociales
text mining
big data
title_short Análisis automático de grandes volúmenes de datos en redes sociales mediante minería de textos combinado con algoritmos inteligentes
title_full Análisis automático de grandes volúmenes de datos en redes sociales mediante minería de textos combinado con algoritmos inteligentes
title_fullStr Análisis automático de grandes volúmenes de datos en redes sociales mediante minería de textos combinado con algoritmos inteligentes
title_full_unstemmed Análisis automático de grandes volúmenes de datos en redes sociales mediante minería de textos combinado con algoritmos inteligentes
title_sort Análisis automático de grandes volúmenes de datos en redes sociales mediante minería de textos combinado con algoritmos inteligentes
dc.creator.none.fl_str_mv Tessore, Juan Pablo
Esnaola, Leonardo Martín
Russo, Claudia Cecilia
Ramón, Hugo D.
Pompei, Sabrina
author Tessore, Juan Pablo
author_facet Tessore, Juan Pablo
Esnaola, Leonardo Martín
Russo, Claudia Cecilia
Ramón, Hugo D.
Pompei, Sabrina
author_role author
author2 Esnaola, Leonardo Martín
Russo, Claudia Cecilia
Ramón, Hugo D.
Pompei, Sabrina
author2_role author
author
author
author
dc.subject.none.fl_str_mv Ciencias de la Computación
Inteligencia Artificial
redes sociales
text mining
big data
topic Ciencias de la Computación
Inteligencia Artificial
redes sociales
text mining
big data
dc.description.none.fl_txt_mv El presente trabajo propone construir un clasificador automático de opiniones, que permitirá realizar análisis automáticos a bajo costo del juicio de los consumidores acerca de productos o servicios. Dicho clasificador será entrenado a partir de los comentarios en lenguaje informal presente en redes sociales. Para alcanzar el objetivo descripto, en primer lugar, se prevé construir una base de datos que reúna diversos fragmentos de texto en idioma español, incorporando los modismos propios de nuestra región. En segundo lugar, a través de un proceso incremental de limpieza y normalización de cada fragmento de texto, que incluye actividades como la eliminación de hashtags, enlaces, emoticones, etc.; corrección ortográfica; etiquetado sintáctico (también conocido como “Part Of Speech Tagging”, o simplemente “POS tagging”); desambiguación, entre otras. Una vez realizada la recopilación y normalizado el contenido, se definirá un criterio de clasificación de dichos fragmentos, de manera de establecer clases que permitan agrupar los mismos según su afinidad, es decir a partir de características comunes. Finalmente, a partir del diseño, desarrollo e implementación de un algoritmo inteligente se buscará determinar el grado de pertenencia a cada uno de los grupos definidos de cualquier texto arbitrario.
Eje temático: Agentes y Sistemas Inteligentes.
description El presente trabajo propone construir un clasificador automático de opiniones, que permitirá realizar análisis automáticos a bajo costo del juicio de los consumidores acerca de productos o servicios. Dicho clasificador será entrenado a partir de los comentarios en lenguaje informal presente en redes sociales. Para alcanzar el objetivo descripto, en primer lugar, se prevé construir una base de datos que reúna diversos fragmentos de texto en idioma español, incorporando los modismos propios de nuestra región. En segundo lugar, a través de un proceso incremental de limpieza y normalización de cada fragmento de texto, que incluye actividades como la eliminación de hashtags, enlaces, emoticones, etc.; corrección ortográfica; etiquetado sintáctico (también conocido como “Part Of Speech Tagging”, o simplemente “POS tagging”); desambiguación, entre otras. Una vez realizada la recopilación y normalizado el contenido, se definirá un criterio de clasificación de dichos fragmentos, de manera de establecer clases que permitan agrupar los mismos según su afinidad, es decir a partir de características comunes. Finalmente, a partir del diseño, desarrollo e implementación de un algoritmo inteligente se buscará determinar el grado de pertenencia a cada uno de los grupos definidos de cualquier texto arbitrario.
publishDate 2018
dc.date.none.fl_str_mv 2018-04
dc.type.none.fl_str_mv info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_5794
info:ar-repo/semantics/documentoDeConferencia
format conferenceObject
status_str publishedVersion
dc.identifier.none.fl_str_mv https://digital.cic.gba.gob.ar/handle/11746/8247
url https://digital.cic.gba.gob.ar/handle/11746/8247
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-sa/3.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/3.0/
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:CIC Digital (CICBA)
instname:Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
instacron:CICBA
reponame_str CIC Digital (CICBA)
collection CIC Digital (CICBA)
instname_str Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
instacron_str CICBA
institution CICBA
repository.name.fl_str_mv CIC Digital (CICBA) - Comisión de Investigaciones Científicas de la Provincia de Buenos Aires
repository.mail.fl_str_mv marisa.degiusti@sedici.unlp.edu.ar
_version_ 1842340405417345024
score 12.623145