NLP aplicado a análisis de texto

Autores
Alias, Gerardo; Cassanelli, Rodrigo
Año de publicación
2019
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión borrador
Colaborador/a o director/a de tesis
Di Iorio, Ana Haydée
Descripción
El procesamiento de lenguaje natural o NLP (del inglés Natural Language Processing) es un campo de las ciencias de la computación. Si bien no fue concebido como una rama de la inteligencia computacional, las características del problema a resolver hicieron que paulatinamente se pasará de modelos basados en reglas a modelos que utilizan redes neuronales. En la actualidad, la mayoría de los sistemas orientados al análisis de textos basan su funcionamiento en la utilización de redes neuronales. Este tipo de sistemas “aprende”, es decir se entrena, para luego inferir resultados basándose en el contexto en lugar de reglas particulares. El avance en las técnicas de procesamiento del lenguaje natural hace posible pensar en una solución informática a la problemática antes descripta. En el InFo-Lab , a principios del año 2018, se realizó una prueba de concepto o prototipo para analizar la factibilidad de la aplicación de estas técnicas a las investigaciones criminales. Dicho prototipo obtuvo buenos resultados detectando referencias a drogas o estupefacientes en diversos textos. El objetivo del presente proyecto es desarrollar un sistema informático orientado a la resolución de este tipo de problemas. Para ello se plantea un producto dividido en dos módulos principales. Se puede observar un esquema de alto nivel de la solución propuesta y de la interacción con cada uno de los componentes principales del sistema. El primero de ellos es un módulo de administración de modelos para el análisis de lenguaje natural. El mismo se orienta a los usuarios con conocimientos medios / avanzados de informática. Su objetivo es ofrecer interfaces para: Analizar los textos y, de este modo, permitir al investigador focalizar su atención sobre los fragmentos con mayor probabilidad de contener evidencia. Permitir al administrador del sistema administrar los diferentes modelos, orientados a temáticas particulares, con los que cuente el sistema. Permitir crear modelos especializados en distintas temáticas. Permitir administrar los datos de entrenamiento de cada modelo y, al mismo tiempo, ofrecer un mecanismo para aplicar los mismos a los modelos. El segundo módulo es una plataforma web que, utilizando las funcionalidades provistas por la librería de NLP, permite a distintos tipos de usuarios, tales como abogados, fiscales e investigadores utilizar modelos para analizar distintos documentos. Dado el tipo de usuario esperado, este sistema debe poder ser operado con conocimientos básicos de informática. Sus principales objetivos son: Permitir gestionar los documentos vinculados a investigaciones que lleva a cabo el Ministerio Público, en primera instancia, de manera sencilla y útil. Ofrecer al menos un modelo de análisis base orientado a una temática criminal particular. Permitir a los usuarios analizar, de forma amigable, los textos asociados a una investigación pertinente. Generar informes que muestren información considerada de importancia respecto de una investigación.
Fil: Alias, Gerardo. Universidad Nacional de Mar del Plata. Facultad de Ingeniería; Argentina.
Fil: Cassanelli, Rodrigo. Universidad Nacional de Mar del Plata. Facultad de Ingeniería; Argentina.
Materia
InfoLab
Seguridad ciudadana
Procesamiento de lenguaje natural
NLP
Aplicaciones informática jurídica
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by/4.0/
Repositorio
Repositorio Institucional Facultad de Ingeniería - UNMDP
Institución
Universidad Nacional de Mar del Plata. Facultad de Ingeniería
OAI Identificador
oai:rinfi.fi.mdp.edu.ar:123456789/354

id RINFIUNMDP_65b8a39d3b37dcfecaf229e2d96feee1
oai_identifier_str oai:rinfi.fi.mdp.edu.ar:123456789/354
network_acronym_str RINFIUNMDP
repository_id_str
network_name_str Repositorio Institucional Facultad de Ingeniería - UNMDP
spelling NLP aplicado a análisis de textoAlias, GerardoCassanelli, RodrigoInfoLabSeguridad ciudadanaProcesamiento de lenguaje naturalNLPAplicaciones informática jurídicaEl procesamiento de lenguaje natural o NLP (del inglés Natural Language Processing) es un campo de las ciencias de la computación. Si bien no fue concebido como una rama de la inteligencia computacional, las características del problema a resolver hicieron que paulatinamente se pasará de modelos basados en reglas a modelos que utilizan redes neuronales. En la actualidad, la mayoría de los sistemas orientados al análisis de textos basan su funcionamiento en la utilización de redes neuronales. Este tipo de sistemas “aprende”, es decir se entrena, para luego inferir resultados basándose en el contexto en lugar de reglas particulares. El avance en las técnicas de procesamiento del lenguaje natural hace posible pensar en una solución informática a la problemática antes descripta. En el InFo-Lab , a principios del año 2018, se realizó una prueba de concepto o prototipo para analizar la factibilidad de la aplicación de estas técnicas a las investigaciones criminales. Dicho prototipo obtuvo buenos resultados detectando referencias a drogas o estupefacientes en diversos textos. El objetivo del presente proyecto es desarrollar un sistema informático orientado a la resolución de este tipo de problemas. Para ello se plantea un producto dividido en dos módulos principales. Se puede observar un esquema de alto nivel de la solución propuesta y de la interacción con cada uno de los componentes principales del sistema. El primero de ellos es un módulo de administración de modelos para el análisis de lenguaje natural. El mismo se orienta a los usuarios con conocimientos medios / avanzados de informática. Su objetivo es ofrecer interfaces para: Analizar los textos y, de este modo, permitir al investigador focalizar su atención sobre los fragmentos con mayor probabilidad de contener evidencia. Permitir al administrador del sistema administrar los diferentes modelos, orientados a temáticas particulares, con los que cuente el sistema. Permitir crear modelos especializados en distintas temáticas. Permitir administrar los datos de entrenamiento de cada modelo y, al mismo tiempo, ofrecer un mecanismo para aplicar los mismos a los modelos. El segundo módulo es una plataforma web que, utilizando las funcionalidades provistas por la librería de NLP, permite a distintos tipos de usuarios, tales como abogados, fiscales e investigadores utilizar modelos para analizar distintos documentos. Dado el tipo de usuario esperado, este sistema debe poder ser operado con conocimientos básicos de informática. Sus principales objetivos son: Permitir gestionar los documentos vinculados a investigaciones que lleva a cabo el Ministerio Público, en primera instancia, de manera sencilla y útil. Ofrecer al menos un modelo de análisis base orientado a una temática criminal particular. Permitir a los usuarios analizar, de forma amigable, los textos asociados a una investigación pertinente. Generar informes que muestren información considerada de importancia respecto de una investigación.Fil: Alias, Gerardo. Universidad Nacional de Mar del Plata. Facultad de Ingeniería; Argentina.Fil: Cassanelli, Rodrigo. Universidad Nacional de Mar del Plata. Facultad de Ingeniería; Argentina.Universidad Nacional de Mar del Plata. Facultad de Ingeniería. ArgentinaDi Iorio, Ana Haydée2019-08-12Thesisinfo:eu-repo/semantics/draftinfo:eu-repo/semantics/bachelorThesishttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttp://rinfi.fi.mdp.edu.ar/handle/123456789/354spainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/reponame:Repositorio Institucional Facultad de Ingeniería - UNMDPinstname:Universidad Nacional de Mar del Plata. Facultad de Ingeniería2025-09-29T15:02:41Zoai:rinfi.fi.mdp.edu.ar:123456789/354instacron:FI-UNMDPInstitucionalhttps://rinfi.fi.mdp.edu.ar/Universidad públicahttps://www.fi.mdp.edu.ar/https://rinfi.fi.mdp.edu.ar/oai/snrdjosemrvs@fi.mdp.edu.arArgentinaopendoar:2025-09-29 15:02:41.417Repositorio Institucional Facultad de Ingeniería - UNMDP - Universidad Nacional de Mar del Plata. Facultad de Ingenieríafalse
dc.title.none.fl_str_mv NLP aplicado a análisis de texto
title NLP aplicado a análisis de texto
spellingShingle NLP aplicado a análisis de texto
Alias, Gerardo
InfoLab
Seguridad ciudadana
Procesamiento de lenguaje natural
NLP
Aplicaciones informática jurídica
title_short NLP aplicado a análisis de texto
title_full NLP aplicado a análisis de texto
title_fullStr NLP aplicado a análisis de texto
title_full_unstemmed NLP aplicado a análisis de texto
title_sort NLP aplicado a análisis de texto
dc.creator.none.fl_str_mv Alias, Gerardo
Cassanelli, Rodrigo
author Alias, Gerardo
author_facet Alias, Gerardo
Cassanelli, Rodrigo
author_role author
author2 Cassanelli, Rodrigo
author2_role author
dc.contributor.none.fl_str_mv Di Iorio, Ana Haydée
dc.subject.none.fl_str_mv InfoLab
Seguridad ciudadana
Procesamiento de lenguaje natural
NLP
Aplicaciones informática jurídica
topic InfoLab
Seguridad ciudadana
Procesamiento de lenguaje natural
NLP
Aplicaciones informática jurídica
dc.description.none.fl_txt_mv El procesamiento de lenguaje natural o NLP (del inglés Natural Language Processing) es un campo de las ciencias de la computación. Si bien no fue concebido como una rama de la inteligencia computacional, las características del problema a resolver hicieron que paulatinamente se pasará de modelos basados en reglas a modelos que utilizan redes neuronales. En la actualidad, la mayoría de los sistemas orientados al análisis de textos basan su funcionamiento en la utilización de redes neuronales. Este tipo de sistemas “aprende”, es decir se entrena, para luego inferir resultados basándose en el contexto en lugar de reglas particulares. El avance en las técnicas de procesamiento del lenguaje natural hace posible pensar en una solución informática a la problemática antes descripta. En el InFo-Lab , a principios del año 2018, se realizó una prueba de concepto o prototipo para analizar la factibilidad de la aplicación de estas técnicas a las investigaciones criminales. Dicho prototipo obtuvo buenos resultados detectando referencias a drogas o estupefacientes en diversos textos. El objetivo del presente proyecto es desarrollar un sistema informático orientado a la resolución de este tipo de problemas. Para ello se plantea un producto dividido en dos módulos principales. Se puede observar un esquema de alto nivel de la solución propuesta y de la interacción con cada uno de los componentes principales del sistema. El primero de ellos es un módulo de administración de modelos para el análisis de lenguaje natural. El mismo se orienta a los usuarios con conocimientos medios / avanzados de informática. Su objetivo es ofrecer interfaces para: Analizar los textos y, de este modo, permitir al investigador focalizar su atención sobre los fragmentos con mayor probabilidad de contener evidencia. Permitir al administrador del sistema administrar los diferentes modelos, orientados a temáticas particulares, con los que cuente el sistema. Permitir crear modelos especializados en distintas temáticas. Permitir administrar los datos de entrenamiento de cada modelo y, al mismo tiempo, ofrecer un mecanismo para aplicar los mismos a los modelos. El segundo módulo es una plataforma web que, utilizando las funcionalidades provistas por la librería de NLP, permite a distintos tipos de usuarios, tales como abogados, fiscales e investigadores utilizar modelos para analizar distintos documentos. Dado el tipo de usuario esperado, este sistema debe poder ser operado con conocimientos básicos de informática. Sus principales objetivos son: Permitir gestionar los documentos vinculados a investigaciones que lleva a cabo el Ministerio Público, en primera instancia, de manera sencilla y útil. Ofrecer al menos un modelo de análisis base orientado a una temática criminal particular. Permitir a los usuarios analizar, de forma amigable, los textos asociados a una investigación pertinente. Generar informes que muestren información considerada de importancia respecto de una investigación.
Fil: Alias, Gerardo. Universidad Nacional de Mar del Plata. Facultad de Ingeniería; Argentina.
Fil: Cassanelli, Rodrigo. Universidad Nacional de Mar del Plata. Facultad de Ingeniería; Argentina.
description El procesamiento de lenguaje natural o NLP (del inglés Natural Language Processing) es un campo de las ciencias de la computación. Si bien no fue concebido como una rama de la inteligencia computacional, las características del problema a resolver hicieron que paulatinamente se pasará de modelos basados en reglas a modelos que utilizan redes neuronales. En la actualidad, la mayoría de los sistemas orientados al análisis de textos basan su funcionamiento en la utilización de redes neuronales. Este tipo de sistemas “aprende”, es decir se entrena, para luego inferir resultados basándose en el contexto en lugar de reglas particulares. El avance en las técnicas de procesamiento del lenguaje natural hace posible pensar en una solución informática a la problemática antes descripta. En el InFo-Lab , a principios del año 2018, se realizó una prueba de concepto o prototipo para analizar la factibilidad de la aplicación de estas técnicas a las investigaciones criminales. Dicho prototipo obtuvo buenos resultados detectando referencias a drogas o estupefacientes en diversos textos. El objetivo del presente proyecto es desarrollar un sistema informático orientado a la resolución de este tipo de problemas. Para ello se plantea un producto dividido en dos módulos principales. Se puede observar un esquema de alto nivel de la solución propuesta y de la interacción con cada uno de los componentes principales del sistema. El primero de ellos es un módulo de administración de modelos para el análisis de lenguaje natural. El mismo se orienta a los usuarios con conocimientos medios / avanzados de informática. Su objetivo es ofrecer interfaces para: Analizar los textos y, de este modo, permitir al investigador focalizar su atención sobre los fragmentos con mayor probabilidad de contener evidencia. Permitir al administrador del sistema administrar los diferentes modelos, orientados a temáticas particulares, con los que cuente el sistema. Permitir crear modelos especializados en distintas temáticas. Permitir administrar los datos de entrenamiento de cada modelo y, al mismo tiempo, ofrecer un mecanismo para aplicar los mismos a los modelos. El segundo módulo es una plataforma web que, utilizando las funcionalidades provistas por la librería de NLP, permite a distintos tipos de usuarios, tales como abogados, fiscales e investigadores utilizar modelos para analizar distintos documentos. Dado el tipo de usuario esperado, este sistema debe poder ser operado con conocimientos básicos de informática. Sus principales objetivos son: Permitir gestionar los documentos vinculados a investigaciones que lleva a cabo el Ministerio Público, en primera instancia, de manera sencilla y útil. Ofrecer al menos un modelo de análisis base orientado a una temática criminal particular. Permitir a los usuarios analizar, de forma amigable, los textos asociados a una investigación pertinente. Generar informes que muestren información considerada de importancia respecto de una investigación.
publishDate 2019
dc.date.none.fl_str_mv 2019-08-12
dc.type.none.fl_str_mv Thesis
info:eu-repo/semantics/draft
info:eu-repo/semantics/bachelorThesis
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
status_str draft
format bachelorThesis
dc.identifier.none.fl_str_mv http://rinfi.fi.mdp.edu.ar/handle/123456789/354
url http://rinfi.fi.mdp.edu.ar/handle/123456789/354
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional de Mar del Plata. Facultad de Ingeniería. Argentina
publisher.none.fl_str_mv Universidad Nacional de Mar del Plata. Facultad de Ingeniería. Argentina
dc.source.none.fl_str_mv reponame:Repositorio Institucional Facultad de Ingeniería - UNMDP
instname:Universidad Nacional de Mar del Plata. Facultad de Ingeniería
reponame_str Repositorio Institucional Facultad de Ingeniería - UNMDP
collection Repositorio Institucional Facultad de Ingeniería - UNMDP
instname_str Universidad Nacional de Mar del Plata. Facultad de Ingeniería
repository.name.fl_str_mv Repositorio Institucional Facultad de Ingeniería - UNMDP - Universidad Nacional de Mar del Plata. Facultad de Ingeniería
repository.mail.fl_str_mv josemrvs@fi.mdp.edu.ar
_version_ 1844623361109393408
score 12.559606