Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento

Autores: Cardenas, Marina E.; Castillo, Julio J.; Hernández, Nicolás; Cuevas, Juan Carlos; Páez, Nancy del Valle
Año de publicación: 2025
Idioma: español castellano
Tipo de recurso: documento de conferencia
Estado: versión publicada
Descripción: En este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. Las tres herramientas detalladas en este artículo, han sido desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT.
Red de Universidades con Carreras en Informática
Materia: Ciencias Informáticas
aprendizaje automático
AHP
análisis de texto
extracción de información
corpus
machine learning
redes neuronales artificiales
texto estructurado
texto no estructurado
Nivel de accesibilidad: acceso abierto
Condiciones de uso: http://creativecommons.org/licenses/by-nc-sa/4.0/
Repositorio
Institución: Universidad Nacional de La Plata
OAI Identificador: oai:sedici.unlp.edu.ar:10915/183481

Acceder

id	SEDICI_5248ac47b3b088000f22f7a042aef877
oai_identifier_str	oai:sedici.unlp.edu.ar:10915/183481
network_acronym_str	SEDICI
repository_id_str	1329
network_name_str	SEDICI (UNLP)
spelling	Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamientoCardenas, Marina E.Castillo, Julio J.Hernández, NicolásCuevas, Juan CarlosPáez, Nancy del ValleCiencias Informáticasaprendizaje automáticoAHPanálisis de textoextracción de informacióncorpusmachine learningredes neuronales artificialestexto estructuradotexto no estructuradoEn este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. Las tres herramientas detalladas en este artículo, han sido desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT.Red de Universidades con Carreras en Informática2025-04info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf2-6http://sedici.unlp.edu.ar/handle/10915/183481spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-575-267-2info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/182261info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2026-05-27T11:44:13Zoai:sedici.unlp.edu.ar:10915/183481Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292026-05-27 11:44:14.119SEDICI (UNLP) - Universidad Nacional de La Platafalse
dc.title.none.fl_str_mv	Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento
title	Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento
spellingShingle	Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento Cardenas, Marina E. Ciencias Informáticas aprendizaje automático AHP análisis de texto extracción de información corpus machine learning redes neuronales artificiales texto estructurado texto no estructurado
title_short	Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento
title_full	Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento
title_fullStr	Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento
title_full_unstemmed	Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento
title_sort	Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento
dc.creator.none.fl_str_mv	Cardenas, Marina E. Castillo, Julio J. Hernández, Nicolás Cuevas, Juan Carlos Páez, Nancy del Valle
author	Cardenas, Marina E.
author_facet	Cardenas, Marina E. Castillo, Julio J. Hernández, Nicolás Cuevas, Juan Carlos Páez, Nancy del Valle
author_role	author
author2	Castillo, Julio J. Hernández, Nicolás Cuevas, Juan Carlos Páez, Nancy del Valle
author2_role	author author author author
dc.subject.none.fl_str_mv	Ciencias Informáticas aprendizaje automático AHP análisis de texto extracción de información corpus machine learning redes neuronales artificiales texto estructurado texto no estructurado
topic	Ciencias Informáticas aprendizaje automático AHP análisis de texto extracción de información corpus machine learning redes neuronales artificiales texto estructurado texto no estructurado
dc.description.none.fl_txt_mv	En este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. Las tres herramientas detalladas en este artículo, han sido desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT. Red de Universidades con Carreras en Informática
description	En este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. Las tres herramientas detalladas en este artículo, han sido desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT.
publishDate	2025
dc.date.none.fl_str_mv	2025-04
dc.type.none.fl_str_mv	info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia
format	conferenceObject
status_str	publishedVersion
dc.identifier.none.fl_str_mv	http://sedici.unlp.edu.ar/handle/10915/183481
url	http://sedici.unlp.edu.ar/handle/10915/183481
dc.language.none.fl_str_mv	spa
language	spa
dc.relation.none.fl_str_mv	info:eu-repo/semantics/altIdentifier/isbn/978-987-575-267-2 info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/182261
dc.rights.none.fl_str_mv	info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
eu_rights_str_mv	openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
dc.format.none.fl_str_mv	application/pdf 2-6
dc.source.none.fl_str_mv	reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP
reponame_str	SEDICI (UNLP)
collection	SEDICI (UNLP)
instname_str	Universidad Nacional de La Plata
instacron_str	UNLP
institution	UNLP
repository.name.fl_str_mv	SEDICI (UNLP) - Universidad Nacional de La Plata
repository.mail.fl_str_mv	alira@sedici.unlp.edu.ar
_version_	1866372154370555904
score	13.468372

Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento

Publicaciones similares