Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento
- Autores
- Cardenas, Marina E.; Castillo, Julio J.; Hernández, Nicolás; Cuevas, Juan Carlos; Páez, Nancy del Valle
- Año de publicación
- 2025
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- En este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. Las tres herramientas detalladas en este artículo, han sido desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT.
Red de Universidades con Carreras en Informática - Materia
-
Ciencias Informáticas
aprendizaje automático
AHP
análisis de texto
extracción de información
corpus
machine learning
redes neuronales artificiales
texto estructurado
texto no estructurado - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/183481
Ver los metadatos del registro completo
| id |
SEDICI_5248ac47b3b088000f22f7a042aef877 |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/183481 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamientoCardenas, Marina E.Castillo, Julio J.Hernández, NicolásCuevas, Juan CarlosPáez, Nancy del ValleCiencias Informáticasaprendizaje automáticoAHPanálisis de textoextracción de informacióncorpusmachine learningredes neuronales artificialestexto estructuradotexto no estructuradoEn este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. Las tres herramientas detalladas en este artículo, han sido desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT.Red de Universidades con Carreras en Informática2025-04info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf2-6http://sedici.unlp.edu.ar/handle/10915/183481spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-575-267-2info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/182261info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-22T17:31:06Zoai:sedici.unlp.edu.ar:10915/183481Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-22 17:31:06.792SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento |
| title |
Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento |
| spellingShingle |
Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento Cardenas, Marina E. Ciencias Informáticas aprendizaje automático AHP análisis de texto extracción de información corpus machine learning redes neuronales artificiales texto estructurado texto no estructurado |
| title_short |
Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento |
| title_full |
Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento |
| title_fullStr |
Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento |
| title_full_unstemmed |
Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento |
| title_sort |
Análisis de textos estructurados mediante el desarrollo de herramientas para generación de material de entrenamiento |
| dc.creator.none.fl_str_mv |
Cardenas, Marina E. Castillo, Julio J. Hernández, Nicolás Cuevas, Juan Carlos Páez, Nancy del Valle |
| author |
Cardenas, Marina E. |
| author_facet |
Cardenas, Marina E. Castillo, Julio J. Hernández, Nicolás Cuevas, Juan Carlos Páez, Nancy del Valle |
| author_role |
author |
| author2 |
Castillo, Julio J. Hernández, Nicolás Cuevas, Juan Carlos Páez, Nancy del Valle |
| author2_role |
author author author author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas aprendizaje automático AHP análisis de texto extracción de información corpus machine learning redes neuronales artificiales texto estructurado texto no estructurado |
| topic |
Ciencias Informáticas aprendizaje automático AHP análisis de texto extracción de información corpus machine learning redes neuronales artificiales texto estructurado texto no estructurado |
| dc.description.none.fl_txt_mv |
En este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. Las tres herramientas detalladas en este artículo, han sido desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT. Red de Universidades con Carreras en Informática |
| description |
En este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. Las tres herramientas detalladas en este artículo, han sido desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-04 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
| format |
conferenceObject |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/183481 |
| url |
http://sedici.unlp.edu.ar/handle/10915/183481 |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/isbn/978-987-575-267-2 info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/182261 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf 2-6 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1846783817694576640 |
| score |
12.982451 |