Herramientas para generación de material de entrenamiento para análisis de textos estructurados
- Autores
- Cardenas, Marina E.; Castillo, Julio J.; Hernandez, Nicolás; Cuevas, Juan Carlos; Del Valle Paez, Nancy
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- documento de conferencia
- Estado
- versión publicada
- Descripción
- En este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. En este trabajo se describen tres herramientas desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT.
Red de Universidades con Carreras en Informática - Materia
-
Ciencias Informáticas
aprendizaje automático
AHP
análisis de texto
extracción de información
corpus
machine learning
redes neuronales artificiales
texto estructurado
texto no estructurado - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- http://creativecommons.org/licenses/by-nc-sa/4.0/
- Repositorio
.jpg)
- Institución
- Universidad Nacional de La Plata
- OAI Identificador
- oai:sedici.unlp.edu.ar:10915/176173
Ver los metadatos del registro completo
| id |
SEDICI_3c78028e69807adc59b230086e329061 |
|---|---|
| oai_identifier_str |
oai:sedici.unlp.edu.ar:10915/176173 |
| network_acronym_str |
SEDICI |
| repository_id_str |
1329 |
| network_name_str |
SEDICI (UNLP) |
| spelling |
Herramientas para generación de material de entrenamiento para análisis de textos estructuradosCardenas, Marina E.Castillo, Julio J.Hernandez, NicolásCuevas, Juan CarlosDel Valle Paez, NancyCiencias Informáticasaprendizaje automáticoAHPanálisis de textoextracción de informacióncorpusmachine learningredes neuronales artificialestexto estructuradotexto no estructuradoEn este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. En este trabajo se describen tres herramientas desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT.Red de Universidades con Carreras en Informática2024-04info:eu-repo/semantics/conferenceObjectinfo:eu-repo/semantics/publishedVersionObjeto de conferenciahttp://purl.org/coar/resource_type/c_5794info:ar-repo/semantics/documentoDeConferenciaapplication/pdf141-146http://sedici.unlp.edu.ar/handle/10915/176173spainfo:eu-repo/semantics/altIdentifier/isbn/978-987-8352-57-2info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/173603info:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/4.0/Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)reponame:SEDICI (UNLP)instname:Universidad Nacional de La Platainstacron:UNLP2025-10-22T17:28:19Zoai:sedici.unlp.edu.ar:10915/176173Institucionalhttp://sedici.unlp.edu.ar/Universidad públicaNo correspondehttp://sedici.unlp.edu.ar/oai/snrdalira@sedici.unlp.edu.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:13292025-10-22 17:28:19.456SEDICI (UNLP) - Universidad Nacional de La Platafalse |
| dc.title.none.fl_str_mv |
Herramientas para generación de material de entrenamiento para análisis de textos estructurados |
| title |
Herramientas para generación de material de entrenamiento para análisis de textos estructurados |
| spellingShingle |
Herramientas para generación de material de entrenamiento para análisis de textos estructurados Cardenas, Marina E. Ciencias Informáticas aprendizaje automático AHP análisis de texto extracción de información corpus machine learning redes neuronales artificiales texto estructurado texto no estructurado |
| title_short |
Herramientas para generación de material de entrenamiento para análisis de textos estructurados |
| title_full |
Herramientas para generación de material de entrenamiento para análisis de textos estructurados |
| title_fullStr |
Herramientas para generación de material de entrenamiento para análisis de textos estructurados |
| title_full_unstemmed |
Herramientas para generación de material de entrenamiento para análisis de textos estructurados |
| title_sort |
Herramientas para generación de material de entrenamiento para análisis de textos estructurados |
| dc.creator.none.fl_str_mv |
Cardenas, Marina E. Castillo, Julio J. Hernandez, Nicolás Cuevas, Juan Carlos Del Valle Paez, Nancy |
| author |
Cardenas, Marina E. |
| author_facet |
Cardenas, Marina E. Castillo, Julio J. Hernandez, Nicolás Cuevas, Juan Carlos Del Valle Paez, Nancy |
| author_role |
author |
| author2 |
Castillo, Julio J. Hernandez, Nicolás Cuevas, Juan Carlos Del Valle Paez, Nancy |
| author2_role |
author author author author |
| dc.subject.none.fl_str_mv |
Ciencias Informáticas aprendizaje automático AHP análisis de texto extracción de información corpus machine learning redes neuronales artificiales texto estructurado texto no estructurado |
| topic |
Ciencias Informáticas aprendizaje automático AHP análisis de texto extracción de información corpus machine learning redes neuronales artificiales texto estructurado texto no estructurado |
| dc.description.none.fl_txt_mv |
En este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. En este trabajo se describen tres herramientas desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT. Red de Universidades con Carreras en Informática |
| description |
En este artículo se describen las herramientas desarrolladas dentro del contexto de las líneas de investigación sobre técnicas de análisis de textos y minería de datos mediante la aplicación de algoritmos de aprendizaje automático y análisis de texto estructurado y no estructurado. Se ha establecido un conjunto de criterios que permiten abordar la problemática de la escasez de material de entrenamiento para el análisis de textos y las herramientas utilizadas para el análisis y procesamientos de grandes volúmenes de textos, con el objetivo de simplificar el trabajo necesario para analizar, crear, y modificar material de entrenamiento para sistemas basados en aprendizaje automático, a la vez que permiten ahorrar tiempo, y disminuir errores manuales cuando se trabaja con textos. En este trabajo se describen tres herramientas desarrolladas dentro de un proyecto de investigación homologado por la Secretaría de Ciencia y Tecnología (SCyT) de la UTN que tiene por objetivo crear herramientas que permitan analizar grandes volúmenes de datos que se encuentran en forma de archivos de textos estructurados o no estructurados, adecuando la información para su utilización en el entrenamiento de sistemas de análisis de texto. Dentro los archivos a analizar se pueden mencionar los archivos de código fuente de lenguajes de programación como Python, Java, C++ y C, con la reciente incorporación de archivos de Word, PDF y TXT. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-04 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/conferenceObject info:eu-repo/semantics/publishedVersion Objeto de conferencia http://purl.org/coar/resource_type/c_5794 info:ar-repo/semantics/documentoDeConferencia |
| format |
conferenceObject |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
http://sedici.unlp.edu.ar/handle/10915/176173 |
| url |
http://sedici.unlp.edu.ar/handle/10915/176173 |
| dc.language.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.none.fl_str_mv |
info:eu-repo/semantics/altIdentifier/isbn/978-987-8352-57-2 info:eu-repo/semantics/reference/url/https://sedici.unlp.edu.ar/handle/10915/173603 |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) |
| dc.format.none.fl_str_mv |
application/pdf 141-146 |
| dc.source.none.fl_str_mv |
reponame:SEDICI (UNLP) instname:Universidad Nacional de La Plata instacron:UNLP |
| reponame_str |
SEDICI (UNLP) |
| collection |
SEDICI (UNLP) |
| instname_str |
Universidad Nacional de La Plata |
| instacron_str |
UNLP |
| institution |
UNLP |
| repository.name.fl_str_mv |
SEDICI (UNLP) - Universidad Nacional de La Plata |
| repository.mail.fl_str_mv |
alira@sedici.unlp.edu.ar |
| _version_ |
1846783766684499968 |
| score |
12.982451 |