Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.
- Autores
- Ryckeboer, Hugo Emilio Julio Ludovico; Spositto, Osvaldo Mario; Castro, Hugo Martín; Bossero, Julio César; Gargano, Cecilia Victoria; Matteo, Lorena Romina; Prilusky, Elisa Mirta; Procopio, Gastón Emanuel; Quintana, Fabio Hernán
- Año de publicación
- 2016
- Idioma
- español castellano
- Tipo de recurso
- informe técnico
- Estado
- versión aceptada
- Descripción
- El presente trabajo muestra los resultados de la comparación entre diferentes técnicas de minería de datos (MD) con el objetivo de identificar en forma automática a los estudiantes con mayor riesgo de deserción de las carreras de Ingeniería de la UNLaM, a partir de los datos socioeconómicos y académicos de los mismos. Para desarrollar este trabajo se aplicó la metodología para proyectos de MD conocida como KDD. Dicha metodología estructura el proceso en seis fases, que interactúan entre ellas de forma iterativa. Se aplicaron las técnicas de Redes Neuronales, Árboles de decisión y K-vecino más próximo, como algoritmos supervisados y K-Means, como no supervisado, para analizar el comportamiento de los estudiantes evaluando la calificación obtenida en las asignaturas comunes del primer año de las distintas carrera, y además otros datos como la edad, el sexo, etc. Los datos se obtuvieron de un almacén de datos construido para tal fin en proyectos anteriores. La muestra que se utilizó para entrenar los algoritmos fue de 1499 sujetos (cohorte 2013 y 2014). Mientras que para testear los modelos creados se utilizaron 793 alumnos de la cohorte 2015. Se empleó la herramienta libre Weka y ejecutar y evaluar el desempeño de los algoritmos. Se encontró que el algoritmo del J48 permitió obtener efectividades mayor que los otros algoritmos. Se observó que todos los algoritmos supervisados, en su etapa de entrenamiento, arrojan un desempeño general, con porcentajes mayores al 90% de exactitud, mientras que estos mismos algoritmos cuando son convertidos a modelos y son testeados con nuevos lotes de prueba, el porcentaje de acierto baja a valores apenas superiores al 50%. El conocimiento generado permitirá soportar la toma de decisiones eficaces de las directivas universitarias enfocadas a formular políticas y estrategias relacionadas con los programas de retención estudiantil que actualmente se encuentran establecidos.
Fil: Ryckeboer, Hugo Emilio Julio Ludovico. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Spositto, Osvaldo Mario. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Castro, Hugo Martín. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Bossero, Julio César. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Gargano, Cecilia Victoria. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Matteo, Lorena Romina. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Prilusky, Elisa Mirta. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Procopio, Gastón Emanuel. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Quintana, Fabio Hernán. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina. - Materia
-
MINERIA DE DATOS
ALGORITMOS
ABANDONO DE ESTUDIOS
006.312 - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
- Repositorio
- Institución
- Universidad Nacional de La Matanza
- OAI Identificador
- oai:repositoriocyt.unlam.edu.ar:123456789/576
Ver los metadatos del registro completo
id |
RDUNLAM_566494bbb6ed793a812485f607a33734 |
---|---|
oai_identifier_str |
oai:repositoriocyt.unlam.edu.ar:123456789/576 |
network_acronym_str |
RDUNLAM |
repository_id_str |
a |
network_name_str |
Repositorio Digital UNLaM |
spelling |
Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.Ryckeboer, Hugo Emilio Julio LudovicoSpositto, Osvaldo MarioCastro, Hugo MartínBossero, Julio CésarGargano, Cecilia VictoriaMatteo, Lorena RominaPrilusky, Elisa MirtaProcopio, Gastón EmanuelQuintana, Fabio HernánMINERIA DE DATOSALGORITMOSABANDONO DE ESTUDIOS006.312El presente trabajo muestra los resultados de la comparación entre diferentes técnicas de minería de datos (MD) con el objetivo de identificar en forma automática a los estudiantes con mayor riesgo de deserción de las carreras de Ingeniería de la UNLaM, a partir de los datos socioeconómicos y académicos de los mismos. Para desarrollar este trabajo se aplicó la metodología para proyectos de MD conocida como KDD. Dicha metodología estructura el proceso en seis fases, que interactúan entre ellas de forma iterativa. Se aplicaron las técnicas de Redes Neuronales, Árboles de decisión y K-vecino más próximo, como algoritmos supervisados y K-Means, como no supervisado, para analizar el comportamiento de los estudiantes evaluando la calificación obtenida en las asignaturas comunes del primer año de las distintas carrera, y además otros datos como la edad, el sexo, etc. Los datos se obtuvieron de un almacén de datos construido para tal fin en proyectos anteriores. La muestra que se utilizó para entrenar los algoritmos fue de 1499 sujetos (cohorte 2013 y 2014). Mientras que para testear los modelos creados se utilizaron 793 alumnos de la cohorte 2015. Se empleó la herramienta libre Weka y ejecutar y evaluar el desempeño de los algoritmos. Se encontró que el algoritmo del J48 permitió obtener efectividades mayor que los otros algoritmos. Se observó que todos los algoritmos supervisados, en su etapa de entrenamiento, arrojan un desempeño general, con porcentajes mayores al 90% de exactitud, mientras que estos mismos algoritmos cuando son convertidos a modelos y son testeados con nuevos lotes de prueba, el porcentaje de acierto baja a valores apenas superiores al 50%. El conocimiento generado permitirá soportar la toma de decisiones eficaces de las directivas universitarias enfocadas a formular políticas y estrategias relacionadas con los programas de retención estudiantil que actualmente se encuentran establecidos.Fil: Ryckeboer, Hugo Emilio Julio Ludovico. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Spositto, Osvaldo Mario. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Castro, Hugo Martín. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Bossero, Julio César. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Gargano, Cecilia Victoria. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Matteo, Lorena Romina. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Prilusky, Elisa Mirta. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Procopio, Gastón Emanuel. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Quintana, Fabio Hernán. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones TecnológicasRyckeboer, Hugo Emilio Julio LudovicoSpositto, Osvaldo Mario20162021-06-11T17:37:11Z2021-06-11T17:37:11Zinfo:eu-repo/semantics/reportinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_18ghinfo:ar-repo/semantics/informeTecnicoapplication/pdfapplication/pdfRyckeboer, H, E. J. L., Spositto, O. M., Castro, H. M., Bossero, J. C., Gargano, C. V., Matteo, L. R., Prilusky, E. M.,… Quintana, F. H. (2016). Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción [Archivo PDF]. San Justo: Universidad Nacional de La Matanza. Recuperado de http://repositoriocyt.unlam.edu.ar/handle/123456789/576http://repositoriocyt.unlam.edu.ar/handle/123456789/576spainfo:eu-repo/grantAgreement/SPU/PROINCE/C-176/AR. Buenos Aires. San Justo/Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/Licencia Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 AR)reponame:Repositorio Digital UNLaMinstname:Universidad Nacional de La Matanza2025-09-04T11:12:23Zoai:repositoriocyt.unlam.edu.ar:123456789/576instacron:UNLaMInstitucionalhttps://repositoriocyt.unlam.edu.ar/Universidad públicaNo correspondehttps://repositoriocyt.unlam.edu.ar/oaicytunlam@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:a2025-09-04 11:12:23.484Repositorio Digital UNLaM - Universidad Nacional de La Matanzafalse |
dc.title.none.fl_str_mv |
Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción. |
title |
Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción. |
spellingShingle |
Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción. Ryckeboer, Hugo Emilio Julio Ludovico MINERIA DE DATOS ALGORITMOS ABANDONO DE ESTUDIOS 006.312 |
title_short |
Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción. |
title_full |
Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción. |
title_fullStr |
Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción. |
title_full_unstemmed |
Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción. |
title_sort |
Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción. |
dc.creator.none.fl_str_mv |
Ryckeboer, Hugo Emilio Julio Ludovico Spositto, Osvaldo Mario Castro, Hugo Martín Bossero, Julio César Gargano, Cecilia Victoria Matteo, Lorena Romina Prilusky, Elisa Mirta Procopio, Gastón Emanuel Quintana, Fabio Hernán |
author |
Ryckeboer, Hugo Emilio Julio Ludovico |
author_facet |
Ryckeboer, Hugo Emilio Julio Ludovico Spositto, Osvaldo Mario Castro, Hugo Martín Bossero, Julio César Gargano, Cecilia Victoria Matteo, Lorena Romina Prilusky, Elisa Mirta Procopio, Gastón Emanuel Quintana, Fabio Hernán |
author_role |
author |
author2 |
Spositto, Osvaldo Mario Castro, Hugo Martín Bossero, Julio César Gargano, Cecilia Victoria Matteo, Lorena Romina Prilusky, Elisa Mirta Procopio, Gastón Emanuel Quintana, Fabio Hernán |
author2_role |
author author author author author author author author |
dc.contributor.none.fl_str_mv |
Ryckeboer, Hugo Emilio Julio Ludovico Spositto, Osvaldo Mario |
dc.subject.none.fl_str_mv |
MINERIA DE DATOS ALGORITMOS ABANDONO DE ESTUDIOS 006.312 |
topic |
MINERIA DE DATOS ALGORITMOS ABANDONO DE ESTUDIOS 006.312 |
dc.description.none.fl_txt_mv |
El presente trabajo muestra los resultados de la comparación entre diferentes técnicas de minería de datos (MD) con el objetivo de identificar en forma automática a los estudiantes con mayor riesgo de deserción de las carreras de Ingeniería de la UNLaM, a partir de los datos socioeconómicos y académicos de los mismos. Para desarrollar este trabajo se aplicó la metodología para proyectos de MD conocida como KDD. Dicha metodología estructura el proceso en seis fases, que interactúan entre ellas de forma iterativa. Se aplicaron las técnicas de Redes Neuronales, Árboles de decisión y K-vecino más próximo, como algoritmos supervisados y K-Means, como no supervisado, para analizar el comportamiento de los estudiantes evaluando la calificación obtenida en las asignaturas comunes del primer año de las distintas carrera, y además otros datos como la edad, el sexo, etc. Los datos se obtuvieron de un almacén de datos construido para tal fin en proyectos anteriores. La muestra que se utilizó para entrenar los algoritmos fue de 1499 sujetos (cohorte 2013 y 2014). Mientras que para testear los modelos creados se utilizaron 793 alumnos de la cohorte 2015. Se empleó la herramienta libre Weka y ejecutar y evaluar el desempeño de los algoritmos. Se encontró que el algoritmo del J48 permitió obtener efectividades mayor que los otros algoritmos. Se observó que todos los algoritmos supervisados, en su etapa de entrenamiento, arrojan un desempeño general, con porcentajes mayores al 90% de exactitud, mientras que estos mismos algoritmos cuando son convertidos a modelos y son testeados con nuevos lotes de prueba, el porcentaje de acierto baja a valores apenas superiores al 50%. El conocimiento generado permitirá soportar la toma de decisiones eficaces de las directivas universitarias enfocadas a formular políticas y estrategias relacionadas con los programas de retención estudiantil que actualmente se encuentran establecidos. Fil: Ryckeboer, Hugo Emilio Julio Ludovico. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina. Fil: Spositto, Osvaldo Mario. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina. Fil: Castro, Hugo Martín. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina. Fil: Bossero, Julio César. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina. Fil: Gargano, Cecilia Victoria. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina. Fil: Matteo, Lorena Romina. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina. Fil: Prilusky, Elisa Mirta. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina. Fil: Procopio, Gastón Emanuel. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina. Fil: Quintana, Fabio Hernán. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina. |
description |
El presente trabajo muestra los resultados de la comparación entre diferentes técnicas de minería de datos (MD) con el objetivo de identificar en forma automática a los estudiantes con mayor riesgo de deserción de las carreras de Ingeniería de la UNLaM, a partir de los datos socioeconómicos y académicos de los mismos. Para desarrollar este trabajo se aplicó la metodología para proyectos de MD conocida como KDD. Dicha metodología estructura el proceso en seis fases, que interactúan entre ellas de forma iterativa. Se aplicaron las técnicas de Redes Neuronales, Árboles de decisión y K-vecino más próximo, como algoritmos supervisados y K-Means, como no supervisado, para analizar el comportamiento de los estudiantes evaluando la calificación obtenida en las asignaturas comunes del primer año de las distintas carrera, y además otros datos como la edad, el sexo, etc. Los datos se obtuvieron de un almacén de datos construido para tal fin en proyectos anteriores. La muestra que se utilizó para entrenar los algoritmos fue de 1499 sujetos (cohorte 2013 y 2014). Mientras que para testear los modelos creados se utilizaron 793 alumnos de la cohorte 2015. Se empleó la herramienta libre Weka y ejecutar y evaluar el desempeño de los algoritmos. Se encontró que el algoritmo del J48 permitió obtener efectividades mayor que los otros algoritmos. Se observó que todos los algoritmos supervisados, en su etapa de entrenamiento, arrojan un desempeño general, con porcentajes mayores al 90% de exactitud, mientras que estos mismos algoritmos cuando son convertidos a modelos y son testeados con nuevos lotes de prueba, el porcentaje de acierto baja a valores apenas superiores al 50%. El conocimiento generado permitirá soportar la toma de decisiones eficaces de las directivas universitarias enfocadas a formular políticas y estrategias relacionadas con los programas de retención estudiantil que actualmente se encuentran establecidos. |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016 2021-06-11T17:37:11Z 2021-06-11T17:37:11Z |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/report info:eu-repo/semantics/acceptedVersion http://purl.org/coar/resource_type/c_18gh info:ar-repo/semantics/informeTecnico |
format |
report |
status_str |
acceptedVersion |
dc.identifier.none.fl_str_mv |
Ryckeboer, H, E. J. L., Spositto, O. M., Castro, H. M., Bossero, J. C., Gargano, C. V., Matteo, L. R., Prilusky, E. M.,… Quintana, F. H. (2016). Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción [Archivo PDF]. San Justo: Universidad Nacional de La Matanza. Recuperado de http://repositoriocyt.unlam.edu.ar/handle/123456789/576 http://repositoriocyt.unlam.edu.ar/handle/123456789/576 |
identifier_str_mv |
Ryckeboer, H, E. J. L., Spositto, O. M., Castro, H. M., Bossero, J. C., Gargano, C. V., Matteo, L. R., Prilusky, E. M.,… Quintana, F. H. (2016). Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción [Archivo PDF]. San Justo: Universidad Nacional de La Matanza. Recuperado de http://repositoriocyt.unlam.edu.ar/handle/123456789/576 |
url |
http://repositoriocyt.unlam.edu.ar/handle/123456789/576 |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
info:eu-repo/grantAgreement/SPU/PROINCE/C-176/AR. Buenos Aires. San Justo/Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción. |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Licencia Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 AR) |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ Licencia Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 AR) |
dc.format.none.fl_str_mv |
application/pdf application/pdf |
dc.publisher.none.fl_str_mv |
Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas |
publisher.none.fl_str_mv |
Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas |
dc.source.none.fl_str_mv |
reponame:Repositorio Digital UNLaM instname:Universidad Nacional de La Matanza |
reponame_str |
Repositorio Digital UNLaM |
collection |
Repositorio Digital UNLaM |
instname_str |
Universidad Nacional de La Matanza |
repository.name.fl_str_mv |
Repositorio Digital UNLaM - Universidad Nacional de La Matanza |
repository.mail.fl_str_mv |
cytunlam@gmail.com |
_version_ |
1842344021786099712 |
score |
12.623145 |