Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.

Autores
Ryckeboer, Hugo Emilio Julio Ludovico; Spositto, Osvaldo Mario; Castro, Hugo Martín; Bossero, Julio César; Gargano, Cecilia Victoria; Matteo, Lorena Romina; Prilusky, Elisa Mirta; Procopio, Gastón Emanuel; Quintana, Fabio Hernán
Año de publicación
2016
Idioma
español castellano
Tipo de recurso
informe técnico
Estado
versión aceptada
Descripción
El presente trabajo muestra los resultados de la comparación entre diferentes técnicas de minería de datos (MD) con el objetivo de identificar en forma automática a los estudiantes con mayor riesgo de deserción de las carreras de Ingeniería de la UNLaM, a partir de los datos socioeconómicos y académicos de los mismos. Para desarrollar este trabajo se aplicó la metodología para proyectos de MD conocida como KDD. Dicha metodología estructura el proceso en seis fases, que interactúan entre ellas de forma iterativa. Se aplicaron las técnicas de Redes Neuronales, Árboles de decisión y K-vecino más próximo, como algoritmos supervisados y K-Means, como no supervisado, para analizar el comportamiento de los estudiantes evaluando la calificación obtenida en las asignaturas comunes del primer año de las distintas carrera, y además otros datos como la edad, el sexo, etc. Los datos se obtuvieron de un almacén de datos construido para tal fin en proyectos anteriores. La muestra que se utilizó para entrenar los algoritmos fue de 1499 sujetos (cohorte 2013 y 2014). Mientras que para testear los modelos creados se utilizaron 793 alumnos de la cohorte 2015. Se empleó la herramienta libre Weka y ejecutar y evaluar el desempeño de los algoritmos. Se encontró que el algoritmo del J48 permitió obtener efectividades mayor que los otros algoritmos. Se observó que todos los algoritmos supervisados, en su etapa de entrenamiento, arrojan un desempeño general, con porcentajes mayores al 90% de exactitud, mientras que estos mismos algoritmos cuando son convertidos a modelos y son testeados con nuevos lotes de prueba, el porcentaje de acierto baja a valores apenas superiores al 50%. El conocimiento generado permitirá soportar la toma de decisiones eficaces de las directivas universitarias enfocadas a formular políticas y estrategias relacionadas con los programas de retención estudiantil que actualmente se encuentran establecidos.
Fil: Ryckeboer, Hugo Emilio Julio Ludovico. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Spositto, Osvaldo Mario. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Castro, Hugo Martín. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Bossero, Julio César. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Gargano, Cecilia Victoria. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Matteo, Lorena Romina. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Prilusky, Elisa Mirta. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Procopio, Gastón Emanuel. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Quintana, Fabio Hernán. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Materia
MINERIA DE DATOS
ALGORITMOS
ABANDONO DE ESTUDIOS
006.312
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Repositorio
Repositorio Digital UNLaM
Institución
Universidad Nacional de La Matanza
OAI Identificador
oai:repositoriocyt.unlam.edu.ar:123456789/576

id RDUNLAM_566494bbb6ed793a812485f607a33734
oai_identifier_str oai:repositoriocyt.unlam.edu.ar:123456789/576
network_acronym_str RDUNLAM
repository_id_str a
network_name_str Repositorio Digital UNLaM
spelling Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.Ryckeboer, Hugo Emilio Julio LudovicoSpositto, Osvaldo MarioCastro, Hugo MartínBossero, Julio CésarGargano, Cecilia VictoriaMatteo, Lorena RominaPrilusky, Elisa MirtaProcopio, Gastón EmanuelQuintana, Fabio HernánMINERIA DE DATOSALGORITMOSABANDONO DE ESTUDIOS006.312El presente trabajo muestra los resultados de la comparación entre diferentes técnicas de minería de datos (MD) con el objetivo de identificar en forma automática a los estudiantes con mayor riesgo de deserción de las carreras de Ingeniería de la UNLaM, a partir de los datos socioeconómicos y académicos de los mismos. Para desarrollar este trabajo se aplicó la metodología para proyectos de MD conocida como KDD. Dicha metodología estructura el proceso en seis fases, que interactúan entre ellas de forma iterativa. Se aplicaron las técnicas de Redes Neuronales, Árboles de decisión y K-vecino más próximo, como algoritmos supervisados y K-Means, como no supervisado, para analizar el comportamiento de los estudiantes evaluando la calificación obtenida en las asignaturas comunes del primer año de las distintas carrera, y además otros datos como la edad, el sexo, etc. Los datos se obtuvieron de un almacén de datos construido para tal fin en proyectos anteriores. La muestra que se utilizó para entrenar los algoritmos fue de 1499 sujetos (cohorte 2013 y 2014). Mientras que para testear los modelos creados se utilizaron 793 alumnos de la cohorte 2015. Se empleó la herramienta libre Weka y ejecutar y evaluar el desempeño de los algoritmos. Se encontró que el algoritmo del J48 permitió obtener efectividades mayor que los otros algoritmos. Se observó que todos los algoritmos supervisados, en su etapa de entrenamiento, arrojan un desempeño general, con porcentajes mayores al 90% de exactitud, mientras que estos mismos algoritmos cuando son convertidos a modelos y son testeados con nuevos lotes de prueba, el porcentaje de acierto baja a valores apenas superiores al 50%. El conocimiento generado permitirá soportar la toma de decisiones eficaces de las directivas universitarias enfocadas a formular políticas y estrategias relacionadas con los programas de retención estudiantil que actualmente se encuentran establecidos.Fil: Ryckeboer, Hugo Emilio Julio Ludovico. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Spositto, Osvaldo Mario. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Castro, Hugo Martín. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Bossero, Julio César. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Gargano, Cecilia Victoria. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Matteo, Lorena Romina. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Prilusky, Elisa Mirta. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Procopio, Gastón Emanuel. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Fil: Quintana, Fabio Hernán. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones TecnológicasRyckeboer, Hugo Emilio Julio LudovicoSpositto, Osvaldo Mario20162021-06-11T17:37:11Z2021-06-11T17:37:11Zinfo:eu-repo/semantics/reportinfo:eu-repo/semantics/acceptedVersionhttp://purl.org/coar/resource_type/c_18ghinfo:ar-repo/semantics/informeTecnicoapplication/pdfapplication/pdfRyckeboer, H, E. J. L., Spositto, O. M., Castro, H. M., Bossero, J. C., Gargano, C. V., Matteo, L. R., Prilusky, E. M.,… Quintana, F. H. (2016). Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción [Archivo PDF]. San Justo: Universidad Nacional de La Matanza. Recuperado de http://repositoriocyt.unlam.edu.ar/handle/123456789/576http://repositoriocyt.unlam.edu.ar/handle/123456789/576spainfo:eu-repo/grantAgreement/SPU/PROINCE/C-176/AR. Buenos Aires. San Justo/Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/Licencia Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 AR)reponame:Repositorio Digital UNLaMinstname:Universidad Nacional de La Matanza2025-09-04T11:12:23Zoai:repositoriocyt.unlam.edu.ar:123456789/576instacron:UNLaMInstitucionalhttps://repositoriocyt.unlam.edu.ar/Universidad públicaNo correspondehttps://repositoriocyt.unlam.edu.ar/oaicytunlam@gmail.comArgentinaNo correspondeNo correspondeNo correspondeopendoar:a2025-09-04 11:12:23.484Repositorio Digital UNLaM - Universidad Nacional de La Matanzafalse
dc.title.none.fl_str_mv Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.
title Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.
spellingShingle Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.
Ryckeboer, Hugo Emilio Julio Ludovico
MINERIA DE DATOS
ALGORITMOS
ABANDONO DE ESTUDIOS
006.312
title_short Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.
title_full Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.
title_fullStr Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.
title_full_unstemmed Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.
title_sort Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.
dc.creator.none.fl_str_mv Ryckeboer, Hugo Emilio Julio Ludovico
Spositto, Osvaldo Mario
Castro, Hugo Martín
Bossero, Julio César
Gargano, Cecilia Victoria
Matteo, Lorena Romina
Prilusky, Elisa Mirta
Procopio, Gastón Emanuel
Quintana, Fabio Hernán
author Ryckeboer, Hugo Emilio Julio Ludovico
author_facet Ryckeboer, Hugo Emilio Julio Ludovico
Spositto, Osvaldo Mario
Castro, Hugo Martín
Bossero, Julio César
Gargano, Cecilia Victoria
Matteo, Lorena Romina
Prilusky, Elisa Mirta
Procopio, Gastón Emanuel
Quintana, Fabio Hernán
author_role author
author2 Spositto, Osvaldo Mario
Castro, Hugo Martín
Bossero, Julio César
Gargano, Cecilia Victoria
Matteo, Lorena Romina
Prilusky, Elisa Mirta
Procopio, Gastón Emanuel
Quintana, Fabio Hernán
author2_role author
author
author
author
author
author
author
author
dc.contributor.none.fl_str_mv Ryckeboer, Hugo Emilio Julio Ludovico
Spositto, Osvaldo Mario
dc.subject.none.fl_str_mv MINERIA DE DATOS
ALGORITMOS
ABANDONO DE ESTUDIOS
006.312
topic MINERIA DE DATOS
ALGORITMOS
ABANDONO DE ESTUDIOS
006.312
dc.description.none.fl_txt_mv El presente trabajo muestra los resultados de la comparación entre diferentes técnicas de minería de datos (MD) con el objetivo de identificar en forma automática a los estudiantes con mayor riesgo de deserción de las carreras de Ingeniería de la UNLaM, a partir de los datos socioeconómicos y académicos de los mismos. Para desarrollar este trabajo se aplicó la metodología para proyectos de MD conocida como KDD. Dicha metodología estructura el proceso en seis fases, que interactúan entre ellas de forma iterativa. Se aplicaron las técnicas de Redes Neuronales, Árboles de decisión y K-vecino más próximo, como algoritmos supervisados y K-Means, como no supervisado, para analizar el comportamiento de los estudiantes evaluando la calificación obtenida en las asignaturas comunes del primer año de las distintas carrera, y además otros datos como la edad, el sexo, etc. Los datos se obtuvieron de un almacén de datos construido para tal fin en proyectos anteriores. La muestra que se utilizó para entrenar los algoritmos fue de 1499 sujetos (cohorte 2013 y 2014). Mientras que para testear los modelos creados se utilizaron 793 alumnos de la cohorte 2015. Se empleó la herramienta libre Weka y ejecutar y evaluar el desempeño de los algoritmos. Se encontró que el algoritmo del J48 permitió obtener efectividades mayor que los otros algoritmos. Se observó que todos los algoritmos supervisados, en su etapa de entrenamiento, arrojan un desempeño general, con porcentajes mayores al 90% de exactitud, mientras que estos mismos algoritmos cuando son convertidos a modelos y son testeados con nuevos lotes de prueba, el porcentaje de acierto baja a valores apenas superiores al 50%. El conocimiento generado permitirá soportar la toma de decisiones eficaces de las directivas universitarias enfocadas a formular políticas y estrategias relacionadas con los programas de retención estudiantil que actualmente se encuentran establecidos.
Fil: Ryckeboer, Hugo Emilio Julio Ludovico. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Spositto, Osvaldo Mario. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Castro, Hugo Martín. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Bossero, Julio César. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Gargano, Cecilia Victoria. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Matteo, Lorena Romina. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Prilusky, Elisa Mirta. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Procopio, Gastón Emanuel. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
Fil: Quintana, Fabio Hernán. Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas; Argentina.
description El presente trabajo muestra los resultados de la comparación entre diferentes técnicas de minería de datos (MD) con el objetivo de identificar en forma automática a los estudiantes con mayor riesgo de deserción de las carreras de Ingeniería de la UNLaM, a partir de los datos socioeconómicos y académicos de los mismos. Para desarrollar este trabajo se aplicó la metodología para proyectos de MD conocida como KDD. Dicha metodología estructura el proceso en seis fases, que interactúan entre ellas de forma iterativa. Se aplicaron las técnicas de Redes Neuronales, Árboles de decisión y K-vecino más próximo, como algoritmos supervisados y K-Means, como no supervisado, para analizar el comportamiento de los estudiantes evaluando la calificación obtenida en las asignaturas comunes del primer año de las distintas carrera, y además otros datos como la edad, el sexo, etc. Los datos se obtuvieron de un almacén de datos construido para tal fin en proyectos anteriores. La muestra que se utilizó para entrenar los algoritmos fue de 1499 sujetos (cohorte 2013 y 2014). Mientras que para testear los modelos creados se utilizaron 793 alumnos de la cohorte 2015. Se empleó la herramienta libre Weka y ejecutar y evaluar el desempeño de los algoritmos. Se encontró que el algoritmo del J48 permitió obtener efectividades mayor que los otros algoritmos. Se observó que todos los algoritmos supervisados, en su etapa de entrenamiento, arrojan un desempeño general, con porcentajes mayores al 90% de exactitud, mientras que estos mismos algoritmos cuando son convertidos a modelos y son testeados con nuevos lotes de prueba, el porcentaje de acierto baja a valores apenas superiores al 50%. El conocimiento generado permitirá soportar la toma de decisiones eficaces de las directivas universitarias enfocadas a formular políticas y estrategias relacionadas con los programas de retención estudiantil que actualmente se encuentran establecidos.
publishDate 2016
dc.date.none.fl_str_mv 2016
2021-06-11T17:37:11Z
2021-06-11T17:37:11Z
dc.type.none.fl_str_mv info:eu-repo/semantics/report
info:eu-repo/semantics/acceptedVersion
http://purl.org/coar/resource_type/c_18gh
info:ar-repo/semantics/informeTecnico
format report
status_str acceptedVersion
dc.identifier.none.fl_str_mv Ryckeboer, H, E. J. L., Spositto, O. M., Castro, H. M., Bossero, J. C., Gargano, C. V., Matteo, L. R., Prilusky, E. M.,… Quintana, F. H. (2016). Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción [Archivo PDF]. San Justo: Universidad Nacional de La Matanza. Recuperado de http://repositoriocyt.unlam.edu.ar/handle/123456789/576
http://repositoriocyt.unlam.edu.ar/handle/123456789/576
identifier_str_mv Ryckeboer, H, E. J. L., Spositto, O. M., Castro, H. M., Bossero, J. C., Gargano, C. V., Matteo, L. R., Prilusky, E. M.,… Quintana, F. H. (2016). Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción [Archivo PDF]. San Justo: Universidad Nacional de La Matanza. Recuperado de http://repositoriocyt.unlam.edu.ar/handle/123456789/576
url http://repositoriocyt.unlam.edu.ar/handle/123456789/576
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv info:eu-repo/grantAgreement/SPU/PROINCE/C-176/AR. Buenos Aires. San Justo/Análisis comparativo de modelos de clasificación de minería de datos (Data Mining). Su aplicación en la predicción de perfiles de alumnos en riesgo de deserción.
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Licencia Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 AR)
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
Licencia Creative Commons Atribución-NoComercial-CompartirIgual 2.5 Argentina (CC BY-NC-SA 2.5 AR)
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas
publisher.none.fl_str_mv Universidad Nacional de La Matanza. Departamento de Ingeniería e Investigaciones Tecnológicas
dc.source.none.fl_str_mv reponame:Repositorio Digital UNLaM
instname:Universidad Nacional de La Matanza
reponame_str Repositorio Digital UNLaM
collection Repositorio Digital UNLaM
instname_str Universidad Nacional de La Matanza
repository.name.fl_str_mv Repositorio Digital UNLaM - Universidad Nacional de La Matanza
repository.mail.fl_str_mv cytunlam@gmail.com
_version_ 1842344021786099712
score 12.623145