Caracterización de trayectorias educativas a partir de producciones de código

Autores
Erausquin, Carla de
Año de publicación
2024
Idioma
español castellano
Tipo de recurso
tesis de grado
Estado
versión publicada
Colaborador/a o director/a de tesis
López y Rosenfeld, Matías
Turjanski, Pablo Guillermo
Descripción
Con el creciente interés en la ciencia y la tecnología en los últimos años, los docentes enfrentan el desafío de corregir grandes volúmenes de código sin perder de vista el nivel de conocimiento alcanzado por los diferentes grupos de estudiantes. En este contexto, contar con herramientas que permitan predecir de manera temprana el riesgo de abandono en cursos introductorios de programación se vuelve crucial para enfocar la atención en aquellos alumnos que más lo necesitan. Para ello se analizó un conjunto de datos correspondiente a un curso de Introducción a la programación en Python. Se estudiaron exclusivamente sus producciones de código, transformadas a embeddings con ayuda del modelo CodeBERT. Utilizando técnicas de reducción de la dimensionalidad y, posteriormente, clustering se logró caracterizar a parte de los alumnos que abandonarían el curso de manera temprana. En particular, al grupo de estudiantes que abandonarían el curso una vez llegada la primera instancia de evaluación. No se logró diferenciar, para los ejercicios propuestos, entre aquellos alumnos que finalizarían el curso y aquellos que prosiguieron con las entregas más allá del primer examen.
With the growing interest in Science and Technology in recent years, teachers face the challenge of correcting large volumes of code while keeping track of the knowledge level achieved by different groups of students. In this context, having tools that allow early prediction of dropout risk in introductory programming courses becomes crucial to focus attention on those students who need it most. For this purpose, a dataset corresponding to an introduction to Python programming course was analyzed. Only their code productions were studied, transformed into embeddings with the help of the CodeBERT model. Using dimensionality reduction techniques and, subsequently, clustering, it was possible to characterize some of the students who would drop out of the course early. In particular, the group of students who would abandon the course upon reaching the first evaluation instance. For the proposed exercises, it was not possible to differentiate between those students who would complete the course and those who continued with submissions beyond the first exam.
Fil: Erausquin, Carla de. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
Materia
CLUSTERING
CODEBERT
EMBEDDINGS
ENSEÑANZA
PYTHON
PROGRAMACION
CLUSTERING
CODEBERT
EMBEDDINGS
TEACHING
PYTHON
PROGRAMMING
Nivel de accesibilidad
acceso abierto
Condiciones de uso
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
Repositorio
Biblioteca Digital (UBA-FCEN)
Institución
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
OAI Identificador
seminario:seminario_nDAT000007_Erausquin

id BDUBAFCEN_038bac631f1fe3207afbaaef5832908c
oai_identifier_str seminario:seminario_nDAT000007_Erausquin
network_acronym_str BDUBAFCEN
repository_id_str 1896
network_name_str Biblioteca Digital (UBA-FCEN)
spelling Caracterización de trayectorias educativas a partir de producciones de códigoCharacterization of educational trajectories based on code productionsErausquin, Carla deCLUSTERINGCODEBERTEMBEDDINGSENSEÑANZAPYTHONPROGRAMACIONCLUSTERINGCODEBERTEMBEDDINGSTEACHINGPYTHONPROGRAMMINGCon el creciente interés en la ciencia y la tecnología en los últimos años, los docentes enfrentan el desafío de corregir grandes volúmenes de código sin perder de vista el nivel de conocimiento alcanzado por los diferentes grupos de estudiantes. En este contexto, contar con herramientas que permitan predecir de manera temprana el riesgo de abandono en cursos introductorios de programación se vuelve crucial para enfocar la atención en aquellos alumnos que más lo necesitan. Para ello se analizó un conjunto de datos correspondiente a un curso de Introducción a la programación en Python. Se estudiaron exclusivamente sus producciones de código, transformadas a embeddings con ayuda del modelo CodeBERT. Utilizando técnicas de reducción de la dimensionalidad y, posteriormente, clustering se logró caracterizar a parte de los alumnos que abandonarían el curso de manera temprana. En particular, al grupo de estudiantes que abandonarían el curso una vez llegada la primera instancia de evaluación. No se logró diferenciar, para los ejercicios propuestos, entre aquellos alumnos que finalizarían el curso y aquellos que prosiguieron con las entregas más allá del primer examen.With the growing interest in Science and Technology in recent years, teachers face the challenge of correcting large volumes of code while keeping track of the knowledge level achieved by different groups of students. In this context, having tools that allow early prediction of dropout risk in introductory programming courses becomes crucial to focus attention on those students who need it most. For this purpose, a dataset corresponding to an introduction to Python programming course was analyzed. Only their code productions were studied, transformed into embeddings with the help of the CodeBERT model. Using dimensionality reduction techniques and, subsequently, clustering, it was possible to characterize some of the students who would drop out of the course early. In particular, the group of students who would abandon the course upon reaching the first evaluation instance. For the proposed exercises, it was not possible to differentiate between those students who would complete the course and those who continued with submissions beyond the first exam.Fil: Erausquin, Carla de. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesLópez y Rosenfeld, MatíasTurjanski, Pablo Guillermo2024-12-19info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nDAT000007_Erausquinspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:32Zseminario:seminario_nDAT000007_ErausquinInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:33.614Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse
dc.title.none.fl_str_mv Caracterización de trayectorias educativas a partir de producciones de código
Characterization of educational trajectories based on code productions
title Caracterización de trayectorias educativas a partir de producciones de código
spellingShingle Caracterización de trayectorias educativas a partir de producciones de código
Erausquin, Carla de
CLUSTERING
CODEBERT
EMBEDDINGS
ENSEÑANZA
PYTHON
PROGRAMACION
CLUSTERING
CODEBERT
EMBEDDINGS
TEACHING
PYTHON
PROGRAMMING
title_short Caracterización de trayectorias educativas a partir de producciones de código
title_full Caracterización de trayectorias educativas a partir de producciones de código
title_fullStr Caracterización de trayectorias educativas a partir de producciones de código
title_full_unstemmed Caracterización de trayectorias educativas a partir de producciones de código
title_sort Caracterización de trayectorias educativas a partir de producciones de código
dc.creator.none.fl_str_mv Erausquin, Carla de
author Erausquin, Carla de
author_facet Erausquin, Carla de
author_role author
dc.contributor.none.fl_str_mv López y Rosenfeld, Matías
Turjanski, Pablo Guillermo
dc.subject.none.fl_str_mv CLUSTERING
CODEBERT
EMBEDDINGS
ENSEÑANZA
PYTHON
PROGRAMACION
CLUSTERING
CODEBERT
EMBEDDINGS
TEACHING
PYTHON
PROGRAMMING
topic CLUSTERING
CODEBERT
EMBEDDINGS
ENSEÑANZA
PYTHON
PROGRAMACION
CLUSTERING
CODEBERT
EMBEDDINGS
TEACHING
PYTHON
PROGRAMMING
dc.description.none.fl_txt_mv Con el creciente interés en la ciencia y la tecnología en los últimos años, los docentes enfrentan el desafío de corregir grandes volúmenes de código sin perder de vista el nivel de conocimiento alcanzado por los diferentes grupos de estudiantes. En este contexto, contar con herramientas que permitan predecir de manera temprana el riesgo de abandono en cursos introductorios de programación se vuelve crucial para enfocar la atención en aquellos alumnos que más lo necesitan. Para ello se analizó un conjunto de datos correspondiente a un curso de Introducción a la programación en Python. Se estudiaron exclusivamente sus producciones de código, transformadas a embeddings con ayuda del modelo CodeBERT. Utilizando técnicas de reducción de la dimensionalidad y, posteriormente, clustering se logró caracterizar a parte de los alumnos que abandonarían el curso de manera temprana. En particular, al grupo de estudiantes que abandonarían el curso una vez llegada la primera instancia de evaluación. No se logró diferenciar, para los ejercicios propuestos, entre aquellos alumnos que finalizarían el curso y aquellos que prosiguieron con las entregas más allá del primer examen.
With the growing interest in Science and Technology in recent years, teachers face the challenge of correcting large volumes of code while keeping track of the knowledge level achieved by different groups of students. In this context, having tools that allow early prediction of dropout risk in introductory programming courses becomes crucial to focus attention on those students who need it most. For this purpose, a dataset corresponding to an introduction to Python programming course was analyzed. Only their code productions were studied, transformed into embeddings with the help of the CodeBERT model. Using dimensionality reduction techniques and, subsequently, clustering, it was possible to characterize some of the students who would drop out of the course early. In particular, the group of students who would abandon the course upon reaching the first evaluation instance. For the proposed exercises, it was not possible to differentiate between those students who would complete the course and those who continued with submissions beyond the first exam.
Fil: Erausquin, Carla de. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.
description Con el creciente interés en la ciencia y la tecnología en los últimos años, los docentes enfrentan el desafío de corregir grandes volúmenes de código sin perder de vista el nivel de conocimiento alcanzado por los diferentes grupos de estudiantes. En este contexto, contar con herramientas que permitan predecir de manera temprana el riesgo de abandono en cursos introductorios de programación se vuelve crucial para enfocar la atención en aquellos alumnos que más lo necesitan. Para ello se analizó un conjunto de datos correspondiente a un curso de Introducción a la programación en Python. Se estudiaron exclusivamente sus producciones de código, transformadas a embeddings con ayuda del modelo CodeBERT. Utilizando técnicas de reducción de la dimensionalidad y, posteriormente, clustering se logró caracterizar a parte de los alumnos que abandonarían el curso de manera temprana. En particular, al grupo de estudiantes que abandonarían el curso una vez llegada la primera instancia de evaluación. No se logró diferenciar, para los ejercicios propuestos, entre aquellos alumnos que finalizarían el curso y aquellos que prosiguieron con las entregas más allá del primer examen.
publishDate 2024
dc.date.none.fl_str_mv 2024-12-19
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_7a1f
info:ar-repo/semantics/tesisDeGrado
format bachelorThesis
status_str publishedVersion
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.12110/seminario_nDAT000007_Erausquin
url https://hdl.handle.net/20.500.12110/seminario_nDAT000007_Erausquin
dc.language.none.fl_str_mv spa
language spa
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
https://creativecommons.org/licenses/by-nc-sa/2.5/ar
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/2.5/ar
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publisher.none.fl_str_mv Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
dc.source.none.fl_str_mv reponame:Biblioteca Digital (UBA-FCEN)
instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron:UBA-FCEN
reponame_str Biblioteca Digital (UBA-FCEN)
collection Biblioteca Digital (UBA-FCEN)
instname_str Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
instacron_str UBA-FCEN
institution UBA-FCEN
repository.name.fl_str_mv Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
repository.mail.fl_str_mv ana@bl.fcen.uba.ar
_version_ 1844618752918814720
score 13.070432