Caracterización de trayectorias educativas a partir de producciones de código
- Autores
- Erausquin, Carla de
- Año de publicación
- 2024
- Idioma
- español castellano
- Tipo de recurso
- tesis de grado
- Estado
- versión publicada
- Colaborador/a o director/a de tesis
- López y Rosenfeld, Matías
Turjanski, Pablo Guillermo - Descripción
- Con el creciente interés en la ciencia y la tecnología en los últimos años, los docentes enfrentan el desafío de corregir grandes volúmenes de código sin perder de vista el nivel de conocimiento alcanzado por los diferentes grupos de estudiantes. En este contexto, contar con herramientas que permitan predecir de manera temprana el riesgo de abandono en cursos introductorios de programación se vuelve crucial para enfocar la atención en aquellos alumnos que más lo necesitan. Para ello se analizó un conjunto de datos correspondiente a un curso de Introducción a la programación en Python. Se estudiaron exclusivamente sus producciones de código, transformadas a embeddings con ayuda del modelo CodeBERT. Utilizando técnicas de reducción de la dimensionalidad y, posteriormente, clustering se logró caracterizar a parte de los alumnos que abandonarían el curso de manera temprana. En particular, al grupo de estudiantes que abandonarían el curso una vez llegada la primera instancia de evaluación. No se logró diferenciar, para los ejercicios propuestos, entre aquellos alumnos que finalizarían el curso y aquellos que prosiguieron con las entregas más allá del primer examen.
With the growing interest in Science and Technology in recent years, teachers face the challenge of correcting large volumes of code while keeping track of the knowledge level achieved by different groups of students. In this context, having tools that allow early prediction of dropout risk in introductory programming courses becomes crucial to focus attention on those students who need it most. For this purpose, a dataset corresponding to an introduction to Python programming course was analyzed. Only their code productions were studied, transformed into embeddings with the help of the CodeBERT model. Using dimensionality reduction techniques and, subsequently, clustering, it was possible to characterize some of the students who would drop out of the course early. In particular, the group of students who would abandon the course upon reaching the first evaluation instance. For the proposed exercises, it was not possible to differentiate between those students who would complete the course and those who continued with submissions beyond the first exam.
Fil: Erausquin, Carla de. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. - Materia
-
CLUSTERING
CODEBERT
EMBEDDINGS
ENSEÑANZA
PYTHON
PROGRAMACION
CLUSTERING
CODEBERT
EMBEDDINGS
TEACHING
PYTHON
PROGRAMMING - Nivel de accesibilidad
- acceso abierto
- Condiciones de uso
- https://creativecommons.org/licenses/by-nc-sa/2.5/ar
- Repositorio
- Institución
- Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales
- OAI Identificador
- seminario:seminario_nDAT000007_Erausquin
Ver los metadatos del registro completo
id |
BDUBAFCEN_038bac631f1fe3207afbaaef5832908c |
---|---|
oai_identifier_str |
seminario:seminario_nDAT000007_Erausquin |
network_acronym_str |
BDUBAFCEN |
repository_id_str |
1896 |
network_name_str |
Biblioteca Digital (UBA-FCEN) |
spelling |
Caracterización de trayectorias educativas a partir de producciones de códigoCharacterization of educational trajectories based on code productionsErausquin, Carla deCLUSTERINGCODEBERTEMBEDDINGSENSEÑANZAPYTHONPROGRAMACIONCLUSTERINGCODEBERTEMBEDDINGSTEACHINGPYTHONPROGRAMMINGCon el creciente interés en la ciencia y la tecnología en los últimos años, los docentes enfrentan el desafío de corregir grandes volúmenes de código sin perder de vista el nivel de conocimiento alcanzado por los diferentes grupos de estudiantes. En este contexto, contar con herramientas que permitan predecir de manera temprana el riesgo de abandono en cursos introductorios de programación se vuelve crucial para enfocar la atención en aquellos alumnos que más lo necesitan. Para ello se analizó un conjunto de datos correspondiente a un curso de Introducción a la programación en Python. Se estudiaron exclusivamente sus producciones de código, transformadas a embeddings con ayuda del modelo CodeBERT. Utilizando técnicas de reducción de la dimensionalidad y, posteriormente, clustering se logró caracterizar a parte de los alumnos que abandonarían el curso de manera temprana. En particular, al grupo de estudiantes que abandonarían el curso una vez llegada la primera instancia de evaluación. No se logró diferenciar, para los ejercicios propuestos, entre aquellos alumnos que finalizarían el curso y aquellos que prosiguieron con las entregas más allá del primer examen.With the growing interest in Science and Technology in recent years, teachers face the challenge of correcting large volumes of code while keeping track of the knowledge level achieved by different groups of students. In this context, having tools that allow early prediction of dropout risk in introductory programming courses becomes crucial to focus attention on those students who need it most. For this purpose, a dataset corresponding to an introduction to Python programming course was analyzed. Only their code productions were studied, transformed into embeddings with the help of the CodeBERT model. Using dimensionality reduction techniques and, subsequently, clustering, it was possible to characterize some of the students who would drop out of the course early. In particular, the group of students who would abandon the course upon reaching the first evaluation instance. For the proposed exercises, it was not possible to differentiate between those students who would complete the course and those who continued with submissions beyond the first exam.Fil: Erausquin, Carla de. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina.Universidad de Buenos Aires. Facultad de Ciencias Exactas y NaturalesLópez y Rosenfeld, MatíasTurjanski, Pablo Guillermo2024-12-19info:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionhttp://purl.org/coar/resource_type/c_7a1finfo:ar-repo/semantics/tesisDeGradoapplication/pdfhttps://hdl.handle.net/20.500.12110/seminario_nDAT000007_Erausquinspainfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/2.5/arreponame:Biblioteca Digital (UBA-FCEN)instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesinstacron:UBA-FCEN2025-09-29T13:43:32Zseminario:seminario_nDAT000007_ErausquinInstitucionalhttps://digital.bl.fcen.uba.ar/Universidad públicaNo correspondehttps://digital.bl.fcen.uba.ar/cgi-bin/oaiserver.cgiana@bl.fcen.uba.arArgentinaNo correspondeNo correspondeNo correspondeopendoar:18962025-09-29 13:43:33.614Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturalesfalse |
dc.title.none.fl_str_mv |
Caracterización de trayectorias educativas a partir de producciones de código Characterization of educational trajectories based on code productions |
title |
Caracterización de trayectorias educativas a partir de producciones de código |
spellingShingle |
Caracterización de trayectorias educativas a partir de producciones de código Erausquin, Carla de CLUSTERING CODEBERT EMBEDDINGS ENSEÑANZA PYTHON PROGRAMACION CLUSTERING CODEBERT EMBEDDINGS TEACHING PYTHON PROGRAMMING |
title_short |
Caracterización de trayectorias educativas a partir de producciones de código |
title_full |
Caracterización de trayectorias educativas a partir de producciones de código |
title_fullStr |
Caracterización de trayectorias educativas a partir de producciones de código |
title_full_unstemmed |
Caracterización de trayectorias educativas a partir de producciones de código |
title_sort |
Caracterización de trayectorias educativas a partir de producciones de código |
dc.creator.none.fl_str_mv |
Erausquin, Carla de |
author |
Erausquin, Carla de |
author_facet |
Erausquin, Carla de |
author_role |
author |
dc.contributor.none.fl_str_mv |
López y Rosenfeld, Matías Turjanski, Pablo Guillermo |
dc.subject.none.fl_str_mv |
CLUSTERING CODEBERT EMBEDDINGS ENSEÑANZA PYTHON PROGRAMACION CLUSTERING CODEBERT EMBEDDINGS TEACHING PYTHON PROGRAMMING |
topic |
CLUSTERING CODEBERT EMBEDDINGS ENSEÑANZA PYTHON PROGRAMACION CLUSTERING CODEBERT EMBEDDINGS TEACHING PYTHON PROGRAMMING |
dc.description.none.fl_txt_mv |
Con el creciente interés en la ciencia y la tecnología en los últimos años, los docentes enfrentan el desafío de corregir grandes volúmenes de código sin perder de vista el nivel de conocimiento alcanzado por los diferentes grupos de estudiantes. En este contexto, contar con herramientas que permitan predecir de manera temprana el riesgo de abandono en cursos introductorios de programación se vuelve crucial para enfocar la atención en aquellos alumnos que más lo necesitan. Para ello se analizó un conjunto de datos correspondiente a un curso de Introducción a la programación en Python. Se estudiaron exclusivamente sus producciones de código, transformadas a embeddings con ayuda del modelo CodeBERT. Utilizando técnicas de reducción de la dimensionalidad y, posteriormente, clustering se logró caracterizar a parte de los alumnos que abandonarían el curso de manera temprana. En particular, al grupo de estudiantes que abandonarían el curso una vez llegada la primera instancia de evaluación. No se logró diferenciar, para los ejercicios propuestos, entre aquellos alumnos que finalizarían el curso y aquellos que prosiguieron con las entregas más allá del primer examen. With the growing interest in Science and Technology in recent years, teachers face the challenge of correcting large volumes of code while keeping track of the knowledge level achieved by different groups of students. In this context, having tools that allow early prediction of dropout risk in introductory programming courses becomes crucial to focus attention on those students who need it most. For this purpose, a dataset corresponding to an introduction to Python programming course was analyzed. Only their code productions were studied, transformed into embeddings with the help of the CodeBERT model. Using dimensionality reduction techniques and, subsequently, clustering, it was possible to characterize some of the students who would drop out of the course early. In particular, the group of students who would abandon the course upon reaching the first evaluation instance. For the proposed exercises, it was not possible to differentiate between those students who would complete the course and those who continued with submissions beyond the first exam. Fil: Erausquin, Carla de. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. |
description |
Con el creciente interés en la ciencia y la tecnología en los últimos años, los docentes enfrentan el desafío de corregir grandes volúmenes de código sin perder de vista el nivel de conocimiento alcanzado por los diferentes grupos de estudiantes. En este contexto, contar con herramientas que permitan predecir de manera temprana el riesgo de abandono en cursos introductorios de programación se vuelve crucial para enfocar la atención en aquellos alumnos que más lo necesitan. Para ello se analizó un conjunto de datos correspondiente a un curso de Introducción a la programación en Python. Se estudiaron exclusivamente sus producciones de código, transformadas a embeddings con ayuda del modelo CodeBERT. Utilizando técnicas de reducción de la dimensionalidad y, posteriormente, clustering se logró caracterizar a parte de los alumnos que abandonarían el curso de manera temprana. En particular, al grupo de estudiantes que abandonarían el curso una vez llegada la primera instancia de evaluación. No se logró diferenciar, para los ejercicios propuestos, entre aquellos alumnos que finalizarían el curso y aquellos que prosiguieron con las entregas más allá del primer examen. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-12-19 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_7a1f info:ar-repo/semantics/tesisDeGrado |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.none.fl_str_mv |
https://hdl.handle.net/20.500.12110/seminario_nDAT000007_Erausquin |
url |
https://hdl.handle.net/20.500.12110/seminario_nDAT000007_Erausquin |
dc.language.none.fl_str_mv |
spa |
language |
spa |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/2.5/ar |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publisher.none.fl_str_mv |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital (UBA-FCEN) instname:Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales instacron:UBA-FCEN |
reponame_str |
Biblioteca Digital (UBA-FCEN) |
collection |
Biblioteca Digital (UBA-FCEN) |
instname_str |
Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
instacron_str |
UBA-FCEN |
institution |
UBA-FCEN |
repository.name.fl_str_mv |
Biblioteca Digital (UBA-FCEN) - Universidad Nacional de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
repository.mail.fl_str_mv |
ana@bl.fcen.uba.ar |
_version_ |
1844618752918814720 |
score |
13.070432 |