Proyecto de Investigación
Predicción temprana de deserción mediante aprendizaje automático en cursos profesionales en línea
Decidimos investigar una temática que nos preocupa. La deserción de los estudiantes en los cursos online es superior que el de los cursos presenciales. Este ratio varía según la metodología aplicada en los cursos online.
Si la deserción se pudiera predecir de manera temprana, se podrían plantear acciones preventivas y disminuir así la cantidad de desertores. La información necesaria para este análisis se encuentra disponible en las propias plataformas donde se registran todas las interacciones del alumno.
Nos propusimos usar ese registro para aprender a predecir la deserción dentro de las dos primeras semanas del curso. Este fue el punto de partida para generar las acciones de retención de los alumnos.
Hemos conseguido definir una métrica del impacto del resultado alcanzado. Logrando una predicción capaz de recuperar algo más del 90% del daño de la deserción.
Resumen del Trabajo Publicado
«Predicción temprana de deserción mediante aprendizaje automático en cursos profesionales en línea
A pesar de las ventajas del e-learning, esta modalidad de aprendizaje es proclive a la deserción.
Estudios anteriores mostraron que se pueden aplicar técnicas de aprendizaje automático a los registros de interacciones entre estudiantes y la plataforma para predecir el abandono. En esa línea, este trabajo intenta encontrar modelos predictivos de deserción en cursos virtuales que duran entre seis y dieciséis semanas, utilizando registros de Moodle correspondientes a las dos primeras.
Se evaluó la sensibilidad, especificidad y precisión de los modelos, pero se priorizó más en qué medida dichos modelos facilitaban evitar la deserción mediante acciones de retención efectivas en costo. Específicamente, se usaron datos de varias cohortes de cuatro cursos de temáticas y duraciones distintas, dictados por la Secretaría de Extensión de la Universidad Tecnológica Nacional de la República Argentina, Regional Buenos Aires, entre febrero de 2018 y octubre de 2019.
Se usaron distintos algoritmos para generar modelos predictivos y optimizarlos hacia la mitigación de la pérdida económica causada por la deserción. Se analizó si alguno en particular generaba los mejores modelos para todos los cursos.
Se estudió si convenía construir modelos separados por curso o bien uno para todo el conjunto de los datos de los cuatro cursos.
Como conclusión, se encontró que sí es posible construir modelos predictivos exitosos y que el algoritmo que produjo los mejores modelos fue una red neuronal en tres de los cuatro cursos. Asimismo, resultó mejor el modelo que ajustó cada uno por separado.»
Nuestra contribución ha sido aceptada y publicada por RIED. Revista Iberoamericana de Educación a Distancia.
