Impacto del Género en el Rendimiento Estudiantil: Un Análisis Estadístico con Machine Learning | Instituto Data Science Argentina

🔥 Cyber Week: 12 cuotas sin interés con todos los medios de pago | 20% de descuento en 1 pago por transferencia. Con tu inscripción te incluimos GRATIS el Curso Experto en Power BI 🔥

Proyecto Final de Paula Cardone
Diplomatura en Ciencia de Datos con R y Python

En el Instituto Data Science Argentina seguimos destacando proyectos que aplican la ciencia de datos para comprender y mejorar fenómenos reales. En esta ocasión, presentamos el trabajo final de Paula Cardone, docente y especialista en estadística, quien realizó un análisis del rendimiento académico considerando el impacto del género en la materia Probabilidad y Estadística de la Universidad Nacional de Rosario.

Objetivo del proyecto

El propósito del estudio fue analizar los factores que influyen en la aprobación de la asignatura y determinar si existen diferencias de rendimiento asociadas al género, utilizando herramientas estadísticas y modelos predictivos de machine learning.

Paula partió de datos reales de seis cuatrimestres consecutivos, procesando información anonimizada de los estudiantes. Las variables analizadas incluyeron:

  • Género
  • Calificaciones de los parciales
  • Nota final
  • Número de intentos e insuficientes antes de aprobar

El desafío: identificar patrones y construir un modelo que permita predecir la probabilidad de aprobación de un estudiante para diseñar estrategias de mejora educativa.

Análisis exploratorio de datos

El estudio reveló varios hallazgos significativos:

  • La deserción estudiantil es un fenómeno importante: del 100% que inicia la cursada, solo la mitad llega al examen final.
  • Se observó una brecha de género común en las áreas STEM (Ciencia, Tecnología, Ingeniería y Matemática): un 75% de varones y un 25% de mujeres.
  • Sin embargo, las mujeres mostraron mayor permanencia y tasa de aprobación, aunque necesitaron en promedio más intentos para rendir el examen.

Las distribuciones de notas entre hombres y mujeres fueron similares, indicando que el rendimiento académico no difiere significativamente por género, pero sí la trayectoria y persistencia.

Modelos de Machine Learning aplicados

Para predecir la aprobación final, Paula entrenó tres modelos con un 80/20 de entrenamiento y testeo:

  1. Regresión Logística – Precisión del 86%
  2. Random Forest – Precisión del 87%
  3. Máquina de Soporte Vectorial (SVM) – Precisión del 84%

El modelo de Random Forest se destacó por su capacidad para identificar la importancia de las variables:
la aprobación del segundo parcial fue el predictor más influyente, seguido por el número de insuficientes.
El género, en cambio, no tuvo un impacto estadísticamente significativo en la aprobación final.

Evaluación económica de los modelos

Más allá de la precisión técnica, se realizó un análisis económico de los modelos considerando los costos de los falsos positivos y falsos negativos.
El modelo Random Forest ofreció el mejor equilibrio entre precisión y costo, al reducir inversiones innecesarias en tutorías y enfocar los recursos en los estudiantes con mayor riesgo académico.

Conclusiones y propuestas de mejora

El proyecto propone acciones concretas para mejorar el rendimiento estudiantil en la cátedra:

  • Detectar estudiantes en riesgo desde el primer parcial.
  • Implementar talleres de preparación enfocados en resolución de problemas y gestión del tiempo.
  • Fomentar el trabajo colaborativo entre géneros para potenciar fortalezas diversas.
  • Revisar los criterios de evaluación y contenidos de los parciales, identificados como variables clave del desempeño.

Data Science y educación: un puente hacia la mejora académica

Este trabajo demuestra cómo el análisis estadístico y el machine learning pueden convertirse en herramientas poderosas para mejorar la gestión educativa y promover la equidad de género en ámbitos universitarios.

Desde el Instituto Data Science Argentina, celebramos iniciativas como la de Paula Cardone que integran la ciencia de datos con la educación, generando conocimiento aplicable a contextos reales y socialmente relevantes.

LinkedIn de Paula Cardone: https://www.linkedin.com/in/paula-cardone-zan/

Si te interesa aprender más sobre Ciencia de Datos y proyectos aplicados con Python y R 👇👇

Artículo añadido al carrito.
0 artículos - $0,00