EL PAPEL DEL DEEP LEARNING EN LA DESERCIÓN ESTUDIANTIL

EL PAPEL DEL DEEP LEARNING EN LA DESERCIÓN ESTUDIANTIL

En esta época de confinamiento algunas universidades se han visto en la necesidad de implementar sistemas de E-learning para impartir sus clases, pero quizás no se hayan cuestionado o tenido en cuenta la tasa de deserción en el país en la educación superior virtual. En el Colombia existe una tasa de deserción del 22% aproximadamente para el 2016 en la educación virtual universitaria por distintos casos, aunque al tiempo se ha ido aumentando esta modalidad.

Deserción en modalidad virtual en Colombia. Tomado de: https://dialnet.unirioja.es/descarga/articulo/6586773.pdf

La deserción estudiantil es una realidad en el país y es un fenómeno complejo. Un modelo predictivo, puede ayudar a mitigar y evitar deserciones futuras, tomando datos históricos y con ellos arrojar resultados esperados para ser analizados y apoyar en la toma de decisiones. La presente propuesta se desarrolla, tomando eventos históricos con distintas variables de tipo social, académico, personal, laboral, ingresos a las plataformas E-learning, etc. y posteriormente a estas variables se le aplican algoritmos de Deep Learning. Se espera la predicción de probabilidades de deserción de cada estudiante, posteriormente, con esta información se puede alertar y aplicar medidas preventivas tempranas con la población estudiantil.

En investigaciones anteriores se han creado e implementado modelos predictivos en algunas instituciones de educación superior, utilizando distintas técnicas y algoritmos como, por ejemplo: minería de datos, arboles de decisión, el algoritmo ID3 (en inglés, Induction Decision Trees), etc.  Amaya y Barrientos (2014), propusieron un modelo predictivo de deserción estudiantil utilizando técnicas de minería de datos, caracterizando a los estudiantes de una universidad con el objetivo de poder predecir la probabilidad de deserción de los estudiantes con diferentes algoritmos para clasificar variables. Por su parte Quintana y Trinidad (2013), presentaron una comparación de algoritmos de clasificación para la predicción de la deserción escolar en un centro universitario y con ello, determinar el algoritmo más adecuado, basados en la precisión de la clasificación. Patiño y Cardona (2012), desarrollan un estudio sobre los niveles de deserción en Colombia y Latinoamérica para identificar los factores que inciden en el aumento de deserción en las universidades, pero no establece un modelo para predecir dicha deserción e investiga sobre deserción en modalidad tradicional, no virtual. En este sentido, Cuji y Gavilanes (2017), proponen la construcción de un modelo para pronosticar la probabilidad de abandono por parte de los estudiantes de su programa académico universitario, pero no son estudiantes en modalidad virtual y utiliza técnicas de clasificación basadas en árboles de decisión.  (Vila y Granda, 2018) realizan un trabajo semejante en una Universidad de Ecuador, pero usando técnicas de minería de datos. Y finalmente, Forero y Piñeros (2019), muestran un caso de estudio de identificación de ingeniería industrial en riesgo de deserción en ciertos semestres académicos con Machine Learning.

Para la construcción del presente modelo predictivo se plantea solucionar con técnicas de Deep Learning supervisado, que es una técnica basada en Redes Neuronales Artificiales; Que ha venido surgiendo en los últimos años, como una herramienta poderosa para el aprendizaje automático, Esta promete remodelar el futuro de la Inteligencia Artificial. Las cuales consisten en emular el aprendizaje humano con el fin de obtener ciertos conocimientos a partir de un conjunto de datos ejemplos, un conjunto de entrenamiento es enviado como entrada al sistema durante la fase de entrenamiento, cada entrada es etiquetada con un valor de salida deseado y de esta forma dicho sistema sabe cómo es la salida cuando llega una entrada.

Existen tipos de datos categóricos, por ejemplo: género, estado civil, situación laboral, atención del tutor hacia los estudiantes, percepción del estudiante hacia el tutor virtual, entre otros; y numéricos (continuos y discretos), por ejemplo: edad, peso, número de hijos, número de hermanos, número de veces de ingreso al campus virtual semanal (estudiante y tutor), número de visitas semanales promedio a páginas en el campus virtual, tiempos de respuesta promedio del tutor al estudiante, etc. "Díaz, 2008"

Determinantes de la deserción estudiantil  

Las variables o atributos que se extraerán y se tendrán en cuenta para el presente modelo son de tipo numérico:

  • Factores Individuales: edad.
  • Factores académicos: promedio estudiantil, promedio ICFES para ingreso, ingreso al campus virtual semanal por parte del estudiante.
  • Factores internos a la Universidad: costo semestral.
  • Factores socioeconómicos: estrato, ingresos económicos.

Se toman factores de tipo numérico para realizar la propuesta inicial del modelo de predicción en el que las “variables de entrada” o etiquetas sean numéricas para emplear un modelo de aprendizaje profundo supervisado de regresión, en el que se obtengan dígitos como resultado. Esto no excluye la forma en transformar variables no numéricas a un valor para procesamiento como lo puede hacer la potente librería de Tensorflow, que es una biblioteca de software libre propiedad de Google, que se utiliza para realizar cálculos numéricos mediante diagramas de flujo de datos y otras, pero como propuesta inicial se realizará con el tipo de valores en mención.

Los factores tecnológicos como: acceso a internet y familiaridad con las TIC, son muy importantes en el presente contexto, pues se trata de educación virtual, pero no se tendrá en cuenta como variable en el modelo. Otros factores que no se incluirán en esta propuesta inicial, pero que son importantes son: estado civil y situación laboral de los padres.

Modelo de análisis de deserción propuesto 

En la siguiente figura se puede apreciar de forma ilustrativa el estándar del proceso del modelo de Deep Learning utilizado en la presente propuesta, aquí se define la relación entre las “características o atributos” y las “etiquetas”; se hace la definición del objetivo, normalización de datos que existan a lugar; a continuación la creación de un conjunto de datos de entrenamiento y de pruebas, para llegar a la creación del modelo, el entrenamiento y finalmente las predicciones a partir de los subprocesos anteriores.

Proceso de la propuesta Modelo de aprendizaje profundo  

REFERENCIAS

Forero, L. & Piñeros, Y. (2019). Proposal of Architecture And Application of Machine Learning (Ml) as A Strategy For The Reduction of University Desertion Levels Due to Academic Factors

Díaz, C. (2008). Modelo conceptual para la deserción estudiantil universitaria chilena. (U. C. Concepción, Ed.) Estudios Pedagógicos, XXXIV. http://dx.doi.org/10.4067/S0718-07052008000200004

Tensorflow (2020). Tensorflow. Recuperado de: https://www.tensorflow.org/?hl=es (Abril, 2020)

Ravì, D. (2017). Deep Learning for Health Informatics. IEEE Journal of Biomedical and Health Informatics, vol. 21, no. 1, pp. 4-21. https://doi.org/10.1109/JBHI.2016.2636665

 

Julio Martínez

Equipo de Ingeniería de Software

Me hace feliz: Mi familia.

Mi color favorito es: Rojo.

Mi comida favorita es: Salmón

Compartir con un amigo

Escríbenos


Para nosotros es muy importante contar con tu opinión, estamos dispuestos a escuchar y resolver todas tus solicitudes. Este espacio nos permite buscar acciones de mejora para continuar prestando nuestros servicios satisfactoriamente.

0 (Max. 20 Characters)
0 (Max. 400 Characters)
Enviar