Ciencias de la Educacin

Artculo de Investigacin

 

Data Science para la Prediccin del Rendimiento Acadmico

 

Data Science for Prediction of Academic Achievement

 

Cincia de dados para a previso do desempenho acadmico

 

Zoila Jessenia Fabara-Sarmiento I
jessenia.fabars@ug.edu.ec 
https://orcid.org/0000-0002-9423-6174 
,Janeth Pilar Diaz-Vera II
janeth.diazv@ug.edu.ec
https://orcid.org/0000-0001-8750-0216
Alicia Karina Ruiz-Ramirez III
Alicia.ruizram@ug.edu.ec 
https://orcid.org/0000-0002-3038-045X
 

 

 

 

 

 

 

 

 


Correspondencia: [email protected]

 

 

*Recibido: 20 de diciembre de 2021 *Aceptado: 18 de diciembre de 2021 * Publicado: 06 de enero de 2022

 

I.          Master Universitario en Tecnologa Educativa y Competencias Digitales, Ingeniera en Diseo Grfico, Licenciada en Ciencias de la Educacin Mencin Sistemas Multimedia, Diseador Grfico, Docente, Universidad de Guayaquil, Guayaquil, Ecuador.

II.        Magister en Educacin Informtica, Licenciada en Ciencias de la Educacin Especializacin Informtica, Tecnloga Pedaggica en Informtica, Docente, Universidad de Guayaquil, Guayaquil, Ecuador.

III.     Magister en Educacin Informtica, Ingeniera en Sistemas Computacionales, Licenciada en Ciencias de la Educacin Especializacin Educadores de Prvulos, Docente, Universidad de Guayaquil, Guayaquil, Ecuador.


IV.    

Resumen

En el ltimo ao las instituciones educativas se han visto afectadas por la emergencia sanitaria, la educacin se torn netamente virtual, lo cual en muchos casos no ha sido favorecedor para todos los estudiantes. Esta investigacin se realiz con el objetivo de proporcionar una aplicacin de data science que permita realizar una prediccin del rendimiento acadmico de los estudiantes de nivel bsica, con el fin de evaluar la efectividad de los mtodos de enseanza virtual.

El diseo metodolgico se ha desarrollado en la herramienta PMI que consiste en una serie de fases secuenciales en donde permitir la obtencin de un entregable. Por esta razn, el proyecto evala los factores que inciden en el rendimiento acadmico haciendo uso de tcnicas actuales como son la data science y herramientas de machine learning.

Palabras Clave: data science; tecnologa educativa; rendimiento acadmico.

 

Abstract

In the last year educational institutions have been affected by the health emergency, education became purely virtual, which in many cases has not been favorable for all students. This project was carried out with the aim of providing a data science application that allows a prediction of the academic performance of students at the basic level, in order to evaluate the effectiveness of virtual teaching methods.

The methodological design has been developed in the PMI tool that consists of a series of sequential phases where it will allow the obtaining of a deliverable. For this reason, the project evaluates the factors that affect academic performance using current techniques such as data science and machine learning tools.

Keywords: data science; educational technology; academic performance.

 

Resumo

No ltimo ano as instituies de ensino foram afetadas pela emergncia sanitria, a educao tornou-se puramente virtual, o que em muitos casos no tem sido favorvel para todos os alunos. Este projeto foi realizado com o objetivo de fornecer um aplicativo de cincia de dados que permita uma previso do desempenho acadmico de alunos do nvel bsico, a fim de avaliar a eficcia dos mtodos de ensino virtual.

O desenho metodolgico foi desenvolvido na ferramenta PMI que consiste em uma srie de fases sequenciais onde permitir a obteno de um entregvel. Por esse motivo, o projeto avalia os fatores que afetam o desempenho acadmico usando tcnicas atuais, como cincia de dados e ferramentas de aprendizado de mquina.

Palavras-chave: cincia de dados; tecnologia Educacional; performance acadmica.

 

Introduccin

Las clases en lnea hoy en da son un mtodo de enseanza que de manera fortuita la mayora de las instituciones se tuvieron que adaptar, sin embargo, no es algo que ha sido fcil, ya que profesores, autoridades, padres de familia y los propios alumnos han sufrido por varios cambios, uno de los principales, el uso las diferentes herramientas tecnolgicas que lleva como consecuencia el bajo rendimiento de los estudiantes.

El mtodo de aprendizaje es muy distinto, si antes era algo complicado, ahora la situacin es mucho ms difcil, los estudiantes no estn preparados para auto tareas, igual los maestros no capacitados para ser sus guas de aprendizajes, pues la educacin pierde calidad. (Yuquilema, 2020)

Segn (Espinoza, 2020) Cifras estadsticas, muestran que la mayor parte de la poblacin joven en el pas entre nias, nios, y adolescentes son de 6 millones entre 0 a 17 aos, el 33% de los jvenes son de 5 a 11 aos que requieren acompaamiento en el trabajo virtual, de esas cifras el 50% de la poblacin joven se encuentra en la costa, el 33% est en la sierra y el 7 % se ubica en la Amazonia.

La Unidad Educativa Jos Elas Altamirano se mantiene con un equipo de trabajo excelente que da a da buscan el bienestar de los estudiantes, sin embargo, sufre una gran problemtica a consecuencia de contar con un ao lleno de cambios, las bases de aprendizaje de los alumnos no son los ms positivos, las autoridades de la institucin buscan saber cules seran las mejores estrategias para mejorar el rendimiento de los estudiantes.

En la actualidad en nuestro pas no existe un sistema predictivo que logre detectar el rendimiento acadmico de los estudiantes y as tener en cuenta diferentes estrategias de enseanzas que se podran aplicar para obtener mejores resultados.

En la Unidad Educativa Jos Elas Altamirano es muy importante brindar una excelente educacin con sus diferentes mtodos de enseanzas, a pesar de ello, muchos docentes no se han adaptado a esta nueva modalidad y esto se ve reflejado en el rendimiento del ltimo ao lectivo.

Con el objetivo de cumplir sus horas de clases no se tiene un riesgo de usar las herramientas necesarias para brindar un mejor mtodo de enseanza. Esta problemtica se puede solucionar haciendo una comparativa de cmo hay personal que toma un riesgo y mejora su tcnica de estudio viendo como resultado una buena base de conocimiento para su siguiente ao lectivo, teniendo en cuenta los resultados del anlisis en data science.

La modalidad en lnea son un mtodo de enseanza que de manera fortuita la mayora de las instituciones se tuvieron que adaptar, sin embargo, no es algo que ha sido fcil, ya que profesores, autoridades, padres de familia y los propios alumnos han sufrido por varios cambios y ciertas dificultades en el proceso de aprendizaje.

Desarrollo

La tecnologa en el mbito educativo en estos tiempos ha evolucionado de manera significativa, hoy en da se desarrollan diferentes mtodos de enseanza para poder brindar una mejor educacin a los alumnos, sin embargo, una problemtica en el pas es la falta de conocimiento y las herramientas necesarias para poder sacar provecho de lo que se brinda la tecnologa actualmente.

Para el presente proyecto, se centr especficamente en el rendimiento acadmico de los estudiantes de la Unidad Educativa Jos Elas Altamirano ao 2021, ya que se empieza un ao lectivo la cual se tiene una experiencia previa en donde no se obtuvieron los mejores resultados generando que muchos estudiantes no tengan el mejor desempeo acadmico.

Con el fin de conocer las falencias en los mtodos impartidos por los docentes, es importante contar con un sistema de prediccin que se ejecute las primeras semanas del ao lectivo, para realizar un comparativo de las posibles mejoras que los docentes pueden ejecutar y as los alumnos tendran un mejor rendimiento acadmico.

Esta propuesta se plante con el fin de poder brindar una solucin tecnolgica que permita medir el rendimiento acadmico de los estudiantes de la Unidad Educativa Jos Elas Altamirano y predecir si los mtodos de enseanzas utilizados hoy en da son los adecuados tomando en cuenta que en la actualidad el sistema educativo ha optado a una modalidad virtual, dando como resultados inconvenientes en el proceso de aprendizaje.

Para esto se va a llevar a cabo el desarrollo de un aplicativo usando algoritmos que prediga el rendimiento de los estudiantes, tomando como entradas variantes relevantes para el estudio como por ejemplo su entorno familiar, el tiempo que le dedican a los estudios y sus promedios parciales. Basado en estos parmetros podr predecir la calificacin final del estudiante y de esta forma evaluaremos si el mtodo de enseanza aplicado es efectivo.

De acuerdo con lo investigado, se utiliz el algoritmo regresin lineal ya que es el mecanismo ms eficiente para realizar predicciones basadas en la relacin entre dos o ms variables. As mismo, dicho algoritmo fue codificado en el framework Google Colab ya que es una plataforma que no requiere configuracin o instalacin y est diseada especficamente para el anlisis de datos.

Adems, se cre un aplicativo que mostrar el resultado de la prediccin realizada de forma grfica. Dicha aplicacin es amigable al usuario y se puede acceder desde un ordenador o desde un dispositivo mvil, facilitando a los docentes el acceso a la informacin.

La plataforma permite predecir el rendimiento acadmico de los estudiantes segn las notas ingresadas por los docentes, con los resultados obtenidos el docente puede mejorar las tcnicas de enseanzas.

 

Metodologa

Con el fin de lograr el objetivo principal planteado en este proyecto, se determin que la metodologa ms propicia es PMI (Project Management Institute), ya que establece una serie de fases secuenciales por las que atraviesa el proyecto, donde cada fase permitir la consecucin de un objetivo o entregable. Segn indica el (Project Management Institute., 2013) una fase del proyecto es un conjunto de actividades del proyecto, relacionadas de manera lgica, que culmina con la finalizacin de uno o ms entregables.

Las fases del proyecto se utilizan cuando la naturaleza del trabajo a realizar en una parte del proyecto es nica y suelen estar vinculadas al desarrollo de un entregable especfico importante. Aunque no existe una estructura ideal de fases que se puedan aplicar a todos los proyectos, (Project Management Institute., 2013) indica que, para facilitar la planificacin y control del proyecto, se deben establecer los siguientes procesos:

Inicio: Aquellos procesos realizados para definir un nuevo proyecto o nueva fase de un proyecto existente al obtener la autorizacin para iniciar el proyecto o fase.

Planificacin: Aquellos procesos requeridos para establecer el alcance del proyecto, refinar los objetivos y definir el curso de accin requerido para alcanzar los objetivos propuestos del proyecto.

Ejecucin: Aquellos procesos realizados para completar el trabajo definido en el plan para la direccin del proyecto a fin de satisfacer las especificaciones del mismo.

Monitoreo y Control: Aquellos procesos requeridos para rastrear, revisar y regular el progreso y el desempeo del proyecto, para identificar reas en las que el plan requiera cambios y para iniciar los cambios correspondientes.

Cierre: Aquellos procesos realizados para finalizar todas las actividades a travs de todos los Grupos de Procesos, a fin de cerrar formalmente el proyecto o una fase del mismo.

 

Etapas de la metodologa del proyecto 

En el presente proyecto se utiliz la metodologa PMI, dicha metodologa define el ciclo de vida de un proyecto como la serie de fases que un proyecto pasa desde su inicio hasta su cierre. La estructuracin en fases proporciona una base formal para el control. Cada fase se inicia formalmente con la especificacin de lo que se permite y se espera de la misma. (Garca, 2016)

En el siguiente grfico se detalla la interaccin de las fases del proyecto establecidas por la metodologa PMI.

 

Grfico 1 Metodologa PMI

Fuente: (Garca, 2016)

 

 

Inicio

Se estableci el contexto del problema a investigar, su alcance y los recursos que sern utilizados para su ejecucin. As mismo, se obtuvo la autorizacin de la directora de la unidad educativa Jos Elas Altamirano Lcda. Jenny Herrera Gmez para llevar a cabo el desarrollo del presente proyecto dentro del plantel educativo.

 

Planificacin

En esta fase definimos las actividades necesarias para ejecutar el proyecto y lograr los objetivos planteados. Se define una lista ordenada de todo lo que se realizar durante el proyecto, es decir, enumerar todas las caractersticas, funcionalidades, requisitos, mejoras y correcciones del proyecto para entregas futuras. Por lo que se fijar un cronograma con dichas actividades y su tiempo de duracin, el cual se presenta en el anexo X.

 

Las actividades que se realizarn son:

  • Investigacin bibliogrfica y levantamiento de informacin, con el objetivo de definir la base terica sobre la cual est sustentado el presente proyecto.

         Recoleccin de datos para determinar las variantes relevantes para el estudio de la prediccin del rendimiento acadmico. 

         Realizacin de encuestas al personal docente implicados en el proceso, estudio y anlisis de los datos obtenidos.

         Programacin del algoritmo de machine learning utilizado para prediccin de datos.

         Diseo y desarrollo del aplicativo web para visualizacin de la prediccin obtenida.

         Pruebas de funcionamiento del aplicativo.

         Elaboracin de manual de usuario.

 

Ejecucin

Se llevan a cabo las actividades definidas en la fase anterior para realizar el diseo del proyecto. El diseo propuesto consiste en una aplicacin web diseada en Flask, la cual muestra el resultado del algoritmo de regresin lineal elaborado en Python mediante una arquitectura REST desarrollada en Angular y Node Js. En el siguiente grfico se detalla el diseo de la aplicacin:

Grfico 2 Diseo de la aplicacin

Fuente: Trabajo de Investigacin

 

 

El data set utilizado est constituido por una matriz csv que contiene las variables a estudiar para realizar la prediccin, el cual ser entrenado posteriormente mediante el algoritmo de regresin lineal, como se visualiza en la siguiente figura.

 

Grfico 3 Carga del dataframe

Fuente: Google Colab

 

 

A continuacin, se realiza la particin del nuevo dataframe para el entrenamiento y validacin de datos.

Grfico 4 Particin del dataframe

 

 

 

 

 

 

 

 

Fuente: Google Colab

Posteriormente se realiza el entrenamiento de los datos mediante el modelo de regresin lineal.

 

Grfico 5 Aplicacin del modelo Regresin Lineal

Fuente: Google Colab

 

 

Luego de haberse realizado este procedimiento, se muestra el dataframe de los resultados del modelo de machine learning y una grfica para facilitar la interpretacin de los valores obtenidos.

 

Grfico 6 Dataframe de prediccin

Fuente: Google Colab

 

 

Monitoreo y control

Luego de realizar el diseo de la aplicacin, se verifica el correcto funcionamiento del algoritmo propuesto, as como tambin la correcta visualizacin de los datos en la plataforma web. Durante esta fase se explic tambin el uso al personal docente de la Unidad Educativa Jos Elas Altamirano.

 

 

 

 

Grfico 7 Visualizacin de datos obtenidos en la prediccin

Fuente: Google Colab

 

 

Grfico 9 Visualizacin de datos en la plataforma web

Fuente: Framework Flask

 

Grfico 10 Visualizacin de datos en la plataforma web

Fuente: Framework Flask

 

 

Grfico 11 Visualizacin de datos en la plataforma web

Elaborado por : Mirna Moreno Herrera, Melanie Reyes Maldonado (2021)

Fuente: Framework Flask

 

 

Tabla 1 Criterios de validacin

CRITERIOS DE VALIDACIN DE LA PROPUESTA

PROYECTO: DISEO DE UNA APLICACIN DE DATA SCIENCE PARA LA PREDICCION DEL RENDIMIENTO ACADMICO DE LOS ESTUDIANTES DE LA UNIDAD EDUCATIVA JOSE ELAS ALTAMIRANO, AO 2021

DESCRIPCION

TA

DE

I

ED

TD

La aplicacin es amigable con el usuario y fcil de utilizar.

X

 

 

 

 

La aplicacin es confiable en la prediccin del rendimiento acadmico

X

 

 

 

 

El software presentado cumple con las funciones previamente establecidas.

X

 

 

 

 

El diseo propuesto cumple con los objetivos propuestos.

X

 

 

 

 

Fuente: Trabajo de Investigacin

 

 

Criterios de aceptacin del producto o servicio

Luego de haber finalizado la etapa de ejecucin del proyecto planteado, se realizaron pruebas de funcionamiento con el fin de verificar el correcto funcionamiento de la aplicacin y as mismo el cumplimiento de los objetivos propuestos en el presente trabajo investigativo. Mediante la realizacin de dichas pruebas, se verific que el producto cumple con los requerimientos establecidos y que la aplicacin web permite una correcta visualizacin de las predicciones realizadas mediante el algoritmo de machine learning, as mismo se demostr que la aplicacin web cuenta con una interfaz amigable e intuitiva que ser de gran utilidad para el personal docente de la Unidad Educativa Jos Elas Altamirano.

A travs de las encuestas realizadas, se evidenci la viabilidad de uso de la aplicacin de data science ya que el 58% de los docentes consideran que mediante el uso de un anlisis predictivo del rendimiento de sus estudiantes se puede fortalecer la metodologa de enseanza.

A continuacin, se muestra los criterios cumplidos mediante la realizacin del presente proyecto:

 

Tabla 2 Criterios de aceptacin del producto

Requerimiento

Porcentaje de Cumplimiento

Ingreso a la aplicacin web mediante un navegador.

100%

Prediccin de notas acadmicas de los estudiantes.

100%

Visualizacin de la prediccin realizada mediante ML

100%

Interfaz web intuitiva y amigable.

100%

Fuente: Datos obtenidos de encuesta

Conclusiones

Una de las ventajas del uso de data science es que al ser una disciplina que incluye tcnicas para el tratamiento y modelamiento de los datos, permite utilizar grandes cantidades de informacin para realizar anlisis o predicciones, como se demostr en el presente trabajo, lo cual resulta de gran utilidad para la creacin de modelos predictivos que puedan ser utilizados con fines educativos.

Existen diversos modelos de machine learning utilizados en data science, por lo que es importante tomar en cuenta los criterios necesarios como la calidad de datos que se analizarn, al momento de elegir el modelo de ML que pueda brindar un resultado correcto, de forma clara y comprensible al usuario.

En funcin de la pregunta cientfica a contestarse mediante el presente proyecto: Es posible que mediante el uso de data science se logre predecir el rendimiento acadmico de los estudiantes de la Unidad Educativa Jose Elas Altamirano, para as identificar y comprender los problemas acadmicos de forma temprana y tomar medidas correctivas que beneficien a la comunidad educativa? se logr validarla mediante el modelo de data science propuesto, ya que se evidencia la correcta prediccin de las notas de los estudiantes y con esta informacin se pueden detectar las falencias en los mtodos de enseanza.

 

Referencias

  1. Alpaydin, E. (2020). Introduction to Machine Learning (4th ed.). MIT Press. https://books.google.com.ec/books?hl=es&lr=&id=tZnSDwAAQBAJ&oi=fnd&pg=PR7&ots=F3TUc-6oxc&sig=JzmrZtSgJTGO5A0ogcfX4x-Co2A&redir_esc=y#v=onepage&q&f=false
  2. Cdigo Orgnico Integral Penal. (2014). CODIGO ORGANICO INTEGRAL PENAL.
  3. Constitucin de la Repblica del Ecuador. (2008). Constitucin del Ecuador.
  4. Garca, L. A. (2016). Gestin de proyectos segn el PMI. Ingeniera Tcnica de Informtica de Gestin.
  5. Gutirrez, J. J. (2018). Qu es un framework web?
  6. Heredia-Mayorga, H. (2020). Big data en la educacin. Horizontes. Revista de Investigacin En Ciencias de La Educacin, 4(16), 523535. https://doi.org/10.33996/REVISTAHORIZONTES.V4I16.134
  7. Holgun, C., Daz-Ricardo, Y., & Antonio Becerra-Garca, R. (2014). Ciencias Holgun, Revista trimestral, Ao XX, abril-junio 2014 El lenguaje de programacin Python/The programming language Python Ivet Challenger-Prez. http://www.linuxjournal.com/article/2959
  8. Mora, J. P. (2016). Que es la Ciencia de Datos, el aprendizaje automtico (ML), el Big Data y cuales son sus usos?
  9. Mueller, J. P., & Massaron, L. (2016). Machine Learning for dummies (I. John Wiley & Sons (ed.)).
  10. Naqa, I. El, & Murphy, M. J. (2015). What Is Machine Learning? Machine Learning in Radiation Oncology, 311. https://doi.org/10.1007/978-3-319-18305-3_1
  11. Oracle Enterprise. (2015, April). Improving Higher Education Performance with Big Data. https://silo.tips/download/improving-higher-education-performance-with-big-data
  12. Project Management Institute. (2013). Fundamentos para la Direccin de Proyectos (Gua del PMBOK) (Quinta Edi).
  13. Reglamento para la Adquisicin de Software por parte de las entidades contratantes del Sector Pblico. (2017). Reglamento para la Adquisicin de Software por parte de las entidades contratantes del Sector Pblico.
  14. Sosa, M., & Herrera, S. I. (2015). La informtica como disciplina cientfica. Ensayo de mapeo disciplinar. https://www.researchgate.net/publication/264868897
  15. Universitat Politcnica de Catalunya. (2021, March 21). Qu es un Data Scientist? | inLab FIB. https://inlab.fib.upc.edu/es/blog/que-es-un-data-scientist
  16. Utilizacin de Software Libre en la Administracin Pblica. (2011). Utilizacin de Software Libre en la Administracin Pblica.

 

 

 

 

2022 por los autores. Este artculo es de acceso abierto y distribuido segn los trminos y condiciones de la licencia Creative Commons Atribucin-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) (https://creativecommons.org/licenses/by-nc-sa/4.0/).

Métricas del Artículos

Cargando Métricas.....

Metrics powered by MI WEB PRO

Enlaces de Referencia

  • Por el momento, no existen enlaces de referencia


Copyright (c) 2022 Zoila Jessenia Fabara-Sarmiento, Janeth Pilar Diaz-Vera, Alicia Karina Ruiz-Ramirez

URL de la Licencia: https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es

Polo de Capacitación, Investigación y Publicación (POCAIP)

Dirección: Ciudadela El Palmar, II Etapa,  Manta - Manabí - Ecuador.

Código Postal: 130801

Teléfonos: 056051775/0991871420

Email: [email protected]

URL: https://www.dominiodelasciencias.com/

DOI: https://doi.org/10.23857/pocaip