نبذة مختصرة : En esta investigación de trabajo de grado de pregrado se recolectaron registros de datos socioeconómicos, personales y de percepción académica de estudiantes activos de la facultad de ingeniería de la Universidad Cooperativa de Colombia sede Villavicencio, los cuales por medio de un proceso de limpieza y análisis exploratorio se adecuaron con el objetivo de entrenar modelos computacionales de Random Forest para determinar la probabilidad de que un estudiante abandone sus estudios académicos. En este documento en primer lugar se realiza una descripción sobre lo que es la deserción basada en datos y estudios nacionales como internacionales y se contextualiza la problemática en Colombia, posteriormente se explican los conceptos que se usaran en esta investigación tales como machine learning, data mining, modelos computacionales, métricas de evaluación, entre otros. Luego se detalla el procedimiento del trabajo que se realizó en la recolección de más de 800 registros de estudiantes por medio de una serie de encuestas realizadas en los periodos académicos 2023-10 y 2023-20, con más de 45 preguntas, donde se tomó una muestra de 483 estudiantes que pertenecen a la facultad de ingeniería la cual está conformada por ingeniería de sistemas e ingeniería civil. Estos 2 datasets fueron sometidos a un análisis descriptivo con el fin de unificarlos en uno solo, en donde se aplicaron métodos de limpieza y estadísticos para ordenar la información de forma óptima para el entrenamiento de los modelos. La parte final del trabajo se concentra en el entrenamiento de modelos computacionales basados en el Algoritmo Random Forest, el cual es implementado mediante el uso de la librería sklearn.ensemble.RandomForestClassifier de Python y la metodología de búsqueda amplia GridsearchCv mediante la librería sklearn.model_selection.GridSearchCV para optimización de parámetros. Bajo este dataset se determina una configuración óptima de parámetros que entrega un 46.4 % de la métrica de desempeño. ; In this undergraduate work research, records ...
Relation: [1] A. M. Mariano, A. B. De Magalhães Lelis Ferreira, M. R. Santos, M. L. Castilho, and A. C. F. L. C. Bastos, “Decision trees for predicting dropout in Engineering Course students in Brazil,” in Procedia Computer Science, Elsevier B.V., 2022, pp. 1113–1120. doi:10.1016/j.procs.2022.11.285.; [2] María Camila Jiménez, “Abandono universitario tarea en la que Iberoamérica se sigue rajando.” Accessed: Apr. 17, 2024. [Online]. Available: https://periodico.unal.edu.co/articulos/abandono-universitario-tarea-en-la-que-iberoamerica-se-sigue-rajando; [3] A. Gonzalez-Nucamendi, J. Noguez, L. Neri, V. Robledo-Rella, and R. M. G. García-Castelán, “Predictive analytics study to determine undergraduate students at risk of dropout,” Front Educ (Lausanne), vol. 8, 2023, doi:10.3389/feduc.2023.1244686.; [4] E. Ministerio, “Estadísticas de deserción estudiantil, permanencia y graduación en educación superior Universitario Tecnológico Técnico profesional,” 2017. [Online]. Available: https://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles-; [5] E. Chinkes, “Pronósticos y data mining para la toma de decisiones. Pronóstico sobre la deserción de alumnos de una facultad,” 2018.; [6] J. Mesarić and D. Šebalj, “Decision trees for predicting the academic success of students,” Croatian Operational Research Review, vol. 367, pp. 367–388, 2016, doi:10.17535/crorr.2016.0025.; [7] Ministerio de Educación Nacional, “Ministerio de Educación Nacional Subdirección de Desarrollo Sectorial,” 2013. [Online]. Available: www.mineducacion.gov.co; [8] Caracol Radio, “Más de 39.000 estudiantes abandonaron la universidad en Colombia.” Accessed: Mar. 18, 2023. [Online]. Available: https://caracol.com.co/programa/2021/11/04/sanamente/1636049871_761122.html; [9] Sistema para la Prevención de la Deserción de la Educación Superior, “Estadísticas de Deserción - Sistemas información.” Accessed: Mar. 18, 2023. [Online]. Available: https://www.mineducacion.gov.co/sistemasinfo/spadies/Informacion-Institucional/357549:Estadisticas-de-Desercion; [10] E. Barreno-Vereau, “Análisis Comparativo de modelos de clasificación en el estudio de la deserción universitaria,” Interfases, vol. 0, no. 005, p. 45, Feb. 2012, doi:10.26439/Interfases2012.N005.149.; [11] D. Santín González, “Detección de alumnos de riesgo y medición de la eficiencia de centros escolares mediante redes neuronales,” 1999. [Online]. Available: http://www.ucm.es/BUCM/cee/doc/9902/9902.htmm; [12] H. Felizzola Jiménez, Y. Adriana, J. Arias, A. María, C. Pastrana, and F. Villa Pedroza, “Modelo de predicción para la deserción temprana en la facultad de Ingeniería de la Universidad de la Salle,” 2018.; [13] K. R. Vergaray, “Modelo predictivo para la detección temprana de estudiantes con alto riesgo de deserción académica,” Innovación y Software, vol. 2, no. 2, pp. 6–13, Sep. 2021, Accessed: Feb. 25, 2023. [Online]. Available: https://revistas.ulasalle.edu.pe/innosoft/article/view/40; [14] R. I. Castro López, “Aplicación de técnicas de Machine Learning para el estudio de deserción temprana y egreso oportuno en estudiantes de ingeniería de la facultad de ciencias físicas y matemáticas.” Accessed: Feb. 25, 2023. [Online]. Available: https://repositorio.uchile.cl/bitstream/handle/2250/178598/Aplicacion-de-tecnicas-de-Machine-Learning-para-el-estudio-de-desercion-temprana-y-egreso-oportuno-en-estudiantes-de-Ingenieria-de-la-Facultad-de-Ciencias%20Fisicas-y-Matematicas.pdf?sequence=1&isAllowed=y; [15] A. Jose and C. Garcia, “Modelo para la predicción de la deserción de estudiantes de pregrado, basado en técnicas de minería de datos,” pp. 1–121, 2020.; [16] H. Y. Ayala Yaguara, M. Valenzuela Sabogal, and A. Espinosa García, “Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca.” Accessed: Feb. 25, 2023. [Online]. Available: https://journal.universidadean.edu.co/index.php/Revistao/article/view/2676/2087; [17] V. De La Cruz, “Diseño de un modelo predictivo basado en Machine Learning para el control de la deserción de estudiantes en la Universidad Ricardo Palma,” 2019.; [18] M. L. Avila Pérez, “Modelo De Predicción De Deserción Estudiantil, Apoyado En Tecnologías De Data Mining, En Un Curso De Primera Matrícula De La Escuela ECBTI De La UNAD,” pp. 1–151, 2021.; [19] J. D. T. D. F. T. Diofanor Acevedo, “Análisis de la Deserción Estudiantil en el Programa Ingeniería de Alimentos de la Universidad de Cartagena durante el Periodo Académico 2009 - 2013,” Cartagena, 2015.; [20] Antonio Berlanga, “El camino desde la Inteligencia Artificial al Big Data.”; [21] “Minería de datos: Qué es y por qué es importante %7C SAS.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.sas.com/es_co/insights/analytics/data-mining.html; [22] D. S. G. César Pérez López, Minería de datos. Técnicas y herramientas, vol. 1. 2007.; [23] E. M. Rojas, “Machine Learning: análisis de lenguajes de programación y herramientas para desarrollo,” 2020.; [24] “‘Machine Learning’: definición, tipos y aplicaciones prácticas - Iberdrola.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.iberdrola.com/innovacion/machine-learning-aprendizaje-automatico; [25] Wiley, Fundamentals and Methods of Machine and Deep Learning, Algorithms, Tools, and Applications. 2022.; [26] Sandra Navarro, “KeepCoding Bootcamps.” Accessed: May 12, 2024. [Online]. Available: https://keepcoding.io/blog/que-es-gridsearchcv/; [27] “sklearn.model_selection.GridSearchCV — scikit-learn 1.4.2 documentation.” Accessed: May 19, 2024. [Online]. Available: https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html; [28] J. Carlos González Sánchez and M. Javier Peñaloza Pérez, “Identificación y predicción de estudiantes en riesgo de deserción académica por medio de modelos basados en machine learning.,” 2021.; [29] “Conceptos básicos de ayuda de CRISP-DM - Documentación de IBM.” Accessed: Feb. 08, 2024. [Online]. Available: https://www.ibm.com/docs/es/spss-modeler/saas?topic=dm-crisp-help-overview; [30] IBM, “¿Qué es un bosque aleatorio? %7C IBM.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.ibm.com/mx-es/topics/random-forest; [31] “sklearn.ensemble.RandomForestClassifier — scikit-learn 1.4.2 documentation.” Accessed: May 18, 2024. [Online]. Available: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html; [32] L. G. Díaz Monroy and M. A. Morales Rivera, Análisis estadístico de datos categóricos. Universidad Nacional de Colombia, Facultrad de Ciencias, Departamento de Estadística, 2009.; [33] “Prueba de ji cuadrado de bondad de ajuste %7C Introducción a la estadística %7C JMP.” Accessed: May 04, 2024. [Online]. Available: https://www.jmp.com/es_co/statistics-knowledge-portal/chi-square-test/chi-square-goodness-of-fit-test.html; [34] “La matriz de confusión y sus métricas – Inteligencia Artificial –.” Accessed: Feb. 07, 2024. [Online]. Available: https://www.juanbarrios.com/la-matriz-de-confusion-y-sus-metricas/; Galvis Martínez, M. (2024). Modelamiento de la deserción universitaria en la Universidad Cooperativa de Colombia sede Villavicencio mediante algoritmos de Machine Learning [Tesis de pregrado, Universidad Cooperativa de Colombia]. Repositorio Institucional Universidad Cooperativa de Colombia. https://hdl.handle.net/20.500.12494/56199; https://hdl.handle.net/20.500.12494/56199
No Comments.