Please use this identifier to cite or link to this item:
https://hdl.handle.net/20.500.12104/110394| Title: | Aplicación de Bosques de Supervivencia Aleatorios a la Predicción de Abandono Universitario |
| Author: | Hernández Chavez, Gisel |
| metadata.dc.contributor.director: | López Martín, Cuauhtémoc |
| Advisor/Thesis Advisor: | Gutiérrez Pulido, Humberto Meda Campaña, María Elena Valdéz Dávila, Ma. Guadalupe Sánchez García, Jesús Eladio |
| Keywords: | Bosques De Supervivencia;Abandono Universitario |
| Issue Date: | 19-Mar-2025 |
| Publisher: | Biblioteca Digital wdg.biblio Universidad de Guadalajara |
| Abstract: | El abandono universitario a nivel mundial alcanza niveles superiores al 30%. Este problema implica pérdidas económicas para las familias, las instituciones y las naciones, así como menores oportunidades de empleo, entre otras consecuencias negativas. Como parte de la solución para su mitigación, las universidades deben detectar los factores de abandono y realizar predicciones tempranas de los alumnos en riesgo. Esta investigación contribuye con esas soluciones demostrando, a través de un estudio de caso, que en el abandono influyen variables asociadas al alumno, a la familia y al sistema educativo y que un modelo de aprendizaje automático puede superar en precisión a los modelos estadísticos. Apliqué una metodología de minería de datos y métodos de análisis de supervivencia utilizando información de 12 930 alumnos de una universidad privada mexicana, que ingresaron entre el 2006 y el 2014, con seguimiento de 12 semestres. Los datos provinieron de los sistemas administrativos de la universidad y de datos abiertos de gobierno. Realicé estimaciones con modelos de Kaplan Meier y Nelson Aalen y pruebas de rango logarítmico, encontrando que los perfiles con más riesgo son los de alumnos que: son de sexo masculino; ingresan con 21 años o más; estudian ingeniería o administración; hacen examen de ingreso por no tener alto promedio y no provenir de preparatorias exentas de ello; tienen promedio de preparatoria menor a 80; no tienen becas o créditos e ingresan en primavera. En cuanto a las preparatorias de procedencia, tienen más riesgo las localizadas fuera de la zona metropolitana, las que obtienen bajos resultados en pruebas nacionales y las que tienen mayor promedio histórico de exalumnos que han abandonado la universidad estudiada. Empleé modelos de Cox tradicionales y regularizados, así como Bosques de Supervivencia Aleatorios, demostrando que con los últimos se pueden obtener predicciones más precisas en cuanto al índice de concordancia c (0.704) y mejores calibraciones con puntuación integrada de Brier (0.133). Sin embargo, aunque el Área Bajo la Curva (AUC) dependiente del tiempo promedio también fue el mejor, entre los semestres 3 y 11 fue superado por un modelo de Cox; resaltando la importancia de la utilización de varias métricas para la selección de modelos. Las variables que resultaron importantes, los modelos construidos y la metodología seguida pueden facilitar esfuerzos posteriores, sobre todo de universidades privadas mexicanas con semejante estructura y población y guiar los esfuerzos de la institución estudiada para mejorar la retención. |
| URI: | https://wdg.biblio.udg.mx https://hdl.handle.net/20.500.12104/110394 |
| metadata.dc.degree.name: | DOCTORADO EN TECNOLOGIAS DE INFORMACION |
| Appears in Collections: | CUCEA |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| DCUCEA10193FT.pdf | 6.3 MB | Adobe PDF | View/Open |
Items in RIUdeG are protected by copyright, with all rights reserved, unless otherwise indicated.