Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12104/110394
Título: Aplicación de Bosques de Supervivencia Aleatorios a la Predicción de Abandono Universitario
Autor: Hernández Chavez, Gisel
Director: López Martín, Cuauhtémoc
Asesor: Gutiérrez Pulido, Humberto
Meda Campaña, María Elena
Valdéz Dávila, Ma. Guadalupe
Sánchez García, Jesús Eladio
Palabras clave: Bosques De Supervivencia;Abandono Universitario
Fecha de titulación: 19-mar-2025
Editorial: Biblioteca Digital wdg.biblio
Universidad de Guadalajara
Resumen: El abandono universitario a nivel mundial alcanza niveles superiores al 30%. Este problema implica pérdidas económicas para las familias, las instituciones y las naciones, así como menores oportunidades de empleo, entre otras consecuencias negativas. Como parte de la solución para su mitigación, las universidades deben detectar los factores de abandono y realizar predicciones tempranas de los alumnos en riesgo. Esta investigación contribuye con esas soluciones demostrando, a través de un estudio de caso, que en el abandono influyen variables asociadas al alumno, a la familia y al sistema educativo y que un modelo de aprendizaje automático puede superar en precisión a los modelos estadísticos. Apliqué una metodología de minería de datos y métodos de análisis de supervivencia utilizando información de 12 930 alumnos de una universidad privada mexicana, que ingresaron entre el 2006 y el 2014, con seguimiento de 12 semestres. Los datos provinieron de los sistemas administrativos de la universidad y de datos abiertos de gobierno. Realicé estimaciones con modelos de Kaplan Meier y Nelson Aalen y pruebas de rango logarítmico, encontrando que los perfiles con más riesgo son los de alumnos que: son de sexo masculino; ingresan con 21 años o más; estudian ingeniería o administración; hacen examen de ingreso por no tener alto promedio y no provenir de preparatorias exentas de ello; tienen promedio de preparatoria menor a 80; no tienen becas o créditos e ingresan en primavera. En cuanto a las preparatorias de procedencia, tienen más riesgo las localizadas fuera de la zona metropolitana, las que obtienen bajos resultados en pruebas nacionales y las que tienen mayor promedio histórico de exalumnos que han abandonado la universidad estudiada. Empleé modelos de Cox tradicionales y regularizados, así como Bosques de Supervivencia Aleatorios, demostrando que con los últimos se pueden obtener predicciones más precisas en cuanto al índice de concordancia c (0.704) y mejores calibraciones con puntuación integrada de Brier (0.133). Sin embargo, aunque el Área Bajo la Curva (AUC) dependiente del tiempo promedio también fue el mejor, entre los semestres 3 y 11 fue superado por un modelo de Cox; resaltando la importancia de la utilización de varias métricas para la selección de modelos. Las variables que resultaron importantes, los modelos construidos y la metodología seguida pueden facilitar esfuerzos posteriores, sobre todo de universidades privadas mexicanas con semejante estructura y población y guiar los esfuerzos de la institución estudiada para mejorar la retención.
URI: https://wdg.biblio.udg.mx
https://hdl.handle.net/20.500.12104/110394
Programa educativo: DOCTORADO EN TECNOLOGIAS DE INFORMACION
Aparece en las colecciones:CUCEA

Ficheros en este ítem:
Fichero TamañoFormato 
DCUCEA10193FT.pdf6.3 MBAdobe PDFVisualizar/Abrir


Los ítems de RIUdeG están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.