Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.12104/110394
Title: Aplicación de Bosques de Supervivencia Aleatorios a la Predicción de Abandono Universitario
Author: Hernández Chavez, Gisel
metadata.dc.contributor.director: López Martín, Cuauhtémoc
Advisor/Thesis Advisor: Gutiérrez Pulido, Humberto
Meda Campaña, María Elena
Valdéz Dávila, Ma. Guadalupe
Sánchez García, Jesús Eladio
Keywords: Bosques De Supervivencia;Abandono Universitario
Issue Date: 19-Mar-2025
Publisher: Biblioteca Digital wdg.biblio
Universidad de Guadalajara
Abstract: El abandono universitario a nivel mundial alcanza niveles superiores al 30%. Este problema implica pérdidas económicas para las familias, las instituciones y las naciones, así como menores oportunidades de empleo, entre otras consecuencias negativas. Como parte de la solución para su mitigación, las universidades deben detectar los factores de abandono y realizar predicciones tempranas de los alumnos en riesgo. Esta investigación contribuye con esas soluciones demostrando, a través de un estudio de caso, que en el abandono influyen variables asociadas al alumno, a la familia y al sistema educativo y que un modelo de aprendizaje automático puede superar en precisión a los modelos estadísticos. Apliqué una metodología de minería de datos y métodos de análisis de supervivencia utilizando información de 12 930 alumnos de una universidad privada mexicana, que ingresaron entre el 2006 y el 2014, con seguimiento de 12 semestres. Los datos provinieron de los sistemas administrativos de la universidad y de datos abiertos de gobierno. Realicé estimaciones con modelos de Kaplan Meier y Nelson Aalen y pruebas de rango logarítmico, encontrando que los perfiles con más riesgo son los de alumnos que: son de sexo masculino; ingresan con 21 años o más; estudian ingeniería o administración; hacen examen de ingreso por no tener alto promedio y no provenir de preparatorias exentas de ello; tienen promedio de preparatoria menor a 80; no tienen becas o créditos e ingresan en primavera. En cuanto a las preparatorias de procedencia, tienen más riesgo las localizadas fuera de la zona metropolitana, las que obtienen bajos resultados en pruebas nacionales y las que tienen mayor promedio histórico de exalumnos que han abandonado la universidad estudiada. Empleé modelos de Cox tradicionales y regularizados, así como Bosques de Supervivencia Aleatorios, demostrando que con los últimos se pueden obtener predicciones más precisas en cuanto al índice de concordancia c (0.704) y mejores calibraciones con puntuación integrada de Brier (0.133). Sin embargo, aunque el Área Bajo la Curva (AUC) dependiente del tiempo promedio también fue el mejor, entre los semestres 3 y 11 fue superado por un modelo de Cox; resaltando la importancia de la utilización de varias métricas para la selección de modelos. Las variables que resultaron importantes, los modelos construidos y la metodología seguida pueden facilitar esfuerzos posteriores, sobre todo de universidades privadas mexicanas con semejante estructura y población y guiar los esfuerzos de la institución estudiada para mejorar la retención.
URI: https://wdg.biblio.udg.mx
https://hdl.handle.net/20.500.12104/110394
metadata.dc.degree.name: DOCTORADO EN TECNOLOGIAS DE INFORMACION
Appears in Collections:CUCEA

Files in This Item:
File SizeFormat 
DCUCEA10193FT.pdf6.3 MBAdobe PDFView/Open


Items in RIUdeG are protected by copyright, with all rights reserved, unless otherwise indicated.