Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12104/98006
Título: Multiple Near Optimal Solution through Seeded Genetic Programming for Predicting Software Enhancement Effort
Autor: Belmont Polanco, Felipe De Jesús
Director: López Martín, Cuauhtémoc
Asesor: Barbosa Santillán, Liliana Ibeth
Meda Campaña, María Elena
Sánchez García, Ángel Juan
Palabras clave: Seeded Genetic Programming;Predicting Software
Fecha de titulación: 12-ene-2024
Editorial: Biblioteca Digital wdg.biblio
Universidad de Guadalajara
Resumen: Resumen: En el campo de la ingeniería del software, la Administración de la Ingeniería del Software involucra la Planificación del Software (SP). Las variables que comúnmente se predicen en la SP son el tamaño, el esfuerzo, los defectos y los riesgos del proyecto de software a desarrollar. Los tipos de desarrollo de software pueden ser ya sea nuevos o de mejora. La presente tesis está relacionada con la predicción del esfuerzo (es decir, la cantidad de horaspersona) necesario para el proyecto de mejora del software. Tanto la predicción insuficiente, como la predicción excesiva afectan el SP, por lo tanto, se necesita una predicción precisa para los administradores de software de tal manera que permita una estimación adecuada del presupuesto. Por lo tanto, esta tesis propone la aplicación de un nuevo modelo denominado Múltiples Soluciones Casi Óptimas mediante la Siembra en la Programación Genética (Multiple Near Optimal Solution through Seeded Genetic Programming, MUNOS-SGP) para predecir el esfuerzo de mejora del software. Se utilizarón nueve conjuntos de datos seleccionados de un repositorio público internacional de proyectos de software (ISBSG) para entrenar y probar el MUNOS-SGP. Los criterios de selección se basaron en la clasificación de la calidad de los datos, el tipo de plataforma de desarrollo, la generación del lenguaje de programación, el nivel de recursos (es decir, cómo se cuantificó el esfuerzo), el tipo de desarrollo y el método de dimensionamiento (tamaño) funcional. El preprocesamiento de datos también se basó en la identificación de valores inusuales, así como en el cálculo de coeficientes de correlación y de determinación. Página. 2 Debido al hecho de que el rendimiento de cualquier nuevo modelo de predicción debería al menos superar al modelo estadístico de regresión lineal (LRM), la precisión de la predicción del MUNOS-SGP se comparó con la obtenida del LRM. Además, se comparó el rendimiento de MUNOS-SGP con las variantes de GP de Koza y Poli. En todos los modelos se aplicó el método de validación cruzada de dejando uno fuera. La medida de la precisión de la predicción que se usó fueron los residuales absolutos y se realizó un análisis de significancia estadística para comparar la precisión de la predicción entre los modelos. Este trabajo presenta el uso de la Programación Genética (GP), la cual es una técnica de aprendizaje automático que se ha aplicado a la Ingeniería de Software, sin embargo, ésta no se ha utilizado para predecir el esfuerzo de mejora del software. Después de realizar las pruebas estadísticas adecuadas para comparar la precisión de predicción de los modelos, el MUNOS-SGP fue estadísticamente mejor que MRE al 99% de confianza en los nueve conjuntos de datos de los proyectos de software. El MUNOS-SGP fue estadísticamente mejor que Poli-GP con un 95 % de confianza en los nueve conjuntos de datos. Finalmente, MUNOS-SGP fue estadísticamente mejor que Koza-GP con un 99 % de confianza en siete conjuntos de datos de los proyectos de software, y estadísticamente igual en los dos conjuntos de datos restantes. MUNOS-SGP puede ser utilizado para predecir el esfuerzo de mejora de los proyectos de software desarrollados en mainframes y codificados en lenguajes de programación de tercera generación (3GL), además en gama media y codificados en 3GL, en multiplataforma y codificados tanto en 3GL como en 4GL, así como en computadoras personales y codificados en 3GL. Abstract: In the Software Engineering field, the Software Engineering Management involves Software Planning (SP). The variables commonly predicted into the SP are size, effort, defects, and risks of the software project to be developed. The types of software development can be either new or enhancement. The present thesis is related to the effort (i.e., the number of person-hours) prediction needed for a software enhancement project. Both under-prediction and over-prediction affect the SP, thus, an accurate prediction is needed for software managers such that a suitable budget is estimated. Thus this thesis introduces the application of a new model termed Multiple Near Optimal Solution through Seeded Genetic Programming (MUNOS-SGP) for predicting software enhancement effort. Nine data sets selected from an international public repository of software projects (i.e., ISBSG) were used, to train and test the MUNOS-SGP. The selection criteria were based on data quality rating, development platform type, programming language type, resource level (i.e., how the effort was quantified), type of development, and functional sizing method. The data preprocessing was also based on identification of outliers, as well as on coefficients of correlation and determination. Due to the fact that the performance of any new prediction model should at least outperform to statistical linear regression model (LRM), The prediction accuracy of the MUNOS-SGP were compared to that obtained from LRM. In addition, The MUNOS-SGP performance was compared to Koza-GP and Poli-GP variants. All the models were applied through a leave-one-out cross validation method. The prediction accuracy measure was absolute residuals, and a statistical significance analysis was performed to compare the prediction accuracy among models. Página. 4 This work presents the use of Genetic Programming (GP), which is a machine learning technique which has has been applied to Software Engineering, however, it has not been used for predicting software enhancement effort. After performing the suitable statistical tests to compare the prediction accuracy of the models, the MUNOS-SGP was statistically better than SRM at the 99% of confidence in the nine data sets of software projects. The MUNOS-SGP was statistically better than Poli-GP at the 95% of confidence in the nine data sets. Finally, the MUNOS-SGP was statistically better than Koza-GP at the 99% of confidence in the seven data sets of software projects, and statistically equal in the resting two data sets. MUNOS-SGP can be used to predict the enhancement effort of software projects developed in mainframes and coded in third generation programming languages (3GL), in mid-range and coded in 3GL, in multiplatform and coded in both 3GL and 4GL, as well as in personal computers and coded in 3GL.
URI: https://wdg.biblio.udg.mx
https://hdl.handle.net/20.500.12104/98006
Programa educativo: DOCTORADO EN TECNOLOGIAS DE INFORMACION
Aparece en las colecciones:CUCEA

Ficheros en este ítem:
Fichero TamañoFormato 
DCUCEA10140FT.pdf1.41 MBAdobe PDFVisualizar/Abrir


Los ítems de RIUdeG están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.