Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/20.500.12104/92435
Registro completo de metadatos
Campo DCValorLengua/Idioma
dc.contributor.authorSiordia Millán, Sinhué
dc.date.accessioned2023-06-19T18:37:52Z-
dc.date.available2023-06-19T18:37:52Z-
dc.date.issued2022-07-13
dc.identifier.urihttps://wdg.biblio.udg.mx
dc.identifier.urihttps://hdl.handle.net/20.500.12104/92435-
dc.description.abstractLas enfermedades pulmonares pueden presentarse de forma aguda con disnea grave y potencialmente mortal, como Tromboembolia Pulmonar (TEP); o de manera más insidiosa con una disminución constante de la función pulmonar, enfermedad pulmonar obstructiva crónica o neumonías (Paramothayan, 2019). En todo el mundo, estas enfermedades causan una morbilidad y mortalidad significativas. Tan solo en México, durante el año 2010, se reportaron 156,636 casos de neumonía, con una tasa de incidencia de 144.50 casos por 100,000 habitantes, siendo una de las 20 primeras causas de morbilidad nacional (Báez-Saldaña R, 2013) y también se han reportado más de 200 mil defunciones por neumonía durante el 2020, a raíz de la actual pandemia por Covid-19 (INEGI, 2021). En caso de la TEP se tuvo una tasa de incidencia en México del 15%, siendo la tercera causa de mortalidad en el Hospital General del Centro Médico Nacional del IMSS durante el 2007 (Alfredo Cabrera Rayo, 2007) y con una tasa de mortalidad del 30% durante el 2017 (Machado Villarroel & Dimakis Ramírez, 2017). Asimismo, las enfermedades de TEP y neumonías presentan complejidades en el diagnóstico dado que comparten síntomas comunes como tos, falta de aire y dolor torácico (Musher & Thorner, 2014); además, los signos y síntomas que se presentan son a menudo subjetivos e inespecíficos, por lo que los criterios o diagnósticos auxiliares siempre deben complementarse con la determinación del médico tratante (Metlay et al., 2019). Aunado a esto, existe la dificultad para analizar grandes cantidades de información almacenada en el Expediente Clínico Electrónico (ECE), por ejemplo, las notas del historial clínico y los Estudios Auxiliares de Laboratorio y Gabinete (LABs). Toda esta información se puede aprovechar para ayudar al personal médico a disminuir el tiempo para la asignación de un diagnóstico, además de aumentar su certeza al diagnosticar, lo que a su vez podría resultar en atenciones más eficientes a los pacientes al momento de ingresar a un hospital. Para enfrentar la dificultad de analizar grandes cantidades de información, existe una metodología en el área de las ciencias computacionales, conocida como “Knowledge Discovery From Data” (KDD, por sus siglas en inglés) la cual se refiere al proceso de generar conocimiento útil a partir de conjuntos de datos (Fayyad et al., 1996), permitiéndonos identificar relaciones entre los datos que a simple vista no son evidentes. Además, esta metodología ha servido en el área médica como un auxiliar al momento de realizar un diagnóstico clínico, debido a que dentro del campo médico es necesario identificar diferentes combinaciones de diversos factores que puedan estar estrechamente relacionados con ciertos padecimientos clínicos (Nemethova et al., 2019).
dc.description.tableofcontentsÍNDICE 1 Introducción ................................................................................................................................ 9 1.1 Antecedentes ......................................................................................................................... 9 1.2 Justificación .......................................................................................................................... 11 1.3 Objetivos ............................................................................................................................... 11 1.3.1 General ........................................................................................................................ 11 1.3.2 Específicos .................................................................................................................. 11 1.4 Hipótesis ............................................................................................................................... 11 1.5 Diagrama metodológico ....................................................................................................... 11 1.6 Viabilidad .............................................................................................................................. 13 2 Estado del arte .......................................................................................................................... 14 3 Marco teórico ............................................................................................................................ 17 3.1 Knowledge Discovery from Data (KDD) ............................................................................... 17 3.2 Expresiones regulares .......................................................................................................... 17 3.3 Procesamiento de Lenguaje Natural (PLN) ......................................................................... 19 3.3.1 Creación de tokens ...................................................................................................... 19 3.3.2 Eliminación de palabras sin información importante ................................................... 20 3.3.3 Eliminación de caracteres innecesarios ...................................................................... 20 3.3.4 Conversión de texto a minúsculas ............................................................................... 20 3.3.5 Derivación o raíz de la palabra .................................................................................... 20 3.3.6 Lematización o conversión a la base (lema) de la palabra ......................................... 20 3.4 Bases de datos relacionales ................................................................................................ 20 3.5 Técnicas de clasificación ...................................................................................................... 21 3.5.1 Árboles de decisión ..................................................................................................... 21 3.5.2 Random Forest ............................................................................................................ 22 3.5.3 Adaboost ...................................................................................................................... 23 3.5.4 Redes neuronales profundas ...................................................................................... 24 3.5.5 Redes neuronales convolucionales ............................................................................. 25 3.5.6 Redes neuronales recurrentes .................................................................................... 26 3.5.7 Red neuronal de memoria a corto y largo plazo ......................................................... 27 3.5.8 Memoria a corto y largo plazo bidireccional ................................................................ 28 3.6 Palabras vectorizadas (Word Embedding) ........................................................................... 29 3.6.1 GloVe ........................................................................................................................... 30 3.6.2 FastText ....................................................................................................................... 30 3.7 Métricas para evaluar el rendimiento del clasificador .......................................................... 30 3.8 Metodologías de evaluación de clasificadores ..................................................................... 32 4 Metodología .............................................................................................................................. 33 4.1 Obtención de datos de estudio............................................................................................. 33 4.1.1 Protocolo de adquisición de datos ............................................................................... 34 4.1.2 Grupos de estudio ....................................................................................................... 34 4.1.3 Tipo y tamaño de estudio ............................................................................................ 35 4.1.4 Recolección de notas clínicas y auxiliares de laboratorio ........................................... 35 4.1.5 Exploración, diseño e implementación de base de datos ........................................... 36 4.2 Preprocesamiento de los datos ............................................................................................ 39 4.3 Minería de datos de datos estructurados ............................................................................. 40 4.4 Análisis y evaluación de patrones de datos estructurados .................................................. 42 4.5 Minería de datos no estructurados ....................................................................................... 42 4.5.1 Extracción y preprocesamiento de interrogatorios clínicos ......................................... 42 4.5.2 Obtención de modelos para generar WE .................................................................... 43 4.5.3 Generación de WE por cada palabra .......................................................................... 43 4.5.4 Parametrización del modelo BiLSTM para clasificar ................................................... 43 4.6 Análisis y evaluación de patrones de datos no estructurados ............................................. 46 4.7 Minería de datos no combinados ......................................................................................... 46 4.7.1 Extracción y análisis de los datos combinados ........................................................... 46 4.7.2 Adaptación de los datos estructurados ....................................................................... 47 4.7.3 Incorporación de datos estructurados con no estructurados ...................................... 47 4.8 Análisis y evaluación de patrones de datos combinados .................................................... 47 4.9 Materiales ............................................................................................................................. 48 5 Resultados y discusión ............................................................................................................. 49 5.1 Datos estructurados ............................................................................................................. 50 5.2 Datos no estructurados ........................................................................................................ 53 5.3 Combinación de datos estructurados y no estructurados .................................................... 55 6 Conclusiones y trabajo a futuro ................................................................................................ 57 6.1 Conclusiones ........................................................................................................................ 57 6.2 Trabajo a futuro .................................................................................................................... 57 6.3 Productos obtenidos ............................................................................................................. 57 7 Referencias ............................................................................................................................... 58 8 Anexos ...................................................................................................................................... 62 8.1 Ética y privacidad de los datos ............................................................................................. 62 8.2 Protocolo de ética aceptado ................................................................................................. 63 8.3 Artículo para congreso CNIB-2021 ...................................................................................... 64 8.4 Primer lugar del concurso estudiantil “M. Sc. Fernando Berdichevsky Porteny” ................. 69
dc.formatapplication/PDF
dc.language.isospa
dc.publisherBiblioteca Digital wdg.biblio
dc.publisherUniversidad de Guadalajara
dc.rights.urihttps://www.riudg.udg.mx/info/politicas.jsp
dc.subjectDiagnostico Automatico
dc.subjectEnfermedades Respiratorias
dc.titleDiagnóstico clínico automático de enfermedades respiratorias a partir del expediente clínico electrónico
dc.typeTesis de Maestría
dc.rights.holderUniversidad de Guadalajara
dc.rights.holderSiordia Millán, Sinhué
dc.coverageGUADALAJARA, JALISCO
dc.type.conacytmasterThesis
dc.degree.nameMAESTRIA EN CIENCIAS EN BIOINGENIERIA Y COMPUTO INTELIGENTE
dc.degree.departmentCUCEI
dc.degree.grantorUniversidad de Guadalajara
dc.rights.accessopenAccess
dc.degree.creatorMAESTRIA EN CIENCIAS EN BIOINGENIERO EN Y COMPUTO INTELIGENTE
dc.contributor.directorRomán Godínez, Israel
dc.contributor.codirectorTorres Ramos, Sulema
Aparece en las colecciones:CUCEI

Ficheros en este ítem:
Fichero TamañoFormato 
MCUCEI10496FT.pdf5.01 MBAdobe PDFVisualizar/Abrir


Los ítems de RIUdeG están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.