“ESTRATIFICACIÓN EXPLICABLE DE LA SEVERIDAD RENAL- METABÓLICA EN PACIENTES CON ENFERMEDAD RENAL CRÓNICA UTILIZANDO BIOMARCADORES TABULARES.”
UNIVERSIDAD AUTÓNOMA DE ZACATECAS
De la Rosa Trejo, Mayra Cecilia;
Morgan Benita,Jorge Alejandro; Luna García, Huizilopoztli;
Celaya Padilla, José María
Estratificación explicable de la severidad renal-metabólica en pacientes con enfermedad renal crónica utilizando biomarcadores tabulares
En el siguiente proyecto surge de la necesidad de aprovechar las técnicas de aprendizaje automático para el apoyar a la identificación de distintos niveles de severidad en pacientes con enfermedad renal crónica.
La importancia radica en que suele progresar de forma silenciosa, provocando complicaciones cardiovasculares y metabólicas que afectan significativamente la calidad de vida de los pacientes.
Actualmente, la clasificación clínica de la ERC se basa principalmente en dos indicadores:
Estos parámetros nos permiten evaluar el grado del daño renal y estimar el riesgo de progresión de la enfermedad.
Sin embargo, debido a la gran cantidad de información clinica discponible, surge la oportunidad de utilizar modelos de aprendizaje automático para la identificacion de patrones complejos y mejorar la estratificación de los pacientes.
Es el estudio fue desarrollar un pipeline reproducible basado en aprendizaje automático para estratificar la severidad renal-metabólica en pacientes con enfermedad renal crónica.
Además, buscamos:
En este estudio se utilizó un conjunto de datos compuestos por 1659 pacientes y 54 variables clínicas.
Entre las variables analizadas nos incluyeron:
Construcción del endpoint
Para definir la severidad renal-metabólica donde se utilizaron las categorías propuestas por la guais KDIGO.
Primero se clasificó el GFR en los estadios G1, G2 , G3a y G4.
Posteriormente se clasificó la albuminuria en categoría A1 y A2.
A partir de estas categorías se asignaron puntajes de riesgo y se construyó una variable ordinal de cuatro niveles:
Esta clasificación permitió representar distintos grados de severidad clínica de forma estructurada.
Se desarrolló un pipeline completamente reproducible utilizando Python y Scikit-Learn se implementó dos únicos modos de análisis en cual por nombre lleva “clinical stratication”, donde GFR y ACR serán los predictores.
El otro llamado “non-definitional”, diseñado para eliminar estas variables y reducir la circularidad estructural.
Se generó nuevas variables derivadas las cuales fueron:
Los datos fueron normalizados y preparados para el entrenamiento del modelo.
Modelos evaluados
Se evaluaron distintos algoritmos de aprendizaje automático. En la ejecución principal
La validación se realizó mediante la validación cruzada estratificada en tres pliegues utilizando Macro F1- Score como métrica principal.
Resultados principales
En el conjunto de prueba de random forest se obtuvo:
Estos valores nos indican una buena capacidad para diferenciar correctamente los distintos niveles de severidad renal-metabólica.
Matriz de confusión
Se observó que la mayoría de los errores ocurrieron entre clases vecinas.
Por ejemplo:
Algunos pacientes clasificados como Low or Mild fueron confundidos con Moderate.
Y algunos Moderate fueron clasificados como Low or Mild.
Análisis de clústeres
Como complemento se amplió un análisis no supervisado utilizando K.Means en donde se identificaron tres perfiles renales-metabólicos diferentes
Uno de estos grupos presentó:
Conclusión
Podemos decir que el aprendizaje automático puede utilizarse exitosamente para estratificar la severidad renal-metabólica en pacientes con enfermedad renal crónica. Y también se identificaron biomarcadores relevantes asociados con la progresión de la enfermedad.