Подход SuperLearner для прогнозирования диабетической болезни почек при первичной диагностике T2DM в стационаре
Введение
Диабетическая болезнь почек (DKD) является серьезным осложнением сахарного диабета (DM), при котором пациенты обычно остаются бессимптомными до достижения поздней стадии. Целью данного исследования была разработка и валидация предиктивной модели для DKD у пациентов с первичным диагнозом сахарного диабета 2 типа (T2DM) с использованием реальных клинических данных.
Цель
Разработать и валидировать модель прогнозирования DKD у пациентов с впервые диагностированным T2DM, используя доступные клинические параметры.
Методы
Ретроспективно проанализированы данные 3 291 пациента (1 740 мужчин, 1 551 женщина) с впервые диагностированным T2DM в Ningbo Municipal Hospital of Traditional Chinese Medicine (2011–2023 гг.). Набор данных был случайным образом разделен на обучающую и валидационную когорты.
Для разработки предиктивных моделей использовались 46 клинических характеристик, доступных при первичной диагностике T2DM, из электронных медицинских карт. Модели строились на основе линейных, нелинейных методов и подхода SuperLearner. Производительность моделей оценивалась с помощью площади под кривой (AUC). Для интерпретации лучшей модели использовался метод SHapley Additive exPlanation (SHAP).
Результаты
Из 3 291 участника у 563 (17,1%) была диагностирована DKD в течение медианного периода наблюдения 2,53 года. Модель SuperLearner продемонстрировала наивысшую AUC (0,7138; 95% доверительный интервал: [0,673, 0,7546]) для внутренней валидационной выборки при прогнозировании любой стадии DKD.
Наиболее значимыми предикторами оказались:
- WBC_Cnt* (количество лейкоцитов)
- Neut_Cnt (количество нейтрофилов)
- Hct (гематокрит)
- Hb (гемоглобин)
Высокий уровень WBC_Cnt, низкий Neut_Cnt, высокий Hct и низкий Hb были ассоциированы с повышенным риском развития DKD.
Выводы
Разработана и валидирована модель прогнозирования риска DKD у пациентов с впервые диагностированным T2DM. Используя рутинно доступные клинические показатели, модель SuperLearner может прогнозировать развитие DKD во время визитов в стационар. Точность прогнозирования и интерпретируемость модели на основе SHAP могут способствовать улучшению раннего выявления, целевых вмешательств и прогноза у пациентов с DM.
Термины и сокращения
- DKD (Diabetic Kidney Disease) – диабетическая болезнь почек
- T2DM (Type 2 Diabetes Mellitus) – сахарный диабет 2 типа
- DM (Diabetes Mellitus) – сахарный диабет
- AUC (Area Under the Curve) – площадь под кривой
- SHAP (SHapley Additive exPlanation) – метод интерпретации моделей машинного обучения
- WBC_Cnt (White Blood Cell Count) – количество лейкоцитов
- Neut_Cnt (Neutrophil Count) – количество нейтрофилов
- Hct (Hematocrit) – гематокрит
- Hb (Hemoglobin) – гемоглобин
