Подход SuperLearner для прогнозирования диабетической болезни почек при первичной диагностике T2DM в стационаре

Журнал: BMC medical informatics and decision making • 26.03.2025

Введение

Диабетическая болезнь почек (DKD) является серьезным осложнением сахарного диабета (DM), при котором пациенты обычно остаются бессимптомными до достижения поздней стадии. Целью исследования была разработка и валидация предиктивной модели для DKD у пациентов с первичным диагнозом сахарного диабета 2 типа (T2DM) с использованием реальных клинических данных.

Цель

Создание модели, способной прогнозировать развитие DKD на момент постановки диагноза T2DM, с использованием доступных клинических параметров.

Методы

Ретроспективно проанализированы данные 3291 пациента (1740 мужчин, 1551 женщина) с впервые диагностированным T2DM в Ningbo Municipal Hospital of Traditional Chinese Medicine (2011-2023). Набор данных был случайным образом разделен на обучающую и валидационную когорты. Для разработки моделей использовались 46 клинических характеристик, доступных при первичной диагностике T2DM. Применялись линейные, нелинейные методы и алгоритм SuperLearner. Качество моделей оценивалось по площади под кривой (AUC). Для интерпретации лучшей модели использовался метод SHapley Additive exPlanation (SHAP).

Результаты

Из 3291 участников у 563 (17.1%) диагностирована DKD в течение медианного периода наблюдения 2.53 года. Модель SuperLearner показала наивысшую AUC (0.7138, 95% доверительный интервал: [0.673, 0.7546]) на внутреннем валидационном наборе данных. Наиболее значимыми предикторами оказались:

  • WBC_Cnt* (количество лейкоцитов)
  • Neut_Cnt (количество нейтрофилов)
  • Hct (гематокрит)
  • Hb (гемоглобин)

Высокий уровень WBC_Cnt, низкий Neut_Cnt, высокий Hct и низкий Hb были ассоциированы с повышенным риском DKD.

Выводы

Разработана и валидирована модель прогнозирования риска DKD у пациентов с впервые диагностированным T2DM. Модель SuperLearner, использующая рутинно доступные клинические параметры, может предсказывать развитие DKD во время госпитализации. Точность прогнозирования и интерпретируемость модели на основе SHAP могут способствовать улучшению раннего выявления, целевых вмешательств и прогноза пациентов с DM.

Термины и сокращения

  • DKD - Diabetic Kidney Disease (Диабетическая болезнь почек)
  • DM - Diabetes Mellitus (Сахарный диабет)
  • T2DM - Type 2 Diabetes Mellitus (Сахарный диабет 2 типа)
  • AUC - Area Under Curve (Площадь под кривой)
  • SHAP - SHapley Additive exPlanation (Метод объяснения моделей машинного обучения)
  • WBC_Cnt - White Blood Cell Count (Количество лейкоцитов)
  • Neut_Cnt - Neutrophil Count (Количество нейтрофилов)
  • Hct - Hematocrit (Гематокрит)
  • Hb - Hemoglobin (Гемоглобин)
Дата публикации на сайте: