Подход SuperLearner для прогнозирования диабетической болезни почек при первичной диагностике T2DM в стационаре

Журнал: BMC medical informatics and decision making • 26.03.2025

Введение

Диабетическая болезнь почек (DKD) является серьезным осложнением сахарного диабета (DM), при котором пациенты обычно остаются бессимптомными до достижения поздней стадии. Целью данного исследования была разработка и валидация предиктивной модели для DKD у пациентов с первичным диагнозом сахарного диабета 2 типа (T2DM) с использованием реальных клинических данных.

Цель

Разработать и валидировать модель прогнозирования DKD у пациентов с впервые диагностированным T2DM, используя доступные клинические параметры.

Методы

Ретроспективно проанализированы данные 3 291 пациента (1 740 мужчин, 1 551 женщина) с впервые диагностированным T2DM в Ningbo Municipal Hospital of Traditional Chinese Medicine (2011–2023 гг.). Набор данных был случайным образом разделен на обучающую и валидационную когорты.

Для разработки предиктивных моделей использовались 46 клинических характеристик, доступных при первичной диагностике T2DM, из электронных медицинских карт. Модели строились на основе линейных, нелинейных методов и подхода SuperLearner. Производительность моделей оценивалась с помощью площади под кривой (AUC). Для интерпретации лучшей модели использовался метод SHapley Additive exPlanation (SHAP).

Результаты

Из 3 291 участника у 563 (17,1%) была диагностирована DKD в течение медианного периода наблюдения 2,53 года. Модель SuperLearner продемонстрировала наивысшую AUC (0,7138; 95% доверительный интервал: [0,673, 0,7546]) для внутренней валидационной выборки при прогнозировании любой стадии DKD.

Наиболее значимыми предикторами оказались:

  • WBC_Cnt* (количество лейкоцитов)
  • Neut_Cnt (количество нейтрофилов)
  • Hct (гематокрит)
  • Hb (гемоглобин)

Высокий уровень WBC_Cnt, низкий Neut_Cnt, высокий Hct и низкий Hb были ассоциированы с повышенным риском развития DKD.

Выводы

Разработана и валидирована модель прогнозирования риска DKD у пациентов с впервые диагностированным T2DM. Используя рутинно доступные клинические показатели, модель SuperLearner может прогнозировать развитие DKD во время визитов в стационар. Точность прогнозирования и интерпретируемость модели на основе SHAP могут способствовать улучшению раннего выявления, целевых вмешательств и прогноза у пациентов с DM.

Термины и сокращения

  • DKD (Diabetic Kidney Disease) – диабетическая болезнь почек
  • T2DM (Type 2 Diabetes Mellitus) – сахарный диабет 2 типа
  • DM (Diabetes Mellitus) – сахарный диабет
  • AUC (Area Under the Curve) – площадь под кривой
  • SHAP (SHapley Additive exPlanation) – метод интерпретации моделей машинного обучения
  • WBC_Cnt (White Blood Cell Count) – количество лейкоцитов
  • Neut_Cnt (Neutrophil Count) – количество нейтрофилов
  • Hct (Hematocrit) – гематокрит
  • Hb (Hemoglobin) – гемоглобин
Дата публикации на сайте: