Валидация алгоритма машинного обучения для выявления новорожденных из группы риска по гипоксически-ишемической энцефалопатии на большой независимой выборке

Журнал: Archives of disease in childhood. Fetal and neonatal edition • 17.04.2025

Введение

Гипоксически-ишемическая энцефалопатия (HIE) остается серьезным осложнением у новорожденных, требующим своевременной диагностики и вмешательства. Разработка алгоритмов машинного обучения для раннего выявления риска HIE может значительно улучшить клинические исходы.

Цель

Валидировать алгоритм прогнозирования HIE для идентификации новорожденных из группы риска сразу после рождения, используя общедоступные клинические данные.

Методы

Проведен вторичный анализ данных электронных медицинских карт доношенных новорожденных (гестационный возраст >36 недель) с января 2017 по декабрь 2021 года в третичном родильном центре. Критерии включения:

  • Наличие оценки по шкале Апгар на 1-й и 5-й минуте
  • Постнатальные показатели pH, дефицита оснований и уровня лактата в течение первого часа жизни

Использованы ранее обученные алгоритмы логистической регрессии и случайного леса (RF) для расчета вероятностного индекса (PI) развития HIE.

Результаты

Из 1081 новорожденных с полным набором данных у 76 (6.95%) диагностирована HIE: 37 легкой, 29 средней и 10 тяжелой степени. Наилучшая точность достигнута с моделью RF. Медианный PI в группе HIE составил 0.70 (IQR 0.53-0.86) против 0.05 (IQR 0.02-0.15) в группе без HIE (p<0.001). Площадь под ROC-кривой для прогнозирования HIE - 0.926 (95% ДИ 0.893-0.959, p<0.001). При оптимальном пороге PI=0.30 для чувствительности корректно классифицировано 86.5% случаев (936 из 1081).

Выводы

Алгоритм на основе открытого кода продемонстрировал высокую точность в идентификации новорожденных с риском HIE в раннем постнатальном периоде на независимой выборке. Это может способствовать:

  • Целенаправленному клиническому обследованию
  • Своевременному переводу в третичный центр (при необходимости)
  • Раннему началу терапии

Термины и сокращения

  • HIE - Hypoxic Ischaemic Encephalopathy (гипоксически-ишемическая энцефалопатия)
  • RF - Random Forest (случайный лес - алгоритм машинного обучения)
  • PI - Probability Index (вероятностный индекс)
  • ROC - Receiver Operating Characteristics (рабочая характеристика приемника)
  • IQR - Interquartile Range (интерквартильный размах)
Дата публикации на сайте: