Прогнозирование высокорискованной беременности на основе алгоритмов машинного обучения
Введение
Высокорискованная беременность представляет серьезную угрозу для здоровья матери и плода, требуя своевременного выявления и медицинского вмешательства. Традиционные методы оценки риска часто основываются на субъективных клинических критериях, что может приводить к ошибкам. В данной статье исследуется применение алгоритмов машинного обучения для прогнозирования высокорискованной беременности с целью повышения точности диагностики.
Цель исследования
Целью исследования являлось создание эффективной прогностической модели для идентификации высокорискованных беременностей с использованием шести алгоритмов машинного обучения. Основное внимание уделялось сравнению их производительности и выбору оптимального метода.
Методы
Исследование основано на данных из набора Maternal Health Risk Dataset (MHRD), собранных в Бангладеш. В анализ включены данные 1014 беременных женщин из больниц, клиник и центров охраны материнства. Использовались следующие алгоритмы:
- Многослойный перцептрон (MLP)
- Логистическая регрессия (LR)
- Дерево решений (DT)
- Случайный лес (RF)
- eXtreme Gradient Boosting (XGBoost)
- Метод опорных векторов (SVM)
Вычисления проводились на GPU NVIDIA RTX3050Ti.
Результаты
Многослойный перцептрон (MLP) продемонстрировал наилучшие результаты среди всех алгоритмов. Модель показала:
- Общую точность прогнозирования — 82%
- Точность в прогнозировании высокого риска — 91%
- Скорость обработки — 500 наборов данных в секунду
Выводы
Исследование подтвердило высокую эффективность алгоритмов машинного обучения, в частности MLP, в прогнозировании высокорискованных беременностей. Разработанная модель может служить ценным инструментом поддержки врачебных решений, позволяя своевременно выявлять пациенток с повышенным риском и улучшая управление материнским здоровьем. Полученные результаты открывают перспективы для дальнейших исследований в этой области.
Термины и сокращения
- MLP (Multilayer Perceptron) — многослойный перцептрон, тип искусственной нейронной сети
- LR (Logistic Regression) — логистическая регрессия
- DT (Decision Tree) — дерево решений
- RF (Random Forest) — случайный лес
- XGBoost (eXtreme Gradient Boosting) — алгоритм градиентного бустинга
- SVM (Support Vector Machine) — метод опорных векторов
- MHRD (Maternal Health Risk Dataset) — набор данных о рисках материнского здоровья
- GPU (Graphics Processing Unit) — графический процессор
