ОБУЧЕНИЕ ДЕРЕВЬЕВ РЕШЕНИЯ ДЛЯ ДИАГНОСТИКИ
БОЛЕЗНИ АЛЬЦГЕЙМЕРА С ИСПОЛЬЗОВАНИЕМ
АДАПТИВНЫХ ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ
Попов О.С.
1,2
, Сушенцева Н.Н.
1
, Полковникова И.А.
1
,
Миночкин А.К.
1
1
Городская больница № 40 г. Сестрорецк,
2
Санкт-Петербургский государственный университет,
Санкт-Петербург, Россия
Научный руководитель: Апалько С.В., к.б.н.
Введение.
Болезнь Альцгеймера (БА) неизлечима, но ранняя диа-
гностика позволяет улучшить качество жизни пациента, а также за-
медлить регресс за счет поддерживающей терапии. Для нахождения
диагностических или прогностических критериев могут быть ис-
пользованы алгоритмы машинного обучения, позволяющие строить
модели, обладающие высокой точностью дифференцировки. Еще
большей точности могут добиться метаэвристические алгоритмы,
такие как генетические алгоритмы, позволяющие найти оптималь-
ные способы обучения модели.
Материалы и методы.
46 человек были разделены на опытную
группу — пациенты с диагнозом БА (18 женщин, 5 мужчин, 71,7±
8 лет) и контрольную — условно-здоровые испытуемые (12 женщин,
11 мужчин, 50±11 лет). Методом мультиплексного иммунофлуорес-
центного анализа на базе платформы Flex Map в сыворотке крови
пациентов была измерена концентрация GM-CSF, фракталкина, IFN-
альфа2, IFN-гамма, GRO, IP-10, MCP-3, IL-12p40, MDC, IL-12p70, IL-
13, IL-15, CD40L, IL-17A, IL-1ra, IL-1альфа, IL-9, IL-1бета, IL-2, IL-3,
IL-4. Данные были разделены бутстреп выборкой на обучающий
(n=13) и тестовый (n=10) наборы для каждой группы. Для реше-
ния задачи классификации использовалось простое дерево реше-
ний. Для поиска лучшего решения в обучении модели был написан
адаптивный генетический алгоритм. В качестве оператора выбора
родителей использовалась селекция с турнирным отбором. Как опе-
ратор рекомбинации использовался перетасовочный кроссинговер,
в качестве оператора отбора особей используется элитарный отбор.
НЕВРОЛОГИЯ, ПСИХИАТРИЯ, ПСИХОЛОГИЯ И ИХ БИОМЕДИЦИНСКИЕ ОСНОВЫ
383
Для реализации методов машинного обучения использовался язык
программирования R версия 3.6.1 и язык программирования Python
версия 3.9.
Результаты.
Построенная модель верно определяла диагноз
в 100% случаев на тестовых данных (ранее неизвестных модели)
и в 100% случаев на обучающих данных. Диагноз БА определялся
моделью с чувствительностью и специфичностью 100%. Для диф-
ференциации БА от контроля моделью даны следующие логические
условия: (IL-1ra 14.7 (пг/мл) & IL-3 14.3 (пг/мл) & GRO> 881 (пг/мл))
Заключение.
Высокая точность модели может быть объяснена не-
большим размером выборки, в то же время максимальная точность
в начальной популяции — 94% и только через несколько поколений
находятся решения с максимально возможной точностью. В литера-
туре встречаются указания на биологическую значимость всех ис-
пользованных в модели биомаркеров, выявленных как классически-
ми статистическими тестами, так и машинным обучением.
384
НЕВРОЛОГИЯ, ПСИХИАТРИЯ, ПСИХОЛОГИЯ И ИХ БИОМЕДИЦИНСКИЕ ОСНОВЫ
Do'stlaringiz bilan baham: |