Метод Random Forest в задачах интерпретации результатов биолюминесцентного анализа слюны при персонализированной диагностике

Файл статьи: 
УДК: 
519.254: 519.257
Авторы: 

Г.В. Жукова1, П.А. Мартыщук1, Е.Р. Афер1, А.Н. Шуваев1, Н.А. Розанова2, Д.В. Сергеев2, В.А. Кратасюк1, 3

Организация: 

1Сибирский федеральный университет, Российская Федерация, 660041, г. Красноярск, Свободный пр., 79
2Научный центр неврологии, Российская Федерация, 125367, г. Москва, Волоколамское шоссе, 80
3Институт биофизики СО РАН, обособленное подразделение ФНЦ «Красноярский научный центр Сибирского отделения Российской академии наук», Российская Федерация, 660036, г. Красноярск, Академгородок, 50, стр. 50

Аннотация: 

Развитие направления персонифицированной медицины и биотехнологии напрямую связано с получением данных, в значительной степени зависящих от индивидуальных характеристик исследуемых. При этом используемые в традиционной медицине допустимые интервалы исследуемых параметров не всегда позволяют адекватно охарактеризовать состояние пациента. Возникает необходимость поиска таких методов обработки результатов, кото-рые позволяют учитывать разные индивидуальные особенности организма испытуемых и образа его жизни.

Определены возможности применения анализа биомедицинских данных Random Forest для корректной интерпретации результатов персонифицированных диагностических тестов на примере биолюминесцентного тестирования, позволяющего оценить влияние разных характеристик испытуемых и условий их жизни. Метод позволяет минимизировать риски неверного диагноза и корректировать схему мониторинга исследуемых.

В данной работе используются результаты диагностики трудовой нагрузки работников железнодорожного транспорта, полученные биолюминесцентным методом. Оценку состояния организма проводят, изучая влияние слюны испытуемых на интенсивность свечения биферментной системы: НАДН: ФМН-оксидоредуктаза + люцифе-раза. Такой анализ является интегральным, реагирует на множество факторов, каждый из которых потенциально может повлиять на результат. Оценку эффективности разных методов обработки данных проводили на примере группы диспетчеров Красноярского филиала АО «РЖД». Для анализа были использованы как статистические методы, так и алгоритм машинного обучения Random Forest.

В результате было показано, что для оценки значимости некоторых биохимических показателей слюны для прогнозирования состояния организма работников железнодорожного транспорта целесообразно использовать метод Random Forest, который позволяет определить наиболее значимые факторы и построить графики частичного влияния факторов на целевую переменную. Данное исследование позволяет оптимизировать систему диагностики организма человека при использовании интегрального биолюминесцентного анализа. Метод Random Forest может быть составной частью персонифицированного биолюминесцентного биосенсора для оценки влияния стрессовых и трудовых нагрузок на организм человека.

Ключевые слова: 
персонифицированная диагностика, машинное обучение, анализ данных, многофакторный анализ, слюна, биолюминесценция, биосенсор, сигнальные системы
Получена: 
30.06.2025
Одобрена: 
30.06.2025
Принята к публикации: 
30.06.2025

Вы здесь