Метод Random Forest в задачах интерпретации результатов биолюминесцентного анализа слюны при персонализированной диагностике
Г.В. Жукова1, П.А. Мартыщук1, Е.Р. Афер1, А.Н. Шуваев1, Н.А. Розанова2, Д.В. Сергеев2, В.А. Кратасюк1,3
1Сибирский федеральный университет, Российская Федерация, 660041, г. Красноярск, Свободный пр., 79
2Научный центр неврологии, Российская Федерация, 125367, г. Москва, Волоколамское шоссе, 80
3Институт биофизики СО РАН, обособленное подразделение ФНЦ «Красноярский научный центр Сибирского отделения Российской академии наук», Российская Федерация, 660036, г. Красноярск, Академгородок, 50, стр. 50
Развитие направления персонифицированной медицины и биотехнологии напрямую связано с получением данных, в значительной степени зависящих от индивидуальных характеристик исследуемых. При этом используемые в традиционной медицине допустимые интервалы исследуемых параметров не всегда позволяют адекватно охарактеризовать состояние пациента. Возникает необходимость поиска таких методов обработки результатов, кото-рые позволяют учитывать разные индивидуальные особенности организма испытуемых и образа его жизни.
Определены возможности применения анализа биомедицинских данных Random Forest для корректной интерпретации результатов персонифицированных диагностических тестов на примере биолюминесцентного тестирования, позволяющего оценить влияние разных характеристик испытуемых и условий их жизни. Метод позволяет минимизировать риски неверного диагноза и корректировать схему мониторинга исследуемых.
В данной работе используются результаты диагностики трудовой нагрузки работников железнодорожного транспорта, полученные биолюминесцентным методом. Оценку состояния организма проводят, изучая влияние слюны испытуемых на интенсивность свечения биферментной системы: НАДН: ФМН-оксидоредуктаза + люцифе-раза. Такой анализ является интегральным, реагирует на множество факторов, каждый из которых потенциально может повлиять на результат. Оценку эффективности разных методов обработки данных проводили на примере группы диспетчеров Красноярского филиала АО «РЖД». Для анализа были использованы как статистические методы, так и алгоритм машинного обучения Random Forest.
В результате было показано, что для оценки значимости некоторых биохимических показателей слюны для прогнозирования состояния организма работников железнодорожного транспорта целесообразно использовать метод Random Forest, который позволяет определить наиболее значимые факторы и построить графики частичного влияния факторов на целевую переменную. Данное исследование позволяет оптимизировать систему диагностики организма человека при использовании интегрального биолюминесцентного анализа. Метод Random Forest может быть составной частью персонифицированного биолюминесцентного биосенсора для оценки влияния стрессовых и трудовых нагрузок на организм человека.
- Tabak L.A. Point-of-care diagnostics enter the mouth // Ann. N Y Acad. Sci. – 2007. – Vol. 1098. – Р. 7–14. DOI: 10.1196/annals.1384.043
- A Review of Selected Studies That Determine the Physical and Chemical Properties of Saliva in the Field of Dental Treatment / E. Kubala, P. Strzelecka, M. Grzegocka, D. Lietz-Kijak, H. Gronwald, P. Skomro, E. Kijak // BioMed Res. Int. – 2018. – Vol. 2018. – Р. 6572381. DOI: 10.1155/2018/657238
- Saliva diagnostics – Current views and directions / K.E. Kaczor-Urbanowicz, C. Martin Carreras-Presas, K. Aro, M. Tu, F. Garcia-Godoy, D.T. Wong // Exp. Biol. Med. (Maywood). – 2017. – Vol. 242, № 5. – Р. 459–472. DOI: 10.1177/1535370216681550
- Ферментативное биотестирование: научные основы и применение / Е.Н. Есимбекова, И.Г. Торгашина, В.П. Ка¬ля-бина, В.А. Кратасюк // Сибирский экологический журнал. – 2021. – Т. 28, № 3. – С. 364–382. DOI: 10.15372/SEJ20210308
- A noninvasive and qualitative bioluminescent assay for express diagnostics of athletes' responses to physical exertion / V.A. Kratasyuk, L.V. Stepanova, R. Ranjan, O.S. Sutormin, S. Pande, G.V. Zhukova, O.M. Miller, N.V. Maznyak, O.A. Kolenchukova // Luminescence. – 2021. – Vol. 36, № 2. – Р. 384–390. DOI: 10.1002/bio.3954
- Jordan M.I., Mitchell T.M. Machine learning: Trends, perspectives, and prospects // Science. – 2015. – Vol. 349, № 6245. – Р. 255–260. DOI: 10.1126/science.aaa8415
- Бельская Л.В., Сарф Е.А. Применение ИК-Фурье-спектроскопии слюны для экспресс-оценки уровня продуктов перекисного окисления липидов // Biomedical Chemistry: Research and Methods. – 2019. – Т. 2, № 2. – С. e00094. DOI: 10.18097/BMCRM00094
- Бельская Л.В., Сарф Е.А., Косенок В.К. Корреляционные взаимосвязи состава слюны и плазмы крови в норме // Клиническая лабораторная диагностика – 2018. – Т. 63, № 8. – С. 477–482. DOI: 10.18821/0869-2084-2018-63-8-477-482
- Никонорова М.Л. Построение оптимальных моделей анализа биомедицинских данных // Вестник новых медицинских технологий. – 2021. – Т. 28, № 1. – С. 55–59. DOI: 10.24412/1609-2163-2021-1-55-59
- Берестнева О.Г., Осадчая И.А., Немерово Е.В. Методы исследования структуры медицинских данных // Вестник науки Сибири. – 2012. – Т. 1, № 2. – С. 333–338.
- Клименко А.В., Слащев И.С. Кластерный анализ данных // Вестник науки. – 2019. – № 1 (10), Т. 1. – С. 159–163.
- Using machine learning and an electronic tongue for discriminating saliva samples from oral cavity cancer patients and healthy individual / D.C. Braz, M. Popolin Neto, F.M. Shimizu, A.C. Sá, R.S. Lima, A.L. Gobbi, M.E. Melendez, L.M.R.B. Arantes [et al.] // Talanta. – 2022. – Vol. 243. – Р. 123327. DOI: 10.1016/j.talanta.2022.123327
- Microbiome of Saliva and Plaque in Children According to Age and Dental Caries Experience / E. Lee, S. Park, S. Um, S. Kim, J. Lee, J. Jang, H.-O. Jeong, J. Shin [et al.] // Diagnostics (Basel). – 2021. – Vol. 11, № 8. – Р. 1324. DOI: 10.3390/diagnostics11081324
- Finding distinctions between oral cancer and periodontitis using saliva metabolites and machine learning / V.L. Kouznetsova, J. Li, E. Romm, I.F. Tsigelny // Oral Dis. – 2021. – Vol. 27, № 3. – Р. 484–493. DOI: 10.1111/odi.13591
- Zarrin P.S., Roeckendorf N., Wenger C. In-Vitro Classification of Saliva Samples of COPD Patients and Healthy Controls Using Machine Learning Tools // IEEE Access. – 2020. – Vol. 8. – Р. 168053–168060. DOI: 10.1109/ACCESS.2020.3023971
- Salivary metabolomics with alternative decision tree-based machine learning methods for breast cancer discrimination / T. Murata, T. Yanagisawa, T. Kurihara, M. Kaneko, S. Ota, A. Enomoto, M. Tomita, M. Sugimoto [et al.] // Breast Cancer Res. Treat. – 2019. – Vol. 177, № 3. – Р. 591–601. DOI: 10.1007/s10549-019-05330-9
- Applications of machine learning in routine laboratory medicine: Current state and future directions / N. Rabbani, G.Y.E. Kim, C.J. Suarez, J.H. Chen // Clin. Biochem. – 2022. – Vol. 103. – Р. 1–7. DOI: 10.1016/j.clinbiochem.2022.02.011
- The oral microbiome of pregnant women facilitates gestational diabetes discrimination / X. Li, J. Zheng, X. Ma, B. Zhang, J. Zhang, W. Wang, C. Sun, Y. Wang [et al.] // J. Genet. Genomics. – 2021. – Vol. 48, № 1. – Р. 32–39. DOI: 10.1016/j.jgg.2020.11.006
- Salivary metabolomics with machine learning for colorectal cancer detection / H. Kuwabara, K. Katsumata, A. Iwabuchi, R. Udo, T. Tago, K. Kasahara, J. Mazaki, M. Enomoto [et al.] // Cancer Sci. – 2022. – Vol. 113, № 9. – Р. 3234–324. DOI: 10.1111/cas.15472
- Alam M.Z., Rahman M.S., Rahman M.S. A Random Forest based predictor for medical data classification using feature ranking // Informatics in Medicine Unlocked. – 2019. – Vol. 15. – Р. 100180. DOI: 10.1016/j.imu.2019.100180
- Применение биолюминесцентного ферментативного биотеста для анализа слюны работников железно¬до-рожного транспорта с целью мониторинга функционального состояния организма в условиях трудовой деятельности / Л.В. Степанова, О.А. Коленчукова, Г.В. Жукова, О.С. Сутормин, В.А. Кратасюк // Биофизика. – 2024. – Т. 69, № 3. – С. 674–683. DOI: 10.31857/S0006302924030224