Кластеризация состояний пациентов для модели назначения схем лечения атеросклероза

Мария Владиславовна Демченко; Ирина Леонидовна Каширина; Мария Андреевна  Фирюлина

doi:10.17308/sait.2021.2/3509

Мария Владиславовна Демченко Воронежский государственный университет https://orcid.org/0000-0002-6439-8957
Ирина Леонидовна Каширина Воронежский государственный университет https://orcid.org/0000-0002-8664-9817
Мария Андреевна Фирюлина Воронежский государственный университет https://orcid.org/0000-0003-3468-5514

DOI: https://doi.org/10.17308/sait.2021.2/3509

Ключевые слова: MIMIC-III, машинное обучение, кластеризация, k-medoids, понижение размерности, РСА, t-SNE, атеросклероз

Аннотация

В статье предлагается подход к реализации начального этапа решения задачи поиска и назначения оптимальных стратегий лечения пациентов с помощью моделей обучения с подкреплением, состоящего в выделении основных групп состояний пациентов с диагностированным атеросклерозом с использованием кластерного анализа. В качестве исходного набора данных была использована выборка MIMIC-III, содержащая значения клинических, лабораторных, гемодинамических и др. показателей пациентов. Основным методом кластерного анализа в данной работе был выбран метод k-medoids, при этом качество кластеризации оценивалось с помощью силуэтного анализа. Предварительным этапом кластеризации являлось понижение размерности с помощью метода главных компонент (PCA), а визуализация результатов производилась с помощью метода t-SNE. При этом важным этапом данного исследования являлось вычисление оценки тяжести состояния пациента для каждого из выявленных кластеров состояний. Полученные оценки используются для вычисления вознаграждений в модели назначения оптимальных схем лечения с помощью методов обучения с подкреплением, при этом набор полученных кластеров определяет набор состояний окружения. Таким образом, результаты кластеризации позволяют выявить основные закономерности в исходном наборе данных, а также позволяют сформировать основные составляющие модели обучения с подкреплением для назначения оптимальных схем лечения атеросклероза.

Скачивания

Биографии авторов

Мария Владиславовна Демченко, Воронежский государственный университет

аспирант факультета ПММ Воронежского государственного университета

Ирина Леонидовна Каширина, Воронежский государственный университет

д-р техн. наук, профессор кафедры математических методов исследования операций факультета ПММ Воронежского государственного университета

Мария Андреевна Фирюлина, Воронежский государственный университет

аспирант факультета ПММ Воронежского государственного университета

Литература

1. Gerhard-Herman M. D. et al. (2016) A Report of the American College of Cardiology. American Heart Association Task Force on Clinical Practice Guidelines . Circulation. Ovid Technologies. Vol. 135, No 12. P. 686–725.
2. Sutton R. (1992) Reinforcement learning. Boston : Kluwer Academic Publishers.
3. Yom-Tov E., Feraru G., Kozdoba M., Mannor S., Tennenholtz M. and Hochberg I. (2017) Encouraging Physical Activity in Patients With Diabetes: Intervention Using a Reinforcement Learning System. Journal of Medical Internet Research. 19(10). e338. Available from: doi: 10.2196/jmir.7994
4. Noori A., Sadrnia M. and Sistani M. (2017) Glucose level control using Temporal Difference methods. 2017 Iranian Conference on Electrical Engineering (ICEE). P. 895–900. Available from: doi:10.1109/IranianCEE.2017.7985166
5. Komorowski M., Celi L., Badawi O., Gordon A. and Faisal A. (2018) The Artificial Intelligence Clinician learns optimal treatment strategies for sepsis in intensive care. Nature Medicine. 24(11). P. 1716–1720. Available from: doi: 10.1038/s41591-018-0213-5
6. Khokhlov R., Gaydashev A. and Akhmedzhanov N. (2015) Predictors of atherosclerotic lesions of limb arteries according to cardioangiological screening of the adult population. Rational Pharmacotherapy in Cardiology. 11(5). P. 470–476. (In Russian). Available from: doi: 10.20996/1819-6446-2015-11-5-470-476
7. Khokhlov R., Ostroushko N., Gaydashev A., Kirsanov D. and Akhmedzhanov N. (2015) Multi-channel volume sphygmography in cardioangiological screening of the adult population. Rational Pharmacotherapy in Cardiology. 11(4). P. 371–379. (In Russian). Available from: doi: 10.20996/1819-6446-2015-11-4-371-379
8. Demchenko M. and Kashirina I. (2020) The development of the atherosclerosis diagnostic models under conditions of unbalanced classes. Journal of Physics: Conference Series, 1479. 012026. Available from: doi: 10.1088/1742-6596/1479/1/012026
9. Demchenko M. and Kashirina I. (2020) The Use of Machine Learning Methods to the Automated Atherosclerosis Diagnostic and Treatment System Development. In: CEUR Workshop Proceedings. 2790. P. 233–245.
10. Lvovich Y. (2020) The Use of Machine Learning Methods to Study Markers of Atherosclerosis of the Great Arteries. Informacionnye tehnologii. 26(1). P. 46–55. Available from: doi: 10.17587/it.26.46-55
11. Johnson A., Pollard T., Shen L., Lehman L., Feng M., Ghassemi M., Moody B., Szolovits P., Anthony Celi L. and Mark R. (2016) MIMIC-III, a freely accessible critical care database. Scientific Data. 3(1). Available from: doi: 10.1038/sdata.2016.35
12. Dai Z., Liu S., Wu J., Li M., Liu J. and Li K. (2020) Analysis of adult disease characteristics and mortality on MIMIC-III. PLOS ONE. 15(4). e0232176. Available from: doi: 10.1371/journal.pone.0232176
13. Pearson K. (1901) LIII. On lines and planes of closest fit to systems of points in space. The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science. 2(11). P. 559-572. Available from: doi: 10.1080/14786440109462720
14. Reynolds A., Richards G. and Rayward-Smith V. (2004). The Application of K-Medoids and PAM to the Clustering of Rules. Lecture Notes in Computer Science. P. 173–178. Available from: doi:10.1007/978-3-540-28651-6_25
15. Yan J., Linn K., Powers B., Zhu J., Jain S., Kowalski J. and Navathe A. (2018) Applying Machine Learning Algorithms to Segment High-Cost Patient Populations. Journal of General Internal Medicine. 34(2). P. 211–217. Available from: doi:10.1007/s11606-018-4760-8
16. Zhang Q. and Couloigner I. (2005) A New and Efficient K-Medoid Algorithm for Spatial Clustering. Computational Science and Its Applications – ICCSA 2005. P. 181–189. Available from: doi:10.1007/11424857_20
17. Arthur D and Vassilvitskii S. (2007) K-Means++: The Advantages of Careful Seeding. Proc. of the Annu. ACM-SIAM Symp. on Discrete Algorithms. P. 1027–1035. Available from: doi: 10.1145/1283383.1283494
18. Van der Maaten L. and Hinton G. (2011) Visualizing non-metric similarities in multiple maps. Machine Learning. 87(1). P. 33–55.