Кластеризация состояний пациентов для модели назначения схем лечения атеросклероза
Аннотация
В статье предлагается подход к реализации начального этапа решения задачи поиска и назначения оптимальных стратегий лечения пациентов с помощью моделей обучения с подкреплением, состоящего в выделении основных групп состояний пациентов с диагностированным атеросклерозом с использованием кластерного анализа. В качестве исходного набора данных была использована выборка MIMIC-III, содержащая значения клинических, лабораторных, гемодинамических и др. показателей пациентов. Основным методом кластерного анализа в данной работе был выбран метод k-medoids, при этом качество кластеризации оценивалось с помощью силуэтного анализа. Предварительным этапом кластеризации являлось понижение размерности с помощью метода главных компонент (PCA), а визуализация результатов производилась с помощью метода t-SNE. При этом важным этапом данного исследования являлось вычисление оценки тяжести состояния пациента для каждого из выявленных кластеров состояний. Полученные оценки используются для вычисления вознаграждений в модели назначения оптимальных схем лечения с помощью методов обучения с подкреплением, при этом набор полученных кластеров определяет набор состояний окружения. Таким образом, результаты кластеризации позволяют выявить основные закономерности в исходном наборе данных, а также позволяют сформировать основные составляющие модели обучения с подкреплением для назначения оптимальных схем лечения атеросклероза.
Скачивания
Литература
2. Sutton R. (1992) Reinforcement learning. Boston : Kluwer Academic Publishers.
3. Yom-Tov E., Feraru G., Kozdoba M., Mannor S., Tennenholtz M. and Hochberg I. (2017) Encouraging Physical Activity in Patients With Diabetes: Intervention Using a Reinforcement Learning System. Journal of Medical Internet Research. 19(10). e338. Available from: doi: 10.2196/jmir.7994
4. Noori A., Sadrnia M. and Sistani M. (2017) Glucose level control using Temporal Difference methods. 2017 Iranian Conference on Electrical Engineering (ICEE). P. 895–900. Available from: doi:10.1109/IranianCEE.2017.7985166
5. Komorowski M., Celi L., Badawi O., Gordon A. and Faisal A. (2018) The Artificial Intelligence Clinician learns optimal treatment strategies for sepsis in intensive care. Nature Medicine. 24(11). P. 1716–1720. Available from: doi: 10.1038/s41591-018-0213-5
6. Khokhlov R., Gaydashev A. and Akhmedzhanov N. (2015) Predictors of atherosclerotic lesions of limb arteries according to cardioangiological screening of the adult population. Rational Pharmacotherapy in Cardiology. 11(5). P. 470–476. (In Russian). Available from: doi: 10.20996/1819-6446-2015-11-5-470-476
7. Khokhlov R., Ostroushko N., Gaydashev A., Kirsanov D. and Akhmedzhanov N. (2015) Multi-channel volume sphygmography in cardioangiological screening of the adult population. Rational Pharmacotherapy in Cardiology. 11(4). P. 371–379. (In Russian). Available from: doi: 10.20996/1819-6446-2015-11-4-371-379
8. Demchenko M. and Kashirina I. (2020) The development of the atherosclerosis diagnostic models under conditions of unbalanced classes. Journal of Physics: Conference Series, 1479. 012026. Available from: doi: 10.1088/1742-6596/1479/1/012026
9. Demchenko M. and Kashirina I. (2020) The Use of Machine Learning Methods to the Automated Atherosclerosis Diagnostic and Treatment System Development. In: CEUR Workshop Proceedings. 2790. P. 233–245.
10. Lvovich Y. (2020) The Use of Machine Learning Methods to Study Markers of Atherosclerosis of the Great Arteries. Informacionnye tehnologii. 26(1). P. 46–55. Available from: doi: 10.17587/it.26.46-55
11. Johnson A., Pollard T., Shen L., Lehman L., Feng M., Ghassemi M., Moody B., Szolovits P., Anthony Celi L. and Mark R. (2016) MIMIC-III, a freely accessible critical care database. Scientific Data. 3(1). Available from: doi: 10.1038/sdata.2016.35
12. Dai Z., Liu S., Wu J., Li M., Liu J. and Li K. (2020) Analysis of adult disease characteristics and mortality on MIMIC-III. PLOS ONE. 15(4). e0232176. Available from: doi: 10.1371/journal.pone.0232176
13. Pearson K. (1901) LIII. On lines and planes of closest fit to systems of points in space. The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science. 2(11). P. 559-572. Available from: doi: 10.1080/14786440109462720
14. Reynolds A., Richards G. and Rayward-Smith V. (2004). The Application of K-Medoids and PAM to the Clustering of Rules. Lecture Notes in Computer Science. P. 173–178. Available from: doi:10.1007/978-3-540-28651-6_25
15. Yan J., Linn K., Powers B., Zhu J., Jain S., Kowalski J. and Navathe A. (2018) Applying Machine Learning Algorithms to Segment High-Cost Patient Populations. Journal of General Internal Medicine. 34(2). P. 211–217. Available from: doi:10.1007/s11606-018-4760-8
16. Zhang Q. and Couloigner I. (2005) A New and Efficient K-Medoid Algorithm for Spatial Clustering. Computational Science and Its Applications – ICCSA 2005. P. 181–189. Available from: doi:10.1007/11424857_20
17. Arthur D and Vassilvitskii S. (2007) K-Means++: The Advantages of Careful Seeding. Proc. of the Annu. ACM-SIAM Symp. on Discrete Algorithms. P. 1027–1035. Available from: doi: 10.1145/1283383.1283494
18. Van der Maaten L. and Hinton G. (2011) Visualizing non-metric similarities in multiple maps. Machine Learning. 87(1). P. 33–55.
Copyright (c) 2021 Мария Владиславовна Демченко, Ирина Леонидовна Каширина, Мария Андреевна Фирюлина
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
- Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).