Сравнительный анализ процедур кластеризации для обнаружения аномалий показателей, характеризующих функционирование контактной сети железных дорог
Аннотация
В данной статье рассматривается актуальная задача обнаружения аномалий в работе оборудования и её решение методами кластеризации на примере анализа работы оборудования в железнодорожной области. Приводится описание различных стратегий обслуживания и выделяется проактивная стратегия обслуживания в качестве наиболее перспективной. Рассматриваются основные компоненты и задачи системы проактивной стратегии обслуживания в применении к железнодорожному сектору. Подробно рассматривается модуль диагностики и ставится задача обнаружения аномалий на примере значений выборки электрических параметров, характеризующих функционирование контактной сети. Предполагается, что исходными данными для задачи обнаружения аномалий являются временные ряды значений электрических сигналов. Для предварительной обработки данных выбраны методы спектрального анализа: оценка спектральной плотности мощности, и используется метрика, основанная на периодограмме. Для обработки данных используется метод временного окна. Производится сравнение работы метода опорных векторов и метода кластеризации К-средних на тестовых данных и оценивается доля правильных ответов. Были подобраны оптимальные параметры процедур.
Скачивания
Литература
2. Railway Technical Strategy Europe 2019. Paris, UIC Communications Department ETF, 2019. 24 p.
3. Bezuglov A. E., Kislitsyna O. A. Key performance indicators for equipment maintenance and repair. Russian Journal of Innovation Economics. 2018. V. 20, No. 3. P. 82–89. DOI
4. Fraga-Lamas P., Fernández-Caramés T., Castedo L. Towards the Internet of Smart Trains: A Review on Industrial IoT Connected Railway. Sensors. Bazel, 2017. V. 17, A. 1457. DOI
5. Brahimi M., Medjaher K., Leouatni M., Zerhouni N. Development of a prognostics and health management system for the railway infrastructure — Review and methodology. Prognostics and System Health Management Conference (PHM-Chengdu). Chengdu, 2016. P. 1–8. DOI
6. Kreyszig E. Advanced Engineering Mathematics. 10th edition. John Wiley & Sons Inc, 2018. 1280 p. DOI
7. Sheriff M. Z. Improved Fault Detection and Process Safety Using Multiscale Shewhart Charts. Journal of Chemical Engineering & Process Technology. 2017. V. 2, No. 18. P. 1–16. DOI
8. Johnson M. J, Willsky A. S. Bayesian Non-parametric Hidden Semi-Markov Models. Journal of Machine Learning Research. 2013. V. 1, No 14. P. 673–701. Available at: URL
9. Aggarwal C. C. Outlier Analysis. 2d edition. New York, Springer International Publishing, 2013. 466 p. DOI
10. Schölkopf B. [et al] Estimating the Support of a High-dimensional Distribution. Neural Computation. 2001. V. 7, No 13. P. 1443 1471. DOI
11. Rousseeuw P. J., Van Driessen K. A Fast Algorithm for the Minimum Covariance Determinant Estimator. Technometrics. 1999. V. 3, No. 41. P. 212–223. DOI
12. Golovina A. M., D’yakonov A. G. Anomaly Detection in Mechanisms Using Machine Learning. Proceedings of the 19th International Conference on Data Analytics and Management in Data Intensive Domains. Moscow State University, Moscow, Russia, October 10–13, 2017. P. 389–396. URL
13. Aggarwal C. C., Sathe S. Theoretical foundations and algorithms for outlier ensembles. ACM SIGKDD Explorations Newsletter. 2015. V. 1, No 17. P. 24–47. DOI
14. Aydin I, Celebi S., Barmada S., Tucci M. Fuzzy integral-based multi-sensor fusion for arc detection in the pantograph-catenary system. Proceedings of the Institution of Mechanical Engineers, Part F: Journal of Rail and Rapid Transit. 2016. V. 232. P. 159 170. DOI
15. Li K., Chen Z., Zhang Y. Z., Wang Y. [et al] Arc fault detection based on cluster analysis and electromagnetic radiation. Electric Machines and Control. 2018. V. 22. P. 94–101. DOI
16. Aydin I., Yaman O., Karakose M., Celebi S. Particle Swarm Based Arc Detection on Time Series in Pantograph-Catenary System. NISTA 2014 – IEEE International Symposium on Innovations in Intelligent Systems and Applications, Proceedings. 2014. P. 344–349. DOI
17. Huang S., Yu L., Zhang F., Zhu W., Guo Q. Cluster Analysis Based Arc Detection in Pantograph-Catenary System. Journal of Advanced Transportation. 2018. V. 5. P. 1–12. DOI
18. Nazarov N. S., Nazarov O. N. Particular digital methods of spectrum analysis of railway rolling stock traction current. Actual issues of railway transport work improvements: interuni-versity collection of academic works. Moscow, RUT (MIIT), 2013. P. 88-100
19. Brovkin V. E. Analysis of types of voltage signal corruptions in catenary system AC 25 kV. Student’s : online science journal. 2019. V. 50, No. 6. URL
20. Madisetti V., Williams D. Handbook of Digital Signal Processing. Boka Raton, CRC Press, 1999. 1760 p. DOI
21. Caiado J., Crato N., Peña D. A periodogram-based metric for time series classification. Computational Statistics & Data Analysis. 2006. V. 50. P. 2668–2684. DOI
22. Chandola V, Banerjee A., Kumar V. Anomaly Detection: A Survey. ACM Computing Surveys. 2009. V. 41, No. 3, A. 15. P 8. DOI
23. Burges C. J. C. A tutorial on support vector machines for pattern recognition. Data Mining and Knowledge Discovery. 1998. V. 2, No. 2. P. 121–167. DOI
24. Liu F. T., Tony T. K. M., Zhou Z. H. Isolation Forest. Proc. of the 2008 Eighth IEEE Int. Conf. on Data Mining. 2008. P. 413-422. DOI
25. Dr. Andrew Ng. Support Vector Machines. Stanford, CS229, Machine Learning, Lecture Notes. 2012. DOI
26. Vorontsov K. V. Metrical classification algorithms and mathematical methods of training on precedents. Lecture Notes. URL
27. Jain A., Murty M., Flynn P. Data Clustering: A Review. ACM Computing Surveys. 1999. V. 31, No. 3. P. 264–323. DOI
28. Bezdek J. C, Pal N. R. Cluster Validation with generalized Dunn’s indices. Proc. 1995 Second New Zealand International Two Stream Conference on Artificial Neural Networks and Expert Systems. 1995. P. 190–193. DOI
29. Shenoy U. J., Sheshadri K. G., Parthasarathy K., Khincha H. P. MATLAB/PSB based modeling and simulation of 25 kV AC railway traction system - a particular reference to loading and fault conditions. TENCON 2004. 2004 IEEE Region 10 Conference. 2004. V. 3. P. 508–511. DOI
- Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).