Выявление аномальных значений в статистических панелях

Ключевые слова: анализ данных, статистические панели, пространственная выборка, динамический ряд, статистические показатели, аномальные значения

Аннотация

Данная статья посвещена решению задачи исследования данных, значения которых представлены в виде статистических пространственно-временных панелей с точечными аномальными изменениями значений, которые могут возникать например, вследствие влияния социально-экономических, внешне и/или внутриполитических факторов (для панелей, описывающих данные правовой статистики), или вследствие влияния чрезвычайных ситуаций природного и техногенного характера (для панелей, описывающих процесс функционирования производственных или хозяйственных объектов или систем). Использование классических математических методов для анализа данных панелей с аномальными значениями данных, как правило, приводит к получению искажённых результатов, не позволяющих, в частности их использование для прогнозирования будущих значений статистических показателей с приемлемой точностью. В связи с этим возникает задача выявления аномальных значений в статистических панелях. Для решения данной задачи разработан метод, основанный на ретроспективном анализе значений показателей, содержащихся в данной панели, и использовании методов корреляционного анализа. При этом делается предположение о том, что появление аномалий приводит к нарушению устоявшихся соотношений между статистическими показателями. Метод предполагает осуществление двух последовательных этапов. Первый этап подразумевает выявления момента или промежутка времени, в котором присутствуют аномальные значения элементов выборки в статистических панелях. На втором этапе производится выявление конкретных элементов, имеющих аномальные значения в данном моменте или интервале времени в статистических панелях. Представленные методы проиллюстрированы примером для данных правовой статистики для Северо-Кавказского федерального круга, который позволил подтвердить информацию об аномальном изменении числа террористических актов в Чеченской Республике в 2011 году.

Скачивания

Данные скачивания пока не доступны.

Биографии авторов

Валерия Олеговна Морозова, Воронежский институт МВД России

адъюнкт 2-го года обучения Воронежского института МВД России

Валерий Владимирович Меньших, Воронежский институт МВД России

д-р физ.-мат. наук, проф., профессор кафедры математики и моделирования систем Воронежского института МВД России

Литература

1. Ratnikova T. A. and Furmanov K. K. Analysis of panel data and data on the duration of states : studies. Manual. Moscow : Publishing House of the Higher School of Economics. (in Russian)
2. Menshikh A. V. (2018) Working with panel data. Public safety, legality and law and order in the III millennium. (4-2). P. 66–70. (in Russian)
3. Danilova O. Yu., Menshikh V. V. and Sinegubov S. V. (2018) Legal statistics: methods and models : textbook. Voronezh : Voronezh Institute of the Ministry of Internal Affairs of Russia. (in Russian)
4. Morozova V. O. (2022) Formation of initial data sampling for models of legal statistics. Bulletin of the Voronezh Institute of the Ministry of Internal Affairs of Russia. (2). P. 87–93. (in Russian)
5. Menshikh V. V. (2021) Identification of anomalies in the dynamic series of legal statistics based on trend research. Criminological Journal. (3). P. 120–122. (in Russian)
6. Morozova V. O. and Menshikh V. V. (2022) Identification and accounting of aperiodic anomalies in dynamic series with cyclic components. Proceedings of the International Scientific Conference «Actual problems of applied mathematics, computer science and mechanics». P. 662–666. (in Russian)
7. Stepanov M. A. (2017) Diagnostics of the state and determination of trends in the development of the industrial system of the region. Modern technologies in science and education STNO 2017. P. 145–149. (in Russian)
8. Kendel M. (1981) Time series. Moscow. (in Russian)
9. Ayvazyan S. A. (1998) Аррlied statistics and essentials of econometrics. Moscow : UNITY. (in Russian)
10. Buchatskaya V. V. (2013) Processing of anomalous values of time series levels as a stage of complex assessment of information in the forecasting subsystem for the situational center. Bulletin of the Adygea State University. P. 105–110.
11. Kendal M. (1976) Multidimensional statistical analysis and time series. Moscow : Nauka. (in Russian)
12. Menshikh A. V. (2015) Models and algorithms for the selection of fire safety measures based on the study of fire statistics arrays : dis. ... candidate of Technical Sciences. Voronezh. 159 p. (in Russian)
13. Information on the state of crime in the Russian Federation for 2012–2022. URL
14. Menshikh A. V. (2013) Forecasting based on the identification of the structure of the time series of fire statistics. Actual problems of safety in the Russian Federation. Materials of the Science Week. P. 154–156. (in Russian)
15. Menshikh V. V. and Morozova V. O. (2021) Computer models of forecasting the criminogenic situation. South Ural Youth School of mathematical modeling. P. 118–122. (in Russian)
16. Menshikh V. V. and Morozova V. O. (2021) The use of linguistic values of indicators in statistical models. Bulletin of the Voronezh Institute of the Ministry of Internal Affairs of Russia. (1). P. 46–53. (in Russian)
17. Menshikh V. and Morozova V. (2021) Models of using qualitative values of statistical indicators in organisational management systems. Proceedings – 2021 3rd International Conference on Control Systems, Mathematical Modeling, Automation and Energy Efficiency, SUMMA 2021. (3). P. 256–260. (in Russian)
Опубликован
2022-11-09
Как цитировать
Морозова, В. О., & Меньших, В. В. (2022). Выявление аномальных значений в статистических панелях. Вестник ВГУ. Серия: Системный анализ и информационные технологии, (3), 55-62. https://doi.org/10.17308/sait/1995-5499/2022/3/55-62
Раздел
Математические методы системного анализа, управления и моделирования

Наиболее читаемые статьи этого автора (авторов)