Алгоритм классификации псевдослучайных последовательностей

Александр Васильевич Козачок; Андрей Андреевич Спирин

doi:10.17308/sait.2020.1/2595

Алгоритм классификации псевдослучайных последовательностей

Авторы

Александр Васильевич Козачок Академия ФСО России https://orcid.org/0000-0002-6501-2008 (unauthenticated)
Андрей Андреевич Спирин Академия ФСО России https://orcid.org/0000-0002-7231-5728 (unauthenticated)

DOI:

https://doi.org/10.17308/sait.2020.1/2595

Ключевые слова:

статистический анализ данных, машинное обучение, классификация бинарных последовательностей, DLP системы, защита информации от утечки

Аннотация

В последнее время увеличилось количество утечек информации, произошедших по вине внутренних нарушителей, одной из возможных причин может являться не способность современных DLP систем противостоять утечкам информации в зашифрованном или сжатом виде. Был предложен алгоритм классификации последовательностей, сформированных алгоритмами шифрования, сжатия и генераторами псевдослучайных чисел. Для решения задачи классификации предлагается использовать методы машинного обучения на основе алгоритма построения дерева решений. В качестве признакового пространства использовался массив частот встречаемости двоичных подпоследовательностей длины N бит. При построении признакового пространства не использовались заголовки файлов или какая-либо другая контекстная информация. Был обоснован выбор гиперпараметров классификатора. Представленный алгоритм показал точность классификации указанных в работе последовательностей 0.98. Представленный алгоритм может быть реализован в DLP системах для предотвращения передачи информации в зашифрованном или сжатом виде.

Биографии авторов

Александр Васильевич Козачок, Академия ФСО России

д-р техн. наук сотрудник, Академия ФСО России
Андрей Андреевич Спирин, Академия ФСО России

сотрудник, Академия ФСО России

Библиографические ссылки

Загрузки

Опубликован

2020-03-24

Выпуск

№ 1 (2020): Январь - Март

Раздел

Информационная безопасность

Лицензия

Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).

Как цитировать

Алгоритм классификации псевдослучайных последовательностей. (2020). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 1, 87-98. https://doi.org/10.17308/sait.2020.1/2595