Нейронные сети lstm и gru в приложении к задаче многоклассовой классификации текстовых постов пользователей социальных сетей

Авторы

  • Валерий Дмитриевич Олисеенко Санкт-Петербургский Федеральный исследовательский центр Российской академии наук https://orcid.org/0000-0002-3479-0085 (unauthenticated)
  • Максим Викторович Абрамов Санкт-Петербургский Федеральный исследовательский центр Российской академии наук, Санкт-Петербургский государственный университет https://orcid.org/0000-0002-5476-3025 (unauthenticated)
  • Александр Львович Тулупьев Санкт-Петербургский Федеральный исследовательский центр Российской академии наук, Санкт-Петербургский государственный университет https://orcid.org/0000-0003-1814-4646 (unauthenticated)

DOI:

https://doi.org/10.17308/sait.2021.4/3803

Ключевые слова:

информационная безопасность, социальные сети, социоинженерные атаки, многоклассовая классификация текста, искусственный интеллект, наука о данных, нейронные сети

Аннотация

В данной статье рассмотрены две архитектуры нейронных сетей глубинного обучения — long short-term memory (LSTM) и gated recurrent units (GRU). Данные модели предлагается применить к задаче многоклассовой классификации постов пользователей социальных сетей, при этом результаты классификации используются для построения эмпирического распределения постов пользователя между классами, которое, в свою очередь, применяется в частичной автоматизации процесса оценки степени выраженности психологических особенностей пользователей. Целью исследования является повышение точности многоклассовой классификации постов пользователей посредством разработки и внедрения новых моделей второго уровня иерархического классификатора. Теоретическая значимость исследования заключается в построении новых более точных моделей классификации, которые лягут в основу моделей оценки выраженности личностных особенностей пользователей. Практическая значимость заключается в улучшении автоматизированной системы классификации постов, которая дополнит существующий прототип программы для анализа защищенности пользователей от социоинженерных атак. Новизна результата заключается в создании нового способа решения актуальной задачи автоматизированной классификации постов, позволяющего достигать большей точности классификации по отношению к существующим ранее способам. Лучший результат классификации показала модель на основе архитектуры LSTM (F1-micro 0.766, F1-macro 0.734, Accuracy 0.793).

Биографии авторов

  • Валерий Дмитриевич Олисеенко, Санкт-Петербургский Федеральный исследовательский центр Российской академии наук

    младший научный сотрудник лаборатории теоретических и междисциплинарных проблем информатики, Федеральное государственное бюджетное учреждение науки «Санкт-Петербургский Федеральный исследовательский центр Российской академии наук»

  • Максим Викторович Абрамов, Санкт-Петербургский Федеральный исследовательский центр Российской академии наук, Санкт-Петербургский государственный университет

    канд. техн. наук, старший научный сотрудник, руководитель лаборатории теоретических и междисциплинарных проблем информатики, Федеральное государственное бюджетное учреждение науки «Санкт-Петербургский Федеральный исследовательский центр Российской академии наук»; доцент кафедры информатики, Федеральное государственное бюджетное образовательное учреждение высшего образования «Санкт-Петербургский государственный университет»

  • Александр Львович Тулупьев , Санкт-Петербургский Федеральный исследовательский центр Российской академии наук, Санкт-Петербургский государственный университет

    д-р физ.-мат. наук, профессор, профессор кафедры информатики, Федеральное государственное бюджетное образовательное учреждение высшего образования «Санкт-Петербургский государственный университет»; главный научный сотрудник лаборатории теоретических и междисциплинарных проблем информатики, Федеральное государственное бюджетное учреждение науки «Санкт-Петербургский Федеральный исследовательский центр Российской академии наук».

Библиографические ссылки

Опубликован

2021-12-18

Выпуск

Раздел

Компьютерная лингвистика и обработка естественного языка

Как цитировать

Нейронные сети lstm и gru в приложении к задаче многоклассовой классификации текстовых постов пользователей социальных сетей. (2021). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 4, 130-141. https://doi.org/10.17308/sait.2021.4/3803

Наиболее читаемые статьи этого автора (авторов)