Сравнительный анализ методов машинного обучения для решения задачи классификации документов научно-образовательного учреждения

Авторы

  • Михаил Николаевич Краснянский Тамбовский государственный технический университет image/svg+xml
  • Артем Дмитриевич Обухов Тамбовский государственный технический университет image/svg+xml
  • Александра Алексеевна Воякина Тамбовский государственный технический университет image/svg+xml
  • Екатерина Михайловна Соломатина Тамбовский государственный технический университет image/svg+xml

DOI:

https://doi.org/10.17308/sait.2018.3/1245

Ключевые слова:

машинное обучение, классификация документов, системы электронного документооборота, алгоритм предварительной обработки данных

Аннотация

В данной статье рассматривается актуальная задача классификации документов с использованием методов машинного обучения в рамках предметной области научно-образовательного учреждения. Анализ разработок в данной области показал, что достаточной теоретической базы по интеграции существующих методов классификации для анализа документов научно-образовательного учреждения не разработано. Поэтому для решения поставленной задачи сформирован алгоритм классификации документов, учитывающий специфику документов рассматриваемой предметной области научно-образовательного учреждения. В статье рассматривается система признаков, используемая для решения задачи комбинированной классификации. Рассмотрен подход предварительной обработки текста, позволяющий при использовании известных методах машинного обучения повысить точность и быстродействие классификации документов.

Биографии авторов

  • Михаил Николаевич Краснянский, Тамбовский государственный технический университет

    профессор, д-р техн. наук, ректор Тамбовского государственного технического университета

  • Артем Дмитриевич Обухов, Тамбовский государственный технический университет

    канд. техн. наук, старший преподаватель кафедры «Компьютерно-интегрированные системы в машиностроении» Тамбовского государственного технического университета

  • Александра Алексеевна Воякина, Тамбовский государственный технический университет

    студент кафедры «Системы автоматизированной поддержки принятия решений» Тамбовского государственного технического университета

  • Екатерина Михайловна Соломатина, Тамбовский государственный технический университет

    студент кафедры «Системы автоматизированной поддержки принятия решений» Тамбовского государственного технического университета

Библиографические ссылки

Загрузки

Опубликован

2018-08-03

Выпуск

Раздел

Компьютерная лингвистика и обработка естественного языка

Как цитировать

Сравнительный анализ методов машинного обучения для решения задачи классификации документов научно-образовательного учреждения. (2018). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 3, 173-182. https://doi.org/10.17308/sait.2018.3/1245

Наиболее читаемые статьи этого автора (авторов)