Сравнительный анализ методов машинного обучения для решения задачи классификации документов научно-образовательного учреждения

Михаил Николаевич Краснянский; Артем Дмитриевич Обухов; Александра Алексеевна Воякина; Екатерина Михайловна Соломатина

doi:10.17308/sait.2018.3/1245

Сравнительный анализ методов машинного обучения для решения задачи классификации документов научно-образовательного учреждения

Авторы

Михаил Николаевич Краснянский Тамбовский государственный технический университет
Артем Дмитриевич Обухов Тамбовский государственный технический университет
Александра Алексеевна Воякина Тамбовский государственный технический университет
Екатерина Михайловна Соломатина Тамбовский государственный технический университет

DOI:

https://doi.org/10.17308/sait.2018.3/1245

Ключевые слова:

машинное обучение, классификация документов, системы электронного документооборота, алгоритм предварительной обработки данных

Аннотация

В данной статье рассматривается актуальная задача классификации документов с использованием методов машинного обучения в рамках предметной области научно-образовательного учреждения. Анализ разработок в данной области показал, что достаточной теоретической базы по интеграции существующих методов классификации для анализа документов научно-образовательного учреждения не разработано. Поэтому для решения поставленной задачи сформирован алгоритм классификации документов, учитывающий специфику документов рассматриваемой предметной области научно-образовательного учреждения. В статье рассматривается система признаков, используемая для решения задачи комбинированной классификации. Рассмотрен подход предварительной обработки текста, позволяющий при использовании известных методах машинного обучения повысить точность и быстродействие классификации документов.

Биографии авторов

Михаил Николаевич Краснянский, Тамбовский государственный технический университет

профессор, д-р техн. наук, ректор Тамбовского государственного технического университета
Артем Дмитриевич Обухов, Тамбовский государственный технический университет

канд. техн. наук, старший преподаватель кафедры «Компьютерно-интегрированные системы в машиностроении» Тамбовского государственного технического университета
Александра Алексеевна Воякина, Тамбовский государственный технический университет

студент кафедры «Системы автоматизированной поддержки принятия решений» Тамбовского государственного технического университета
Екатерина Михайловна Соломатина, Тамбовский государственный технический университет

студент кафедры «Системы автоматизированной поддержки принятия решений» Тамбовского государственного технического университета

Библиографические ссылки

Загрузки

Опубликован

2018-08-03

Выпуск

№ 3 (2018): Июль - Сентябрь

Раздел

Компьютерная лингвистика и обработка естественного языка

Лицензия

Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).

Как цитировать

Сравнительный анализ методов машинного обучения для решения задачи классификации документов научно-образовательного учреждения. (2018). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 3, 173-182. https://doi.org/10.17308/sait.2018.3/1245