Алгоритмы классификации объектов на изображениях приемной камеры современного фандомата
DOI:
https://doi.org/10.17308/sait/1995-5499/2024/1/114-126Ключевые слова:
обработка изображений, фандоматы, сегментация изображений, машинное обучение, случайный лес, глубокое обучение, перенос обучения, аугментация данных, сверточные нейронные сетиАннотация
В работе рассматривается задача разработки математического и программного обеспечения для анализа изображений в современных фандоматах. В рамках подхода, основанного на применении методов поверхностного машинного обучения, формулируется задача обработки изображений объектов, подлежащих сырьевой переработке в фандомате, как задача сегментации этих изображений с последующей классификацией по форме. Производится обзор и сравнение известных методов сегментации с целью выделения формы объектов и формирования признаков для классификации. В результате сравнения делается выбор в пользу метода активного контура. Предлагается и исследуется относительно простой алгоритм классификации сегментированных объектов на основе «случайного леса». Также предлагается два алгоритма выделения признаков классификации: алгоритм на основе анализа степени заполненности частей сегментированного изображения и алгоритм, вычисляющий свойства области объекта. Как альтернативный подход также описывается метод классификации получаемых изображений в целом, без предварительного выделения признаков, основанный на глубоком обучении. Обсуждается проблема дефицита обучающих данных, приводятся возможные подходы к её решению. Описывается реализация сверточной нейронной сети — классификатора с архитектурой DenseNet, полученная с применением техники переноса обучения. Представлены результаты экспериментов по оценке эффективности рассмотренных алгоритмов, проведенных на предоставленном обучающем наборе. Выбранный метод сегментации, а также оба рассмотренных классификатора продемонстрировали высокий уровень эффективности. Проведено сравнение результатов классификации для алгоритмов на основе поверхностного («случайный лес») и глубокого машинного обучения (сверточная нейронная сеть).
Библиографические ссылки
Загрузки
Опубликован
Выпуск
Раздел
Лицензия
- Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).













