Решение задачи классификации объектов на изображении методами компьютерного зрения в различных сферах человеческой деятельности

Авторы

DOI:

https://doi.org/10.17308/sait/1995-5499/2024/3/74-91

Ключевые слова:

компьютерное зрение, нейронные сети, сверточные нейронные сети, классификация, классификация объектов на изображении, анализ изображений, распознавание образов

Аннотация

В данной обзорной статье представлен анализ основных направлений исследований по теме классификация объектов на изображении методами компьютерного зрения. Методы компьютерного зрения позволяют автоматизировать процесс выделения семантического смысла из изображений. Под классификацией объектов на изображении понимается локализация объектов, интересующих исследователя, и соотнесение их с определенным классом. Актуальность данной темы закреплена в государственной программе: национальная стратегия развития искусственного интеллекта на период до 2030 года. Так же в статье приведена статистика публикационной активности научных авторов по теме «компьютерное зрение», которая показывает актуальность данного направления. Работа имеет следующую структуру: во введении статьи приведены различные статистики, отражающие актуальность темы. Далее приведен обзор научных исследований посвященных решению прикладных аспектов задачи классификации объектов на изображении в различных областях человеческой деятельности. Основной упор сделан на следующие прикладные области: медицина, промышленность, безопасность, транспорт и военное дело. Далее приведен анализ методов, которые используются для решения задачи классификации объектов на изображении. Автор выделяет две группы методов: классические и нейросетевые методы. Под классическими алгоритмами и методами понимается подход к решению задачи классификации объектов на изображении, в котором не используются искусственные нейронные сети. Выводы. Тема исследования на сегодня является актуальной, что подтверждено статистикой и государственными программами. Для классических методов выявлены следующие недостатки: для каждой новой прикладной задачи требуется построение алгоритма ее решения, трудоемкость выделения значимых признаков и неустойчивость при работе с определенными видами данных. Для нейросетевых методов основным недостатком является зависимость конечной модели от качества набора данных, на котором она обучается.

Биография автора

  • Алена Ивановна Либерман, Саратовский государственный технический университет имени Гагарина Ю. А.

    аспирант 4-го года обучения кафедры Прикладные информационные технологии Саратовского государственного технического университета имени Гагарина Ю. А.

Библиографические ссылки

Загрузки

Опубликован

2024-11-14

Выпуск

Раздел

Интеллектуальные системы, анализ данных и машинное обучение

Как цитировать

Решение задачи классификации объектов на изображении методами компьютерного зрения в различных сферах человеческой деятельности. (2024). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 3, 74-91. https://doi.org/10.17308/sait/1995-5499/2024/3/74-91