Модели глубокого обучения для синтеза изображений с включением атмосферных осадков с целью решения задач компьютерного зрения в различных погодных условиях

Авторы

DOI:

https://doi.org/10.17308/sait/1995-5499/2025/2/89-104

Ключевые слова:

генерация изображений, синтез изображений, стилизация изображений, обработка изображений в различных погодных условиях, нейронные сети, трансформеры, аугментация данных

Аннотация

Проводится анализ известных и исследование новых алгоритмов генерации изображений реальных сцен в условиях атмосферных осадков с целью их аугментации и стилизации. Отмечается, что генерация изображений с внесением преднамеренных искажений в виде атмосферных осадков на основе классических (эвристических) алгоритмов имеет недостатки, связанные с возможным нарушением структуры получаемых изображений и частичной потери реалистичности. Современный подход, позволяющий обойти эту проблему, основан на обучении глубоких нейронных сетей для конкретной задачи. Однако такие решения часто теряют в обобщающей способности, достаточно сложны, а их применение связано с большими вычислительными затратами. В настоящей работе предлагается новый, относительно простой алгоритм включения в исходное изображение артефактов в виде атмосферных осадков на основе использования модели двухвходового трансформера. Предложенная модель обеспечивает извлечение искажений в виде атмосферных осадков из одного изображения и их внесение в другое при обработке и аугментации датасетов изображений реальных сцен применительно к различным погодным условиям. Проводится исследование архитектуры модели на оптимальность параметров, определяется количество слоёв нейронной сети, принцип формирования карт внимания. Демонстрируется возможность аугментации данных для задач детектирования объектов, сегментации и восстановления изображений. Показано, что синтезированные таким образом изображения позволяют решить проблему нехватки данных при обучении нейронных сетей и уменьшают их предвзятость на этапе тестирования. Установлено, что предложенная модель глубокого обучения может быть применена для любой области, где имеется пара изображений: оригинал и шаблон. В качестве шаблона выбирались любые фотографические изображения, содержащие разнообразные искажения, помехи или атмосферные осадки. На примере задачи восстановления изображений показано, что, имея только зашумлённые изображения, можно выделить на них необходимые искажения и перенести их на оригинал.

Биографии авторов

  • Никита Игоревич Бережнов, Воронежский государственный университет

    аспирант кафедры технологий обработки и защиты информации, факультет компьютерных наук, Воронежский государственный университет

  • Александр Анатольевич Сирота, Воронежский государственный университет

    д-р техн. наук, проф., заведующий кафедрой технологий обработки и защиты информации, факультет компьютерных наук, Воронежский государственный университет

Библиографические ссылки

Загрузки

Опубликован

2025-09-02

Выпуск

Раздел

Интеллектуальные системы, анализ данных и машинное обучение

Как цитировать

Модели глубокого обучения для синтеза изображений с включением атмосферных осадков с целью решения задач компьютерного зрения в различных погодных условиях. (2025). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 2, 89-104. https://doi.org/10.17308/sait/1995-5499/2025/2/89-104

Наиболее читаемые статьи этого автора (авторов)

<< < 1 2