Исследование и сравнительный анализ методов оптимизации, используемых при обучении нейронных сетей

Ирина Леонидовна Каширина; Мария Владимировна Демченко

doi:10.17308/sait.2018.4/1262

Исследование и сравнительный анализ методов оптимизации, используемых при обучении нейронных сетей

Авторы

Ирина Леонидовна Каширина Воронежский государственный университет
Мария Владимировна Демченко Воронежский государственный университет

DOI:

https://doi.org/10.17308/sait.2018.4/1262

Ключевые слова:

методы оптимизации, нейронные сети, метод градиентного спуска, стохастический градиент, квазиньютоновские методы, целевая функция ошибки

Аннотация

Современные методы глубокого обучения нейронных сетей, по существу, заключаются в нахождении минимума некоторой непрерывной функции ошибки. В последние годы были предложены различные алгоритмы оптимизации, которые используют разные подходы для обновления параметров модели. Данная статья посвящена анализу наиболее распространенных методов оптимизации, применяющихся в задачах обучения нейронных сетей и формированию на основе выявленных свойств рекомендаций по выбору алгоритма для настройки нейронных сетей на различных наборах данных. В процессе анализа были рассмотрены различные реализации метода градиентного спуска, импульсные методы, адаптивные методы, квазиньютоновские методы, обобщены проблемы их использования, а также выявлены основные преимущества каждого из методов.

Биографии авторов

Ирина Леонидовна Каширина, Воронежский государственный университет

д-р техн. наук, профессор кафедры математических методов исследования операций факультета ПММ Воронежского государственного университета
Мария Владимировна Демченко, Воронежский государственный университет

аспирант факультета ПММ Воронежского государственного университета

Библиографические ссылки

Загрузки

Опубликован

2018-10-30

Выпуск

№ 4 (2018): Октябрь - Декабрь

Раздел

Интеллектуальные информационные системы

Лицензия

Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).

Как цитировать

Исследование и сравнительный анализ методов оптимизации, используемых при обучении нейронных сетей. (2018). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 4, 123-132. https://doi.org/10.17308/sait.2018.4/1262