Исследование и сравнительный анализ методов оптимизации, используемых при обучении нейронных сетей

Авторы

  • Ирина Леонидовна Каширина Воронежский государственный университет image/svg+xml
  • Мария Владимировна Демченко Воронежский государственный университет image/svg+xml

DOI:

https://doi.org/10.17308/sait.2018.4/1262

Ключевые слова:

методы оптимизации, нейронные сети, метод градиентного спуска, стохастический градиент, квазиньютоновские методы, целевая функция ошибки

Аннотация

Современные методы глубокого обучения нейронных сетей, по существу, заключаются в нахождении минимума некоторой непрерывной функции ошибки. В последние годы были предложены различные алгоритмы оптимизации, которые используют разные подходы для обновления параметров модели. Данная статья посвящена анализу наиболее распространенных методов оптимизации, применяющихся в задачах обучения нейронных сетей и формированию на основе выявленных свойств рекомендаций по выбору алгоритма для настройки нейронных сетей на различных наборах данных. В процессе анализа были рассмотрены различные реализации метода градиентного спуска, импульсные методы, адаптивные методы, квазиньютоновские методы, обобщены проблемы их использования, а также выявлены основные преимущества каждого из методов.

Биографии авторов

  • Ирина Леонидовна Каширина, Воронежский государственный университет

    д-р техн. наук, профессор кафедры математических методов исследования операций факультета ПММ Воронежского государственного университета

  • Мария Владимировна Демченко, Воронежский государственный университет

    аспирант факультета ПММ Воронежского государственного университета

Библиографические ссылки

Загрузки

Опубликован

2018-10-30

Выпуск

Раздел

Интеллектуальные информационные системы

Как цитировать

Исследование и сравнительный анализ методов оптимизации, используемых при обучении нейронных сетей. (2018). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 4, 123-132. https://doi.org/10.17308/sait.2018.4/1262

Наиболее читаемые статьи этого автора (авторов)