Инструменты повышения эффективности численных алгоритмов обучения структуры динамических байесовских сетей
Аннотация
Модели динамических байесовских сетей используются для описания процессов, протекающих в условиях риска и неопределенности, случайный характер имеют не только вершины графа сети, но связи между вершинами. Для определения наличия причинно-следственных связей и их направленности применяют специальные экспертные и статистические методы обучения структуры и параметров сети. При использовании экспертных методов построения байесовских сетей структуру графа задает эксперт на основании своего опыта в исследуемой области, и тогда, обучаются только параметры сети, соответствующие условно-вероятностным распределениям вершин сети. Не всегда эксперт может правильно определить причинно-следственные связи между вершинами сети и их направленность. Достаточно эффективными являются формализованные процедуры обучения структуры и параметров сети. Формализованные методы обучения структуры сети включают этап определения зависимости между вершинами сети и этап определения направленности связей. На этапе определения направленности исследование носит локальный характер и подразумевает решение целого ряда оптимизационных задач. Как правило, в качестве алгоритмов обучения динамических байесовских сетей применяются численные оптимизационные алгоритмы. В связи с большой размерностью решаемых задач, эффективность процедур обучения динамических байесовских сетей зависит от эффективности используемых численных алгоритмов. Достаточно часто применяются численные алгоритмы, построенные на основе Ньютоновского подхода. В данной статье описано применение различных инструментов повышения эффективности Ньютоновских алгоритмов для решения задач обучения структуры динамических байесовских сетей. Применение методов Бройдена, Девидона-Флетчера-Пауэлла и Бройдена-Флетчера-Гольдфарба-Шанно позволяет существенно повысить эффективность алгоритмов, а также дает возможность использовать распараллеливание отдельных блоков.
Скачивания
Литература
2. Вержбицкий, В. М. Численные методы (линейная алгебра и нелинейные уравнения) / В. М. Вержбицкий. – М. : Оникс 21 век, 2005. – 432 с.
3. Грот, М. Д. Оптимальные статистические решения / М. Д. Грот. – М. : Мир, 1974. – 491 с.
4. Магнус, Я. Р. Матричное дифференциальное исчисление с приложениями к статистике и эконометрике / Я. Р. Магнус, Х. Ней-деккер. – М. : Физматлит., 2002. – 496 с.
5. Фишер Р. А. Статистические методы для исследователей / Р. А. Фишер. – М. : Гостатизд, 1958. – 267 с.
6. Рао, С. Р. Линейные статистические методы и их применение / С. Р. Рао – М. : Наука, 1968. – 548 с.
7. Leman, E. L. Selected works by E. L. Leman / E. L. Leman. – New York : Springer, 2012. – 1109 p.
8. Korb, K. B. Bayesian Artificial Intelligence / K. B. Korb, A. E. Nicholson. – Boca Raton : CRC Press, 2004. – 491 p.
9. Турчак, Л. И. Основы численных методов / Л. И. Турчак, П. В. Плотников. – М. : Физматлит, 2003. – 304 с.
10. Wolfe, P. Convergence conditions for ascent methods / P. Wolfe // Siam Review, 1969. – Vol. 11, No. 2. – P. 226–235.
11. Nocedal, J. Numerical optimization / J. Nocedal, S.J. Wright. – N.Y. : Springer, 1999. – 634 p.
12. Кендалл, М. Статистические выводы и связи / М. Кендалл, А. Стюарт. – М. : Наука, 1973. – 878 с.
13. Турчак, Л. И. Основы численных методов / Л. И. Турчак, П. В. Плотников. – М. : Физматлит, 2003. – 304 с.
- Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).