Анализ эквивалентности байесовских сетей на основе асимптотических оценок Байеса — Дирихле
Аннотация
Динамические и статические байесовские сети являются эффективным инструментом моделирования стохастических процессов. Области практического внедрения данных моделей существенно расширились за последнее время. Качество их применения при решении практических задач во многом определяется возможностями алгоритмов обучения структуры и вероятностных параметров моделей, позволяющих произвести настройку сети для решения рассматриваемого круга прикладных задач. В алгоритмах определения оптимальной структуры байесовских сетей и верификация алгоритмов настройки их параметров важную роль играют инструменты, основанные на принципах эквивалентности. На базе принципа эквивалентности формируются асимптотические оценки преобразований, получаемых в процессе добавления, изменения или удаления отдельных узлов графа байесовской сети и создается аппарат получения локального априорного распределение для каждого из параметров сети. В данной работе исследуются инструменты оценивания эквивалентности байесовских сетей на основе метрики Байеса — Дирихле, структурного расстояния Хэмминга и Кульбака — Лейблера. Данные инструменты можно применить и к динамическим байесовским сетям, для работы с которыми дополнительно нужно определить структуру модели перехода между временными срезами. В рамках исследования рассматриваются также вопросы эквивалентности априорных распределений вероятностей, формируемых в процессе обучения параметров. В заключительной части работы приведен вычислительный эксперимент, отражающий эффективность применения различных алгоритмов обучения с позиции сравнения их результатов с эквивалентными эталонными байесовскими сетями. Предложенные в работе инструментальные средства позволяют адаптировать статические и динамические байесовские модели для решения практических задач, оптимизируя процессы обучения данных моделей за счет использования принципа эквивалентности графических вероятностных моделей.
Скачивания
Литература
2. Russel S. and Norvig P. (2006) Artificial intelligence a modern approach, second edition. Moscow : Williams (in Russian).
3. Heckerman D. and Geiger D. (1995) Learning discrete Bayesian networks. Machine Learning. (20). P. 197–243.
4. Azarnova T. V., Asnina N. G., Proskurin D. K. and Polukhin P. V. (2017) Formirovanie struktury Bajesovskoj seti processa testirovaniya nadezhnosti informacionnyh system. Vestnik Voronezhskogo gosudarstvennogo tehnicheskogo universiteta. 13 (6). P. 45–51 (in Russian).
5. Pearl J. (2009) Causality: Models, Reasoning and Inference. New York : Cambridge University Press.
6. Pearl J. and Verma T. (1990) Equivalence and Synthesis of Causal. Proc. UAI. P. 220–227.
7. Buntine W. (1991) Theory refinement on Bayesian network. Proc. UAI. P. 52–60.
8. Chickering D. M. (1995) A Transformational Characterization of Equivalent Bayesian Network Structures. Proc. UAI. P. 87–98.
9. Tsamardinos I., Brown L. E. and Aliferis C. F. (2006) The max-min hill-climbing Bayesian network structure learning algorithm. Machine Learning. (65). P. 31–78.
10. Spirtes P., Glymour C. and Sheines R. (2000) Causation, Prediction and Search. Cambridge: MIT Press.
11. Anderson G. and Qiu S. (1997) A Monotonicity Property of the Gamma Function. Proc. AMS. 125(11). P. 3355–3362.
12. Suzuki J. (1995) A Theoretical Analysis of the BDeu Scores in Bayesian Network Structure Learning. Behaviormetrika. 1(1). P. 1–20.
- Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).