Применение методов удовлетворения табличных ограничений для моделирования рассуждений типа ДСМ
Аннотация
Статья продолжает серию работ, посвященных тематике интеллектуального анализа данных с применением методов вывода на табличных ограничениях. Ранее были представлены авторские методы кластеризации, выявления паттернов требуемого вида, поиска ассоциативных правил. Разработанные методы относятся к методам объяснимого (интерпретируемого) искусственного интеллекта. Недостатки большинства существующих методов интеллектуального анализа данных связаны, в первую очередь, с трудностями гибкого учета и анализа знаний экспертов предметной области, пользовательских ограничений. Обычно для учета каждого типа подобных ограничений требуется довольно трудоемкая модификация базовых методов обучения. В статье развивается подход на основе парадигмы программирования в ограничениях, который свободен от упомянутых недостатков и позволяет гибко организовывать учет и анализ дополнительных условий задачи интеллектуального анализа данных без принципиального изменения схемы её решения. Оригинальность авторского подхода состоит в том, что для представления обучающей выборки предложено использовать особый тип табличных ограничений — сжатые таблицы D-типа, а сами задачи интеллектуального анализа данных предложено решать как задачи удовлетворения табличных ограничений с применением оригинального способа ветвления дерева поиска и авторских правил редукции сжатых таблиц. В представленной работе на примере решения задач бинарной классификации впервые рассматриваются возможности применения авторского подхода для моделирования рассуждений типа ДСМ. В статье рассматривается случай, когда свойства объектов являются атомарными, не имеют внутренней структуры. Задачу генерации ДСМ-гипотез предлагается сводить к поиску частых замкнутых паттернов, причем каждый из паттернов не должен входить как фрагмент во множество контрпримеров. В рамках предлагаемого в статье подхода добавление в задачу дополнительных типов ограничений не только не снижает производительность методов их решения, но и способствует более глубокой редукции пространства поиска за счет применения специализированных методов логического вывода для каждого из типов ограничений.
Скачивания
Литература
2. Bjordal G. [et al] (2020) Solving Satisfaction Problems Using Large-Neighbourhood Search. Proceedings of 26th International Conference on Principles and Practice of Constraint Programming. Louvain-la-Neuve, France. P. 657−672. DOI
3. Finn V. K. (2023) On Empirical Regularities in the JSM Method of Automated Research Support. Automatic Documentation and Mathematical Linguistics. 6(57). P. 362–381. DOI
4. Frost D. and Dechter R. (1994) Deadend driven learning. Proceedings of the National Conference on Artificial Intelligence. Seattle, USA. P. 294–300.
5. Gançarski P. (2020) Constrained Clustering: Current and New Trends. In: Marquis P., Papini O. & Prade H. (eds.) A Guided Tour of Artificial Intelligence Research. Cham, Switzerland, Springer. P. 447–484. DOI
6. Hien A. [et al] (2021) A Relaxation-Based Approach for Mining Diverse Closed Patterns. In: Hutter F. [et al] (eds.) Machine Learning and Knowledge Discovery in Databases. ECML PKDD 2020. Lecture Notes in Computer Science. Cham, Switzerland, Springer. P. 35–54. DOI
7. Kumar V. and Ramana N. V. (2020) Backtracking Search Algorithm based assessment and selection of Optimal Wheeling Transactions under Deregulated Environment. International Journal of Advanced Science and Technology. 7. P. 12745–12754.
8. Lhomme O. (1993) Consistency techniques for numeric CSPs. Proceedings of 13th International Joint Conference on Artificial Intelligence. Chambery, Canada. P. 232–238.
9. Liu X., Niu X. and Fournier-Viger P. (2021) Fast Top-K association rule mining using rule generation property pruning. Applied Intelligence. 51. P. 2077–2093. DOI
10. Li Z. [et al] (2021) Revisiting the efficacy of weak consistencies: a study of forward checking. Science China Information Sciences. 64. DOI
11. Mairy J. B. [et al] (2015) The Smart Table Constraint. In: Michel, L. (eds.) Integration of AI and OR Techniques in Constraint Programming. CPAIOR 2015. Lecture Notes in Computer Science. Cham, Switzerland, Springer. P. 271–287. DOI
12. Nama S. [et al.] (2022) A quantum mutation-based backtracking search algorithm. Artificial Intelligence Review. 55. P. 3019–3073. DOI
13. Song W., Ye W. and Fournier-Viger P. (2022) Mining sequential patterns with flexible constraints from MOOC data. Applied Intelligence. 52. P. 16458–16474. DOI
14. Zuenko A. (2022) Frequent Pattern Discovery as Table Constraint Satisfaction Problem. Proceedings of the Sixth International Scientific Conference “Intelligent Information Technologies for Industry”. Istanbul, Turkey. P. 1–13. DOI
15. Zuenko A. A. (2023) Finding Dependencies in Data Based on methods of Satisfying Table Constraints. Ontology of Developing. 13. P. 392– 404. (in Russian) DOI
16. Zuenko A. A., Fridman O. V. and Zuenko O. N. (2021) Application of Smart-Tables and Estimates of Objective Functions to Reduce the Dimension and Accelerate the Solution of the Constraint Clustering Problem. Bulletin of VSU, series: System analysis and information technologies. 3. P. 81–94. (in Russian) DOI
- Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).