Построение вполне интерпретируемых линейных регрессионных моделей с помощью метода последовательного повышения абсолютных вкладов переменных в общую детерминацию

Авторы

DOI:

https://doi.org/10.17308/sait/1995-5499/2022/2/5-16

Ключевые слова:

вполне интерпретируемая линейная регрессия, метод наименьших квадратов, мультиколлинеарность, абсолютные вклады переменных в общую детерминацию, задача частично-булевого линейного программирования, железнодорожные грузоперевозки

Аннотация

Статья посвящена проблеме построения вполне интерпретируемых линейных регрессионных моделей, оцениваемых с помощью метода наименьших квадратов. Линейная регрессия называется вполне интерпретируемой, если знаки её коэффициентов соответствуют физическому смыслу входящих в уравнение факторов, а эффект мультиколлинеарности незначителен. При этом желательно, чтобы модель обладала высоким качеством аппроксимации, а все её коэффициенты были значимы. В статье впервые сформулирована задача частично-булевого линейного программирования для выбора в линейной регрессии оптимального числа информативных регрессоров, знаки коэффициентов при которых согласуются со знаками соответствующих коэффициентов их корреляции с зависимой переменной, а абсолютные вклады переменных в общую детерминацию не меньше заданного числа. Эффективность решения этой задачи обусловлена наличием ограничений на согласованность знаков коэффициентов модели, а ограничения на абсолютные вклады переменных позволяют контролировать эффект мультиколлинеарности. Разработан метод последовательного повышения абсолютных вкладов переменных в общую детерминацию, гарантирующий построение вполне интерпретируемой линейной регрессии. Для решения сформулированных задач разработана программа ВИнтер-1. Сначала с помощью неё на обычном персональном компьютере решалась довольно сложная вычислительная задача, решение которой методом полного перебора требует оценки примерно 16,5 квадриллионов моделей. Программа Винтер-1 справилась с этой задачей примерно за 293 секунды, что подтверждает её эффективность. Помимо этого с помощью ВИнтер-1 была построена вполне интерпретируемая модель грузоперевозок железнодорожного транспорта в Иркутской области.

Биография автора

  • Михаил Павлович Базилевский, Иркутский государственный университет путей сообщения

    канд. техн. наук, доц., доцент кафедры математики Иркутского государственного университета путей сообщения

Библиографические ссылки

Загрузки

Опубликован

2022-09-15

Выпуск

Раздел

Математические методы системного анализа и управления

Как цитировать

Построение вполне интерпретируемых линейных регрессионных моделей с помощью метода последовательного повышения абсолютных вкладов переменных в общую детерминацию. (2022). Вестник ВГУ. Серия: Системный анализ и информационные технологии, 2, 5-16. https://doi.org/10.17308/sait/1995-5499/2022/2/5-16

Наиболее читаемые статьи этого автора (авторов)