Множественное оценивание параметров линейной регрессионной модели с интервально заданной зависимой переменной

Ключевые слова: регрессионная модель, оценки параметров, интервальное задание данных, вершина многогранника, центр тяжести, компромиссное решение, множество Парето, задача линейного программирования

Аннотация

В работе cформулирована задача определения неизвестных параметров линейной регрессионной модели для случая, когда исходная информация (выборка данных) для предикторных переменных задана традиционно, точечно, а для зависимой переменной — интервально. При этом предполагается, что любая информация, в частности, вероятностного характера, уточняющая «истинное» расположение значений переменной внутри или на границах указанных интервалов, отсутствуют. В общем случае для подобной ситуации множество оценок параметров модели описывается системой линейных неравенств. При ее совместности решением задачи предлагается считать вектор оценок параметров, обеспечивающий максимальную разрешающую способность системы, этот прием часто используется в теории векторной оптимизации. При несовместности системы неравенств поставлена задача поиска квазирешения двухкритериальной задачи линейного программирования, в которой первая компонента соответствует функции потерь для метода наименьших модулей, а вторая — для метода антиробастного оценивания параметров. Эти методы ведут себя по-разному по отношению к выбросам в данных — первый их игнорирует, второй же, напротив, сильно к ним тяготеет. Задачу предлагается решать в три этапа. Вначале путем решения серии задач линейного программирования формируется множество паретовских вершин симплекса, являющегося областью совместности системы линейных неравенств. Затем строится множество Парето как объединение ребер, соединяющих соседние вершины. После этого из всего этого множества выделяется один его представитель (или так называемое компромиссное решение), отражающий конфигурацию этого множества. Решен простой численный пример. Проведено сравнение полученного решения с тем, которое соответствует методу наименьших модулей для осредненных данных.

Скачивания

Данные скачивания пока не доступны.

Биографии авторов

Сергей Иванович Носков, Иркутский государственный университет путей сообщения

д-р техн. наук, проф., профессор кафедры «Информационные системы и защита информации» Иркутского государственного университета путей сообщения

Юрий Маркович Сапожников, Иркутский государственный университет путей сообщения

канд. хим. наук, доцент, доцент кафедры «Таможенное дело и правоведение» Иркутского государственного университета путей сообщения

Литература

1. Changwon Lim (2016) Interval-valued data regression using nonparametric additive models. Journal of the Korean Statistical Society. V. 45. P. 358–370.
2. Qing Zhao, Huiwen Wang and Shanshan Wang (2023) Robust regression for interval-valued data based on midpoints and log-ranges. Advances in Data Analysis and Classification. V. 17. P. 583–621.
3. Cook J. and McDonald J. (2013) Partially Adaptive Estimation of Interval Censored Regression Models. Computational Economics. V. 42. P. 119–131.
4. Chih-Yuan Hsu, Chi-Chung Wen and YiHau Chen (2021) Quantile function regression analysis for interval censored data, with application to salary survey data. Japanese Journal of Statistics and Data Science. V. 4. P. 999–1018.
5. Neto F.A.L. and de Carvalho F.A.T. (2017) Nonlinear regression applied to interval-valued data. Pattern Analysis and Applications. V. 20. P. 809–824.
6. Xinjun Peng, Dongjing Chen, Lingyan Kong and Dong Xu (2015) Interval twin support vector regression algorithm for interval input-output data. International Journal of Machine Learning and Cybernetics. V. 6. P. 719–732.
7. García-Bárzana M., Ramos-Guajardo A.B., Colubi A. and Kontoghiorghes E. J. (2020) Multiple linear regression models for random intervals: a set arithmetic approach. Computational Statistics. V. 35. P. 755–773.
8. Lakeev A. V. and Noskov S. I. (1993) A description of the set of solutions of a linear equation with interval defined operator and righthand side. Doklady Mathematics. T. 47, No 3. P. 518–520.
9. Noskov S. I. (2021) Construction of expert statistical models using incomplete data. T-Comm: Telecommunications and transport. No 6 (15). Р. 33–39.
10. Noskov S. I. (2018) Point characterization of sets of solutions to interval systems of linear algebraic equations. Information technologies and mathematical modeling in the management of complex systems. No 1 (1). Р. 8–13.
11. Tikhonov A. N. and Arsenin V. Ya. (1986) Methods for solving ill-posed problems. M. : Nauka. 288 p.
12. Tikhonov A. N. [et al.] (1983) Regularizing algorithms and a priori information. M. : Nauka. 200 p.
13. Noskov S. I. (2021) Method of mixed estimation of linear regression parameters: application features. Vestnik VGU. Series: System analysis and information technologies. No. 1. P. 126–132.
14. Noskov S. I. (2004) L-set in the multicriteria problem of estimating the parameters of regression equations. Information technologies and problems of mathematical modeling of complex systems. No. 1. P. 64–71.
15. Noskov S. I. and Baenkhaeva A. V. (2016) Multiple estimation of parameters of a linear regression equation. Modern technologies. System analysis. Modeling. No 3(51). Р. 133–140.
16. Yu L. and Zeleny M. (1975) The set of all nondoinated solutions in linear cases and multicriteria simplex method. J. of Math. Anal. and Applic. V. 49, No 2. Р. 430–468.
Опубликован
2024-10-14
Как цитировать
Носков, С. И., & Сапожников, Ю. М. (2024). Множественное оценивание параметров линейной регрессионной модели с интервально заданной зависимой переменной. Вестник ВГУ. Серия: Системный анализ и информационные технологии, (2), 71-79. https://doi.org/10.17308/sait/1995-5499/2024/2/71-79
Раздел
Математические методы системного анализа, управления и моделирования

Наиболее читаемые статьи этого автора (авторов)