Многокритериальный метод наименьших модулей в регрессионном анализе
Аннотация
В работе дан краткий обзор публикаций по методам построения регрессионных моделей с использованием векторных функций потерь. В частности, рассмотрены подходы с частными функциями потерь, соответствующими методам наименьших квадратов, модулей (МНМ), антиробастного оценивания. Решена задача идентификации параметров линейной регрессионной модели с помощью многокритериального метода наименьших модулей, в котором функция потерь представляет собой вектор, каждая компонента которого (т. е. частная функция потерь) задана на фиксированной заранее подвыборке исходной выборки данных. Предложен вычислительный алгоритм поиска векторов параметров, соответствующих паретовским вершинам многогранника (симплекса), заданного соответствующим МНМ ограничениям с векторной целевой функцией и состоящий в решении серии задач линейного программирования. При этом все множество паретовских оценок параметров может быть сформировано как объединение паретовских граней многогранника, представляющих собой выпуклые комбинации его паретовских вершин. В основу предложенного подхода положена фундаментальная работа Л. Ю и М. Зелены «Множество всех недоминируемых решений в линейном случае и многокритериальный симплекс-метод». Многокритериальный метод наименьших модулей применен для построения линейной регрессионной модели объема погрузки основных видов грузов железнодорожным транспортом. В качестве независимых переменных использованы объемы перевозок автомобильным, морским, трубопроводным и внутренним водным видами транспорта. Исходная выборка была разделена на две непересекающиеся подвыборки. Всего получено 19 паретовских вектора оценок параметров. В изменении значений всех параметров отсутствует не только монотонность, но и любая другая выраженная закономерность, при этом только один параметр не меняет свой положительный знак. Разброс всех параметров достигает высоких значений. Представленный многокритериальный способ оценивания параметров линейной регрессионной модели позволяет отразить тенденции, проявляющиеся на отдельных участках обрабатываемой выборки данных и повышает вариативность при исследовании закономерностей функционирования сложных объектов методами регрессионного анализа.
Скачивания
Литература
2. Wang T., Wu T., Wang P., Xie C., Zou D. (2019) Spatial distribution and changes of permafrost on the Qinghai-Tibet Plateau revealed by statistical models during the period of 1980 to 2010. Science of the Total Environment. No. 650. Р. 661–670.
3. Kamenev G. K. (2016) Multicriteria identification set method. Journal of Computational Mathematics and Mathematical Physics. V. 56, No. 11. Р. 1872–1888.
4. Kamenev G. K. (2017) Multi-criteria method for identification and forecasting. Mathematical modeling. No. 8. P. 29–43.
5. Bazilevsky M. P. (2012) Software and mathematical software for automating the multicriteria choice of regression models: specialty 05.13.18 “Mathematical modeling, numerical methods and software complexes”: dissertation for the degree of candidate of technical sciences / Bazilevsky Mikhail Pavlovich. Irkutsk. 153 p.
6. Kotenko A. P., Sharapova E. A., Bengina P. M. (2015) Multicriteria optimization using systems of linear regression equations. Promising Information Technologies (PIT 2015). Proceedings of the International Scientific and Technical Conference. Samara State Aerospace University named after Academician S. P. Koroleva. Р. 276–278.
7. Kotenko A. P., Pshenina D. A. (2016) Multicriteria optimization based on the identification of systems of regression equations. In: Information technology and nanotechnology (ITNT-2016). materials of the International Conference and Youth School. Samara State Aerospace University named after Academician S. P. Koroleva (National Research University); Institute of Image Processing Systems RAS. Р. 874–876.
8. Bazilevsky M. P. (2018) Multiplicative criterion of determination-autocorrelation in regression analysis. Continuum. Maths. Informatics. Education. No. 2 (10). Р. 23–28.
9. Radchenko S. G. (2016) Status of mathematical models obtained using regression analysis. Mathematical machines and systems. No. 2. P. 138–147.
10. Bazilevsky M. P. (2021) Multi-criteria approach to building models of pair-set linear regression. Bulletin of the Saratov University. New series. Series: Mathematics. Mechanics. Informatics. Vol. 21, No. 1. Р. 88–99.
11. Noskov S. I., Baenkhaeva A. V. (2016) Multiple estimation of the parameters of a linear regression equation. Modern technologies. System analysis. Modeling. No. 3 (51). Р. 133–138.
12. Noskov S. I. (2004) L-set in the multicriteria problem of estimating the parameters of regression equations. Information technologies and problems of mathematical modeling of complex systems. No. 1. P. 64–66.
13. Noskov S. I. (2020) Compromise Pareto estimates of linear regression parameters. Mathematical Modeling. V. 32, No. 11. P. 70–78.
14. Noskov S. I. (2022) Statement of the problem of estimating regression parameters by minimizing the vector loss function given on groups of observations. Information technologies and mathematical modeling in the management of complex systems. No. 3. Р. 58–60.
15. Noskov S. I. (1996) Technology for modeling objects with unstable operation and uncertainty in data. Irkutsk : Oblinformpechat. 320 p.
16. Yu L., Zeleny M. (1975) The set of all nondominated solutions in linear cases and multicriteria simplex method. J. of Math. Anal. and Applic. V. 49. No. 2. P.430–460.
17. Noskov S. I., Khonyakov A. A. (2020) Application of the risk function for modeling economic systems. South Siberian Scientific Bulletin. No. 5 (33). Р. 85–92.
18. State registration certificate for computer programs No. 2021613936 Program for determining Pareto estimates of linear regression parameters using the multicriteria method of least modules / S. I. Noskov, A. A. Khonyakov (Russia); Copyright holder: Federal State Budgetary Educational Institution of Higher Education “Irkutsk State University of Communications” (FG-BOU VO IrGUPS); Application No. 202268031310/28/2022; register date. 11/10/2022.
- Авторы сохраняют за собой авторские права и предоставляют журналу право первой публикации работы, которая по истечении 6 месяцев после публикации автоматически лицензируется на условиях Creative Commons Attribution License , которая позволяет другим распространять данную работу с обязательным сохранением ссылок на авторов оригинальной работы и оригинальную публикацию в этом журнале.
- Авторы имеют право размещать их работу в сети Интернет (например в институтском хранилище или персональном сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению и большему количеству ссылок на данную работу (См. The Effect of Open Access).