Исследование поведения классических критериев множественных сравнений, на ненормальных неоднородных распределениях, методом Монте-Карло

  • Владимир Николаевич Алдобаев Научно-исследовательский центр токсикологии и гигиенической регламентации биопрепаратов — филиал Государственного научного центра «Институт иммунологии» https://orcid.org/0000-0002-7817-8197
  • Анастасия Дмитриевна Артемьева Филиал «Протвино» государственного университета «Дубна» https://orcid.org/0000-0003-2822-9811
  • Александр Альбертович Масликов Филиал «Протвино» государственного университета «Дубна» https://orcid.org/0000-0002-1495-8506
Ключевые слова: математическая статистика, метод Монте-Карло, множественные сравнения, дисперсионный анализ, тест Краскела — Уоллиса

Аннотация

Традиционные аналитические методы исследования применимости методов множественных сравнений эффективны только при весьма жёстких ограничениях на соответствующие генеральные совокупности. В то же время для решения этого вопроса с успехом можно применять компьютерные симуляции и метод Монте-Карло. Методом Монте-Карло мы симулируем проведение тестов, выполняемых при множественных сравнениях на выборках малого объёма из искаженных (по сравнению с нормальным) распределений. Исследуется возможность применения классических критериев дисперсионного анализа (ANOVA) и непараметрического теста Краскела — Уоллиса для выборок малого объёма с ненормальным распределением и/или неоднородных по дисперсии. В качестве критерия однородности выборок по дисперсиям используется тест Левене. Нормальность (Гауссовость) выборок проверяется с помощью теста Шапиро –Уилка. Для искажения нормальности выборок используются генеральные совокупности, распределенные по хи-квадрат и t-распределению Стьюдента с малым числом степеней свободы. Также ненормальность распределений отслеживается с помощью параметров: эксцесс (коэффициент островершинности) и асимметрия. В качестве генератора псевдослучайных чисел применяется так называемый вихрь Мерсенна реализованный в рамках пакета программ Wolfram Mathematica. Число испытаний для каждого набора параметров доведено до миллиона. Вычисляются эффективные вероятности ошибок 1-го рода и делаются выводы о влиянии негомогенности дисперсий, «ненормальности» эксцесса и асимметрии на эффективность исследуемых критериев. В результате можно сказать, что зачастую нет оснований использовать непараметрические методы вместо параметрических в ущерб мощности соответствующих критериев.

Скачивания

Данные скачивания пока не доступны.

Биографии авторов

Владимир Николаевич Алдобаев, Научно-исследовательский центр токсикологии и гигиенической регламентации биопрепаратов — филиал Государственного научного центра «Институт иммунологии»

канд. биол. наук, начальник отдела аналитической химии и радиобиологии НИЦ ТБП — филиала ФГБУ «ГНЦ Институт иммунологии» ФМБА России

Анастасия Дмитриевна Артемьева, Филиал «Протвино» государственного университета «Дубна»

выпускница (бакалавр) Филиала «Протвино» государственного университета «Дубна», кафедры технической физики по профилю медицинская физика

Александр Альбертович Масликов, Филиал «Протвино» государственного университета «Дубна»

канд. физ.-мат. наук, заведующий комплексной лабораторией физики Филиала «Протвино» государственного университета «Дубна», доцент кафедры общеобразовательных дисциплин, доцент кафедры технической физики

Литература

1. Scheffe G. Dispersion analysis. [Dispersionnyj analiz] (2011). The main editorial office of the physical and mathematical literature of the publishing house «Nauka». 512 p.
2. Lyubishchev A. A. (2012) Dispersion analysis in biology. [Dispersionnyj analiz v biologii]. Publishing house «Book on Demand». 101 p.
3. Tabachnick B. G. (2019) Using Multivariate Statistics. Pearson Education, Inc. 816 р.
4. Lapach S. N., Chubenko A. V., Babich P. N. (2001) Statistical methods in biomedical research using Excel. [Statisticheskie metody v mediko-biologicheskih issledovanijah s ispol’zovaniem Excel]. MORION. 408 p.
5. Matsumoto M. (1998) 623-Dimensionally Equidistributed Uniform Pseudorandom Number Generator. ACM Transactions on Modeling and Computer Simulation 8. No 1. P. 3–30.
6. Nishimura T. (2000) Tables of 64-Bit Mersenne Twisters. ACM Transactions on Modeling and Computer Simulation 10. No 4. P. 348–357. DOI
7. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N., Chimitova E. V. (2011) Statistical data analysis, modeling and investigation of probabilistic patterns. Computer approach. [Statisticheskij analiz dannyh, modelirovanie i issledovanie verojatnostnyh zakonomernostej. Komp’juternyj podhod]. NSTU Publishing House. 888 p.
8. Lemeshko B. Yu. (2021) Criteria for testing hypotheses about homogeneity. [Kriterii proverki gipotez ob odnorodnosti]. INFRA-M. 248 p.
9. Lemeshko B. Yu., Lemeshko S. B. (2008) On the stability and power of the criteria for checking the uniformity of averages. [Ob ustojchivosti i moshhnosti kriteriev proverki odnorodnosti srednih]. «Measuring equipment». No 9. P .23–28.
10. Lemeshko B. Y. (2009) Comparative Analysis of the Power of Goodness-of-Fit Tests for Near Competing Hypotheses. I. The Verification of Simple Hypotheses. Journal of Applied and Industrial Mathematics. Vol. 3, No. 4. P. 462–475. DOI
11. Lemeshko B. Y. (2019) Features of testing statistical hypotheses under Big Data. NSTU publ. P. 122–137.
12. Lemeshko B. Yu. (2019) Criteria for testing statistical hypotheses in the analysis of large samples: problems and their solution. [Kriterii proverki statisticheskih gipotez pri analize bol’shih vyborok: problemy i ih reshenie]. IPC NGU. P. 50–51. DOI
13. Korneev A. A., Krichevets A. N. (2011) Conditions for the applicability of the Student and Mann — Whitney criteria. [Uslovija primenimosti kriteriev St’judenta i Manna — Uitni]. Psychological Journal. V. 32, No 1. P. 97–110.
Опубликован
2021-12-02
Как цитировать
Алдобаев, В. Н., Артемьева, А. Д., & Масликов, А. А. (2021). Исследование поведения классических критериев множественных сравнений, на ненормальных неоднородных распределениях, методом Монте-Карло. Вестник ВГУ. Серия: Системный анализ и информационные технологии, (3), 72-80. https://doi.org/10.17308/sait.2021.3/3737
Раздел
Интеллектуальные системы, анализ данных и машинное обучение