Критерий Краскела — Уоллиса (непараметри-
ческий однофакторный анализ для произвольных
альтернатив). Этот критерий применяется тогда, ког-
да необходимо сравнить несколько независимых вы-
борок метрических или порядковых данных, рас-
Математические методы в психологии
пределения которых непрерывны и являются неиз-
вестными. Цель сравнения — выяснение однородно-
сти выборок, т. е. совпадения их распределений.
Пусть имеется к выборок. Размер каждой вы-
борки равен
где j— номер выборки, который из-
меняется от 1 до к. Объединим данные всех выбо-
рок и проранжируем их (например, от меньшего к
большему). Полученные ранги занесем в таблицу
вместо соответствующих им выборочных значений,
как показано на рис. 27.
27
В таблице
рис. 27
— ранг
значения j-й
выборки,
— размер j-й выборки. Очевидно, что об-
щее число значений во всех к выборках N =
Рассчитаем средний ранг для каждой выборки
формуле:
При выполнении
Т. е. при совпадении рас-
пределений всех выборок, средний ранг R любой вы-
борки не должен сильно отличаться от среднего ран-
га объединения всех выборочных значений, который
равен (N+l)/2.
В качестве меры отклонения средних рангов выбо-
рок от среднего ранга объединения выборочных зна-
чений используется статистика Краскела — Уоллиса:
179
Глава 4
12
Сомножитель
после знака суммы в формуле
(3.4.4.1) позволяет учесть объем каждой выборки. Мно-
житель 12/N(N+ 1) перед знаком суммы обеспечивает
асимптотическую сходимость распределения статисти-
ки Н к распределению хи-квадрат с к-1 степенью сво-
боды при увеличении N.
При расчетах удобнее пользоваться другой фор-
мулой, описывающей статистику Краскела — Уолли-
са, которая легко выводится из формулы (3.4.4.1):
Для небольшого количества выборок, каждая из
которых имеет небольшой размер, существуют точные
таблицы распределения статистики Н (Ликеш И., Ля-
га Й., 1985, с. 307). Для выборок, чьи размеры выходят
за пределы этих таблиц, в качестве приближенного
распределения статистики Н используются таблицы
распределения хи-квадрат с
степенью свободы
(Ликеш И., Ляга
1985, с. 76).
Зададим уровень значимости а. Для отклонения
об
однородности выборок на уровне значимости а, критичес-
кие значения статистики Н должны быть неправдоподоб-
но большими, т. е. удовлетворять условию
где
— квантиль распределения статистики Н уровня -а.
Это значение является границей критической области, оно
берется из таблиц (Ликеш И.,
1985, с. 307). Если
рассчитанная по формуле (3.4.4.1) или (3.4.4.2) статистика
то
об однородности выборок отклоняется, в
противном случае принимается.
При больших объемах выборок нулевая гипотеза
отвергается, если H
v
,]-a>
r
A
e
X
v
\-a ~ квантиль уров-
ня 1-а распределения хи-квадрат с числом степеней
Do'stlaringiz bilan baham: |