Если анализируется одновременное влияние двух и более различных факторов на результаты наблюдений, то используется многофакторный дисперсионный анализ. Например, двухфакторная модель нам потребуется, если мы будем строить модель объяснения различий в средних доходов респондентов не только с учетом места проживания респондента, но и с учетом пола респондента.
Пусть мы исследуем влияние на величину двух факторов A и B, имеющих, соответственно и уровней. В двухфакторной модели дисперсионного анализа обычно исходят из следующей модели порождения данных:
,
где: - l-ое наблюдаемое значение отклика для i-го уровня фактора A и j-го уровня фактора B;
- среднее значение отклика по всей совокупности (генеральное среднее);
- среднее значение отклика для i-го уровня фактора A и j-го уровня фактора B;
- главный эффект i-го уровня фактора A ( - среднее значение отклика для i-го уровня фактора A);
- главный эффект j-го уровня фактора B ( - среднее значение отклика для j-го уровня фактора B);
- эффект взаимодействия i-го уровня фактора A и j-го уровня фактора B;
- независимые случайные величины с математическим ожиданием равным нулю и одинаковой дисперсией .
Заметим, что эффекты , , удовлетворяют условиям: , , , .
Выражение можно представить в виде:
.
Данное соотношение говорит о том, что отклонение наблюдаемого значения отклика складывается из суммы четырех слагаемых: отклонения отклика от среднего значения для i, j-го набора уровней факторов A и B , главных эффектов i-го уровня фактора A и j-го уровня фактора B и эффекта взаимодействия. Что, означает, с учетом указанных выше условий на эффекты, что дисперсия отклика может быть представлена в виде суммы четырех дисперсий, одна из которых характеризует внутригрупповую изменчивость для i, j-го набора уровней факторов A и B, а остальные соответствующие эффекты.
Разложение общей дисперсии на составляющие для выборочных данных обычно записывается в виде равенства сумм квадратов соответствующих отклонений (которое, вообще говоря, справедливо только в случае выполнения условия пропорциональности ):
,
где:
– общая, или полная, сумма квадратов отклонений;
– сумма квадратов отклонений средних по уровням фактора A от общей средней, или сумма квадратов главных эффектов A;
– сумма квадратов отклонений средних по уровням фактора B от общей средней, или сумма квадратов главных эффектов B;
– сумма квадратов взаимодействия эффектов A и B;
– остаточная сумма квадратов отклонений.
Число степеней свободы сумм квадратов и равно соответственно и .
Число степеней свободы сумм квадратов взаимодействия эффектов равно .
Число степеней свободы сумм квадратов остатков равно .
Соответственно средние суммы квадратов будут равны:
, , , .
Поскольку двухфакторная модель учитывает различные эффекты влияния факторов, то и статистический анализ для двухфакторной модели предполагает проверку гипотез о значимости различных эффектов. В качестве статистик критериев проверки гипотез о значимости соответствующих эффектов используются отношения средней суммы квадратов эффектов к средней сумме квадратов остатков. При условии истинности «эффект незначим» и нормальном распределении остатков данные статистики имеют распределение Фишера с параметрами степеней свободы, определяемыми числами степеней свободы соответствующих сумм, участвующих в отношении. В табл. 1 приведены основные рассматриваемые гипотезы, статистики критериев для проверки данных гипотез и соответствующие числа степеней свободы данных статистик.
Табл. 1. Статистики для проверки гипотез двухфакторного дисперсионного анализа
Основная гипотеза:
|
Все
|
Все
|
Все
|
Статистика критерия
|
|
|
|
Числа степеней
свободы
|
|
|
|
Если наблюдаемое значение статистики , где - критическая точка распределения Фишера уровня (или квантиль уровня ) с числом степеней свободы и , то нулевая гипотеза отклоняется и считается, что средние для различных уровней фактора значимо различаются.
Do'stlaringiz bilan baham: |