Математические методы в психологии
их градаций равняется произведению
появления каждой градации в отдельности.
Если признать, что при больших п относитель-
ная частота встречаемости события стремится к его
вероятности, т. е.:
тогда условие независимости признаков А и В мож-
но записать следующим образом:
В этом случае
обычно называют наблюдаемой, или
эмпирической, частотой события
— называ-
ют ожидаемой, или теоретической, частотой.
Очевидно, если наблюдаемые частоты совпадают
с ожидаемыми, то признаки А и В независимы. Сте-
пень совпадения частот оценивается при помощи ста-
тистики Пирсона-Фишера:
Н — наблюдаемая частота, Т — ожидаемая. Сумми-
рование ведется по всем ячейкам таблицы сопряженности.
Если различия между наблюдаемыми и ожидае-
мыми частотами велики, т. е. статистика X
2
имеет боль-
шое значение, гипотезу о независимости признаков
А и В следует отвергнуть. Если .же различия между на-
блюдаемыми и ожидаемыми частотами невелики, т. е.
статистика X
2
имеет маленькое значение, гипотезу о
независимости признаков А и В следует принять. Воз-
никает вопрос, при какой величине статистики X
2
ги-
потезу о независимости признаков следует принять, а
при какой отвергнуть.
Для ответа на поставленный вопрос необходимо
знать распределение вероятностей статистики X
2
.
Зная это распределение, можно определить неправ-
доподобно большие ее значения, т. е. те значения,
Глава 4
которые противоречат нулевой гипотезе, и рассмат-
ривать их в качестве критической области. Если на-
блюдаемое значение статистики X
2
попадает в эту
область, гипотеза о независимости признаков А и В
отклоняется, в противном случае — принимается.
В качестве критически малой вероятности а прини-
мают значения 0,05 или для более надежного при-
нятия гипотезы 0,01.
Было показано, что статистика X
2
при неограни-
ченном возрастании п имеет распределение
с чис-
лом степеней свободы v =
Итак, окончательный алгоритм принятия решения
о независимости признаков А и В выглядит следую-
щим образом. Опираясь на данные из таблицы сопря-
женности, рассчитывают значение статистики X
2
по
формуле:
Затем выбирают уровень значимости (0,05 или
рассчитывают число степеней свободы v =
и по таблице распределения хи-квадрат (например,
Сидоренко
1996, с. 328) находят критическое значе-
2 2
ние
Если окажется, что
нулевая гипотеза о
независимости признаков А и В отвергается с вероят-
ностью ошибиться равной а и принимается альтерна-
тивная
о зависимости признаков.
Если анализируется таблица сопряженности раз-
мером 2x2, лучше использовать статистику X
2
вида:
где 0,5 — поправка на непрерывность, или, как еще
говорят, на группировку. Эта поправка вводится все-
гда, когда число степеней свободы v = 1. После подста-
154 новки в эту формулу соответствующих значений из
Do'stlaringiz bilan baham: |