Пример 2. Регрессионный анализ
Из главы 9 вы узнали о том, что наличие корреляции дает возможность делать про
гнозы с помощью процедуры, называемой «регрессионным анализом». В ходе ана
лиза определяется линия регрессии, которая служит основой для построения про
гнозов. Ниже показан регрессионный анализ примера исследования взаимосвязи
бесполезно потраченного времени и среднего балла. Формула для нахождения ли
нии регрессии:
Y-a + bX,
где а = точка на оси Y;
Ъ » наклон кривой;
Х = известное значение;
Υ = предполагаемое значение.
Шаг 1. Вычислите все составляющие:
где г = пирсоново г - -0,89;
s = стандартное отклонение (см. табл. 4.4);
s
y
= 0,63;
s
x
= 9,43;
а = 2,80 - (-0,06)(28,88) = 4,53.
Шаг 2. Подставьте значения для точки на оси Υ и наклона кривой в формулу ре
грессии:
Шаг 3. Используйте формулу для предположений.
Если Патрик потратил без пользы 40 часов, каков его предположитель
ный средний балл?
Оценка различий 4 8 7
Если Патриция потратила 20 часов без пользы, каков ее предположитель
ный средний балл?
7 = 4 , 5 3 - 0 , 0 6 .
X = 4,53 - (0,06)(20) = 4,53-1,20 = 3,33.
Оценка различий
Пример 3. Степень согласия χ
2
Если отчет о данных включает в себя указание числа попаданий некоторого явле
ния в определенную категорию, то становится ясно, что использована номиналь
ная шкала измерений. Чтобы определить, является ли частота этого события си
стематической величиной или просто случайностью, требуется провести заключи
тельную проверку номинальных данных. Проверка по критерию хи-квадрат (χ
2
) —
это наиболее общая статистическая процедура, используемая в случае номиналь
ных данных. Есть две разновидности этой процедуры, различающиеся в зависимо
сти от того, сколько наборов значений получено, один или два. Процедуру, исполь
зуемую в случае одного набора значений, иногда называют «степень согласия χ
2
»,
так как с ее помощью определяют, отклоняется ли частота, полученная в исследо
вании, от частоты, ожидаемой по теории вероятности или в соответствии с конк
ретной предсказываемой моделью.
В качестве примера предположим, что у студентов складывается мнение, будто
используемые преподавателем задания на выбор ответа содержат искажения: пять
вариантов ответа не одинаково часто являются правильными. Им кажется, что ва
рианты б, в и г являются правильными чаще, чем а или д. Преподаватель заинтере
совался этим вопросом и решил оценить все задания на выбор ответа, использо
ванные в предыдущем семестре. Было подсчитано, сколько раз выбирается каждый
из вариантов ответа. Если искажение отсутствует, это значение должно быть при
мерно одинаковым для всех вариантов. Таким образом, нулевая гипотеза говорит,
что для каждого из вариантов ожидаемая частота выбора будет одинаковой. Об
щее количество вариантов в заданиях на выбор ответа равняется 400, а следователь
но, ожидаемая частота (Е) для каждого из вариантов равняется 400/5 = 80. В дей
ствительности получены следующие значения частоты:
Вариант а: 62.
Вариант б: 85.
Вариант в: 78.
Вариант г: 111.
Вариант д: 64.
Итого: 400.
Формула для вычисления степень согласия χ
2
:
4 8 8 Приложение С. Использование статистических методов
Шаг 1 Вычислите все составляющие
Do'stlaringiz bilan baham: |