n
k
X
n
)
1
(
)
1
(
2
1
(3.2.10)
где
2
1
n
X
- эмпирическое значение статистики % квадрат с п-1 степенью свободы;
k - количество пунктов теста;
n - количество испытуемых;.
a
- надежность.
Формулы (3.2.8) и (3.2.9) позволяют оценить взаимную согласованность пунктов теста, ис-
пользуя при этом только подсчет дисперсий. Однако коэффициенты а и KR
2I>
позволяют оценить
и среднюю корреляцию между
i
-м и
j
-м произвольными пунктами теста, так как связаны с этой
средней корреляцией следующей формулой:
ij
ij
r
k
r
k
a
)
1
(
1
11)
где
ij
r
- средняя корреляция между пунктами теста. Легко увидеть идентичность формулы
(3.2.11) обобщенной формуле Спирмена - Брауна, позволяющей прогнозировать повышения син-
хронной надежности теста с увеличением количества пунктов теста в k раз (Аванесов В. С., 1982,
с. 121). Из этой формулы видно, что при больших k малое значение
ij
r
может сочетаться с высо-
кой надежностью. Пусть
ij
r
= 0,1, a k =100, тогда по формуле (3.2.11)
91
,
0
9
,
10
10
1
,
0
99
1
1
,
0
100
a
Широкое распространение компьютерных программ факторного анализа для исследования
взаимоотношений между пунктами теста (по одномоментным данным) привело к обоснованию
еще одной достаточно эффективной формулы надежности теста, которой легко воспользоваться,
получив стандартную распечатку компьютерных результатов факторного анализа по методу
главных компонент:
1
1
1
1
k
k
(3.2.12)
где
θ
- коэффициент, получивший название тета-надежности теста;
k - количество пунктов теста;
λ
1
- наибольшее значение характеристического корня матрицы
интеркорреляций пунктов (наибольшее собственное значение, или абсолютный вес первой
главной компоненты).
Как и предыдущие формулы, формула (3.2.12) также относится к оценке надежности теста,
66
направленного на измерение одной характеристики. Но, кроме того, она применима и для мно-
гофакторного теста, хотя и нуждается в пересчете после первоначального отбора пунктов, реле-
вантных фактору (после того, как на основании многофакторного анализа отобраны пункты по
одному фактору, снова проводится факторный анализ - только для этих отобранных пунктов).
Надежность отдельных пунктов теста. Надежность теста обеспечивается надежностью
пунктов, из которых он состоит. Чтобы повысить ретестовую надежность теста в целом, надо
отобрать из исходного набора пунктов, апробируемых в пилотажных психометрических экспе-
риментах, такие пункты, на которые испытуемые дают устойчивые ответы. Для дихотомических
пунктов (типа «решил - не решил», «да - нет») устойчивость удобно измерять с использованием
четырехклеточной матрицы сопряженности:
Тест 1
Да Нет
Да
Тест 2
Нет
Здесь в клеточке а суммируются ответы «Да», данные испытуемым при первом и втором
тестировании, в клеточке b - число случаев, когда испытуемый при первом тестировании отвечал
«Да», а при втором - «Нет» и т. д. В качестве меры корреляции вычисляется фи-коэффициент:
)
)(
)(
)(
(
d
b
c
a
d
c
b
a
bc
ad
(3.2.13)
Как известно, значимость фи-коэффициента определяется с по мощью критерия хи-квадрат:
n
X
2
2
1
(3.2.14)
Если вычисленное значение хи-квадрат выше табличного с одной степенью свободы, то ну-
левая гипотеза (о нулевой устойчивости) отвергается. Удобство использования фи-коэффициента
состоит в том, что он одновременно оценивает степень оптимальности данного пункта теста по
силе (трудности): фи-коэффициент оказывается тем меньшим, чем сильнее частота ответов «да»
отличается от частоты ответа «нет».
Кроме того, сама четырехклеточная матрица позволяет проследить возможную несиммет-
ричность в устойчивости ответов «да» и «нет» (это важнее для задач, чем для вопросов: напри-
мер, может оказаться, что все испытуемые, уже решившие однажды данную задачу, решают ее
при повторном тестировании; это наводит на мысль о том, что при втором тестировании проис-
ходит сбережение опыта, приобретенного при первом тестировании). Выявленные в результате
такого анализа неустойчивые и неинформативные (слишком сильные или слишком слабые)
пункты должны быть исключены из теста. Пункты следует считать недостаточно устойчивыми,
если на репрезентативной выборке величина
1
превышает 0,71. При этом φ< 0,5.
Для тходной пилотажной батареи пунктов отбросить те, которые плохо согласованы с остальными
1
. В
отсутствие компьютера согласованность для пунктов также очень просто определяется с помо-
1
В ряде пособий показатель согласованности для пунктов называется дискриминативностью пунктов (Гайда В. К.,
Захаров В П., 1982).
a
B
c
D
67
щью четырехклеточной матрицы. В этом случае в первом столбце суммируются ответы испыту-
емых из «высокой».группы (пр величине суммарного балла), во втором столбце - из «низкой».
Высокая Низкая
Да
Нет
При нормальном распределении частот суммарных баллов «высокая» и «низкая» группы
отсекаются справа и слева 27%-ными маргинальными квантилями (рис. 8).
Для оценки согласованности с суммарным баллом применяется полная
1
или упрощенная
формула фи-коэффициента:
)
*
(
1
2
1
i
i
P
N
P
P
a
i
(3.2.15)
2
где
i
P
- количество ответов «верно» («да») на
i
-й пункт теста;
N* - сумма всех элементов матрицы;
N* = n • 0,54 где n - объём выборки;
P
i
= а + b - При включении в эстремальную группу 1/3 выборки
N* = 0,66 • n.
Do'stlaringiz bilan baham: |