58
М = 5,5 .и σ = 2.
Чтобы различать стандартные баллы, полученные с помощью линейной стандартизации и
нелинейной нормализации интервалов, Р. Кэттелл ввел понятие «S-стенов» и «n-стенов». Табли-
цы «n-стенов», естественно, точнее отражают квантили эмпирического нормального распределе-
ния. Приведем образец такой таблицы для фактора А из тест-опросника 16PF;
Сырые баллы 0-4
5-6
7 8-9 10-12 13 14-15 16 17-18 19-20
Стены 1 2 3 4 5 6
7 8 9 10
Применение стандартных шкал позволяет использовать более грубые, приближенные спо-
собы проверки типа распределения тестовых баллов. Если, например, процентильная нормализа-
ция с переводом в стены и линейная нормализация с переводом в стены по формуле (3.1.13) дают
совпадающие целые значения стенов для каждого Y, то это означает, что распределение обладает
нормальностью с точностью до «стандартной десятки».
Применение стандартных шкал необходимо для соотнесения результатов по разным тестам,
для построения «диагностических профилей» по батарее тестов и тому подобных целей.
Проверка устойчивости распределения.
Общая логика проверки устойчивости распределе-
ния основывается на индуктивном рассуждении: если «половинное» (полученное по половине
выборки) распределение хорошо моделирует конфигурацию
целого распределения, то можно
предположить, что это целое распределение будет также хорошо моделировать распределение
генеральной совокупности.
Таким образом, доказательство устойчивости распределения означает доказательство ре-
презентативности тестовых норм. Традиционный способ доказательства устойчивости сводится к
наличию хорошего приближения эмпирического распределения к какому-либо теоретическому.
Но если эмпирическое распределение не приближается к теоретическому,
несмотря на значи-
тельное увеличение объема выборки, то приходится прибегать к более общему индуктивному ме-
тоду доказательства.
Простейший его вариант может быть сведен к получению таблиц перевода сырых баллов в
нормализованную шкалу по данным всей выборки и применению этих таблиц для каждого испы-
туемого из половины выборки; если распределение нормализованных баллов из половины вы-
борки хорошо приближается к нормальному, то это значит, что заданные таблицами нормализа-
ции тестовые нормы определены устойчиво. Близость к нормальному распределению проверяет-
ся с помощью критерия Колмогорова (при n <200 целесообразно использовать более мощные
критерии: «хи-вадрат» или «омега-квадрат»).
При этом под «половиной выборки» подразумевается случайная половина, в
которую ис-
пытуемые зачисляются случайным образом -с помощью двоичной случайной последовательно-
сти (типа подбрасывания монетки и т. п.). В более общем случае такой простейший метод уста-
новления однородности двух эмпирических распределений может быть применен и при разбие-
нии выборки по какому-либо систематическому признаку. Если, в частности, по какому-либо из
популяционно значимых признаков (пол, возраст, образование, профессия) психолог получает
значимую неоднородность
эмпирических распределений; то это значит, что относительно дан-
ных популяционных категорий тестовые нормы должны быть специализированы (одна таблица
норм - для мужчин, другая - для женщин и т. д.).
Более статистически корректный метод проверки однородности двух распределений, полу-
ченных при расщеплении выборки на равные части, опять же связан с
применением критерия
Колмогорова. Для этого с табличным значением сравнивается:
59
4
/
max
2
1
n
F
F
K
j
j
e
(3.1.15)
где К
е
- эмпирическое значение статистики Колмогорова;
F
j1
- кумулятивная относительная частота для j-того интервала шкалы по первой половине
выборки;
F
j2
- та же частота для второй половины;
n - полный объем выборки.
Точные значения квантилей распределения Колмогорова для определения размеров выбор-
ки можно найти в кн.: Мюллер П. и др., 1982.
Применение критерия Колмогорова не зависит от нормальности целого распределения и от
необходимости производить нормализацию интервалов.
* * *
Итак, априорная предпосылка нормальности распределения тестовых баллов основывается
скорее на принципах операционального удобства, чем на теоретической необходимости. Психо-
метрически корректные процедуры получения устойчивых тестовых норм возможны с помощью
специальных методов непараметрической статистики (критерий «хи-квадрат» и т. п.) для распре-
делений произвольной формы. Выбор статистической модели распределения - законный произ-
вол психометриста, пока сам тест выступает в качестве единственного
эталона измеряемого
свойства. В этом случае остается лишь тщательно следить за соответствием сферы применения
диагностических норм той выборке испытуемых, на которой они были получены. Произволь-
ность в выборе статистической модели шкалы исчезает, когда речь заходит о внешних по отно-
шению к тесту критериях.
Репрезентативность критериальных тестов. В таких тестах в качестве реального эталона
применяется критерий, ради которого создается тест, - целевой критерий. Особое значение такой
подход
имеет в тех областях практики, где высокие результаты могут дать узкоспеци-
ализированные диагностические методики, нацеленные на очень конкретные и узкие критерии.
Такая ситуация имеет место в обучении: тестирование, направленное на получение информации
об уровне усвоения определенных знаний, умений и навыков (При профессиональном обучений),
должно точно отражать уровень освоения этих навыков и тем самым давать надежный прогноз
эффективности конкретной профессиональной деятельности, требующей применения этих навы-
ков. Так возникают «тесты достижений», по отношению к которым критериальный подход обна-
ружил свою высокую эффективность (Гуревич К. М, Лубовский В. И,, 1982).
Рассмотрим операциональную схему шкалирования, применяемую при создании критери-
ального теста. Пусть имеется некоторый критерий С, ради прогнозирования которого психодиа-
гност создает тест X. Для простоты представим С как дихотомическую переменную с двумя зна-
чениями: 1 и 0. С
i
= 1 означает, что
i
-й субъект достиг критерия (попал в «высокую» группу по
критерию), С
i
=0 означает, что
i
-й субъект не достиг критерия (попал в «низкую» группу). Пси-
ходиагност применяет на нормативной выборке тест X, и в результате каждый индивид получает
тестовый балл X
i
. После того как для каждого индивида из выборки становится известным зна-
чение С (иногда на это требуются месяцы и годы после момента тестирования), психодиагност
группирует индивидов по порядку возрастания балла X
i
и для каждого деления исходной шкалы
сырых тестовых баллов подсчитывает эмпирическую вероятность Р попадания в «высокую»
группу по критерию С. На рис. 5 показаны распределения вероятности Р (C
i
= 1) в зависимости
от X
i