ГЛАВА 3.
ПСИХОМЕТРИЧЕСКИЕ ОСНОВЫ ПСИХОДИАГНОСТИКИ
3.1. РЕПРЕЗЕНТАТИВНОСТЬ ТЕСТОВЫХ НОРМ
Основные статистические принципы построения тестов достаточно полно освещены в по-
явившейся в начале 80-х годов на русском языке литературе по дифференциальной психометрике
(Аванесов В. С., 1982; Анастази А., 1982; Гайда В. К., Захаров В. П., 1982). Тем не менее в ука-
занных руководствах центральная проблема психометрики тестов - вопрос о тестовых нормах -
еще не получила последовательного освещения. Прежде всего это относится к руководству из-
вестной представительницы американской тестологии А. Анастази.
В руководстве Анастази не получают достаточного критического обсуждения две осново-
полагающие предпосылки традиционной западной тестологии: вопрос о применении статистиче-
ских норм (квантилей распределения баллов) в качестве диагностических норм и вопрос о сведе-
нии всех эмпирических распределений к нормальной модели. Ниже эти предпосылки будут про-
анализированы в контексте краткой реконструкции системы основных понятий дифференциаль-
ной психометрики.
48
Статистическая природа тестовых шкал. Типичный измерительный тест в психодиагности-
ке - это последовательность кратких заданий, или пунктов, дающая в результате ее выполнения
испытуемым последовательность исходов, которая затем подвергается однозначной количе-
ственной интерпретации. Примеры интерпретации в интеллектуальных тестах, состоящих из от-
дельных задач: «правильное решение», «ошибочное решение», «отсутствие ответа» (пропуск за-
дачи из-за нехватки времени). Примеры интерпретации в случае личностных опросников, состо-
ящих из высказываний, предлагаемых для подтверждения испытуемым: «подтверждение» (ответ
«верно»), «отвержение» (ответы «не согласен», «неверно»).
Суммарный балл по тесту подсчитывается с помощью ключа: ключ устанавливает числовое
значение исхода по каждому пункту. Например, за правильное решение задания дается «+1», за
неправильное решение или пропуск - «О». Тогда балл буквально выражает количество правиль-
ных ответов.
Исход по отдельному заданию подвержен воздействию не только со стороны измеряемого
фактора - способности или черты личности испытуемого, но и побочных шумовых факторов, ко-
торые являются иррелевантными по отношению к задаче измерения. Примеры случайных факто-
ров: колебания внимания, вызванные неожиданными отвлекающими событиями (шум на улице,
стук в дверь и т. п.), трудности в понимании смысла задания (вопроса), вызванные особенностя-
ми опыта данного конкретного испытуемого, и т. п. Последовательность исходов оказывается
последовательностью событий, содержащей постоянный и случайный компоненты. Как извест-
но, основным приемом, позволяющим устранить искажающее влияние случайных факторов на
результат (суммарный балл), Является балансировка этого влияния с помощью повторения. При
этом фактически предполагается, что повторение обеспечивает рандомизацию (случайное варь-
ирование) неконтролируемого фактора, в результате чего при суммировании исходов Положи-
тельные и негативные эффекты случайных факторов взаимопоглощаются (о механизме рандоми-
зации см.: Готтсданкер Р., 1982).
В оптимальном тесте набор и последовательность заданий организуются таким образом,
чтобы повысить долю постоянного компонента и сократить долю случайного в величине сум-
марного балла. Тем не менее, несмотря на различные статистические ухищрения, суммарный
балл в психологических измерениях содержит несравненно большую долю случайного компо-
нента, чем в обычных физических измерениях. В силу этого суммарный балл оказывается опре-
деленным лишь в известных пределах, заданных ошибкой измерения.
Для того чтобы оценить эффективность, дифференциальную ценность всей процедуры из-
мерения, необходимо соотнести размеры ошибки измерения с размерами разброса суммарных
баллов, вызванных индивидуальными различиями в измеряемой характеристике между испыту-
емыми. В терминах Статистики речь идет о сравнении так называемой истинной дисперсии рас-
пределения суммарных баллов с дисперсией ошибки. Именно этим обусловлен необходимый ин-
терес психометристов к распределению суммарных баллов. Поэтому анализ распределения необ-
ходим не только при использовании статистических норм, но и в случае абсолютных и критери-
альных норм.
Как известно, частотное распределение суммарных баллов имеет удобную графическую
интерпретацию в виде кривых распределений: гистограммы и кумуляты (см., в частности, удач-
ное популярное введение в описание распределений в книге: Кимбл Г., 1982, с. 55-70). В случае
гистограммы по оси абсцисс откладываются «сырые очки» -первичные показатели суммарных
баллов, возможных для данного теста, по оси ординат - относительные частоты (или проценты)
встречаемости баллов в выборке стандартизации (Анастази А., 1982, с. 66). Как известно, для
«колоколообразной» кривой нормального распределения дисперсия визуализируется как пара-
метр, ответственный за «распластанность» графика плотности вероятности (теоретического ана-
49
лога эмпирической кумуляты) вдоль оси X. Чтобы визуализировать дисперсию ошибки измере-
ния, нужно было бы многократно провести тест с одним испытуемым и построить графическое
распределение частот его индивидуальных баллов (рис. 1).
Очевидно, что дифференцирующая способность теста сводится к нулю, если кривые, иллю-
стрирующие «истинную» и «ошибочную» дисперсии» совпадают. Как видим, анализ распреде-
ления тестовых баллов необходим уже для анализа надежности теста (см. раздел 3.2).
Проблема меры в психометрике и свойства пунктов теста. В физических измерениях калиб-
ровка шкалы производится на основе контроля за равномерным варьированием измеряемого
свойства в эталонных объектах. Носителем меры является эталон- физический объект, стабильно
сохраняющий заданную величину измеряемого свойства. В дифференциальной психометрике
такие физические эталоны отсутствуют: мы не располагаем индивидами, которые были бы по-
стоянными носителями заданной величины измеряемого свойства.
Do'stlaringiz bilan baham: |