pj + qj = 1.
Хотя параметры и изменяются от «плюса» до «минуса», то при < –6 значения рi близки к единице, т. е. на эти задания практически каждый испытуемый дает правильный («ключевой») ответ. При < 6 с заданием не сможет справиться ни один испытуемый, точнее — вероятность дать «ключевой» ответ ничтожна.
Рекомендуется рассматривать лишь интервалы от –3 до +3 как для (трудности), так и для (способность).
Второй этап шкалирования испытуемых и заданий сводится к тому, что шкалы преобразуются в единую шкалу путем «уничтожения» влияния трудности задания на результат индивидов. И к тому же элиминируется влияние индивидуальных способностей на решение заданий различной трудности.
Для шкалы испытуемых:
где
— среднее значение логитов трудности заданий теста, W — стандартное отклонение распределения начальных значений параметра , п — число испытуемых.
Для шкалы заданий:
где
— среднее значение логитов уровней способностей, V— стандартное отклонение распределения начальных значений «способности», п — число заданий в тесте.
Эти эмпирические оценки используются в качестве окончательных характеристик измеряемого свойства и самого измерительного инструмента (заданий теста).
Если перед исследователем стоит задача конструирования теста, то он приступает к получению характеристических кривых заданий теста. Характеристические кривые могут накладываться одна на другую. В этом случае избыточные задания выбраковываются. На определенных участках оси («способность») характеристические кривые заданий могут вовсе отсутствовать Тогда разработчик теста должен добавить задания недостающей трудности, чтобы равномерно заполнить ими весь интервал шкалы логитов от –6 до +6. Заданий средней трудности должно быть больше, чем на «краях» распределения, чтобы тест обладал необходимой дифференцирующей (различающей) силой.
Вся процедура эмпирической проверки теста повторяется несколько раз, пока разработчик не останется доволен результатом работы. Естественно, чем больше заданий, различающихся по уровню трудности, предложил разработчик для первичного варианта теста, тем меньше итераций он будет проводить.
Главным недостатком модели Раша теоретики считают пренебрежение «крутизной» характеристических кривых «крутизна» их полагается одинаковой.
Задания с более «крутыми» характеристическими кривыми позволяют лучше «различать» испытуемых (особенно в среднем диапазоне шкалы способностей), чем задания с более «пологими» кривыми.
Параметр, определяющий «крутизну» характеристических кривых заданий, называют дифференцирующей силой задания. Он используется в двухпараметрической модели Бирнбаума.
Модель Бирнбаума аналитически описывается формулой
Параметр j определяет «крутизну» кривой в точке ее перегиба; его значение прямо пропорционально тангенсу угла наклона касательной к характеристической кривой задания теста в точке (рис 6.8).
Интервал изменения параметра j от – до +. Если значения близки к 0 (для заданий разной трудности), то испытуемые, различающиеся по уровню выраженности свойства, равновероятно дают «ключевой» ответ на это задание теста. При выполнении такого задания у испытуемых не обнаруживается различий.
Парадоксальный вариант получаем при < 0. В этом случае более способные испытуемые отвечают правильно с меньшей вероятностью, а менее способные — с большей вероятностью. Опытные психодиагносты знают, что такие случаи встречаются в практике тестирования очень часто.
Ф. М. Лорд и М. Новик в своей классической работе [Lord F. M., Novik M., 1968] приводят формулы оценки параметра . При j = 1 задание соответствует однопараметрической модели Раша. Практики рекомендуют использовать задания, характеризующие значение в интервале от 0,5 до 3.
Все психологические тесты можно разделить в зависимости от формального типа ответов испытуемого на «открытые» и «закрытые». В тестах с «открытым» ответом, к которым относятся тест WAIS Д. Векслера или методика дополнения предложений, испытуемый сам порождает ответ. Тесты с «закрытыми» заданиями содержат варианты ответов. Испытуемый может выбрать один или несколько вариантов из предлагаемого множества. В тестах способностей (тест Дж. Равена, GABT и др.) предусмотрено несколько вариантов неправильного решения и один правильный. Испытуемый может применить стратегию угадывания. Вероятность угадывания ответа:
где п — число вариантов.
Результаты эмпирических исследований показали, что относительная частота решения «закрытых» заданий отклоняется от теоретически предсказанных вероятностей двухпараметрической модели Бирнбаума. Чем ниже уровень способностей испытуемого (низкие значения параметра ), тем чаще он прибегает к стратегии угадывания. Аналогично, чем труднее задание, тем больше вероятность того, что испытуемый будет пытаться угадать правильный ответ, а не решать задачу.
Бирнбаум предложил трехпараметрическую модель, которая позволила бы учесть влияние угадывания на результат выполнения теста.
Трехпараметрическая модель Бирнбаума выглядит так:
Соответственно оценка «силы» пункта (трудности задания) в логистической форме модели
Do'stlaringiz bilan baham: |