Онлайн Библиотека
http://www.koob.ru
171
нормальным распределением. Уровень «способности» испытуемого в «логитах»
определяется на шкале интервалов с помощью формулы:
где
п — число испытуемых,
р
i
— доля правильных ответов
i-го испытуемого на
задания теста,
q
i
. — доля неправильных ответов,
Для первичного определения трудности задания в логитах используют оценку
p
j
+ q
j
= 1.
Хотя параметры
β
и
θ
изменяются от «плюса» до «минуса», то при
β
< –6 значения
р
i
близки к
единице, т. е. на эти задания практически каждый испытуемый дает
правильный («ключевой») ответ. При
β
< 6 с заданием не сможет справиться ни один
испытуемый, точнее — вероятность дать «ключевой» ответ ничтожна.
Рекомендуется рассматривать лишь интервалы от –3 до +3 как для
β
(трудности),
так и для
θ
(способность).
Второй этап шкалирования испытуемых и заданий сводится к тому,
что шкалы
преобразуются в единую шкалу путем «уничтожения» влияния трудности задания на
результат индивидов. И к тому же элиминируется влияние индивидуальных спо-
собностей на решение заданий различной трудности.
Для шкалы испытуемых:
где
β
— среднее значение логитов трудности заданий теста,
W — стандартное отклоне-
ние распределения начальных значений параметра
β
,
п — число испытуемых.
Для шкалы заданий:
где
Онлайн Библиотека
http://www.koob.ru
172
⎯θ — среднее значение логитов уровней способностей,
V— стандартное отклоне-
ние распределения начальных значений «способности»,
п — число заданий в тесте.
Эти эмпирические оценки используются в качестве окончательных характеристик
измеряемого свойства и самого измерительного инструмента (заданий теста).
Если перед исследователем стоит задача конструирования теста, то он приступает
к получению характеристических кривых заданий теста.
Характеристические кривые
могут накладываться одна на другую. В этом случае избыточные задания
выбраковываются. На определенных участках оси
θ («способность»)
характеристи-
ческие кривые заданий могут вовсе отсутствовать Тогда разработчик теста должен
добавить задания недостающей трудности, чтобы равномерно
заполнить ими весь
интервал шкалы логитов от –6 до +6. Заданий средней трудности должно быть больше,
чем на «краях» распределения, чтобы тест обладал необходимой дифференцирующей
(различающей) силой.
Вся процедура эмпирической проверки теста
повторяется несколько раз, пока
разработчик не останется доволен результатом работы. Естественно, чем больше
заданий, различающихся по уровню трудности, предложил разработчик для первичного
варианта теста, тем меньше итераций он будет проводить.
Главным недостатком модели Раша теоретики считают пренебрежение «крутиз-
ной» характеристических кривых «крутизна» их полагается одинаковой.
Задания с более «крутыми» характеристическими
кривыми позволяют лучше
«различать» испытуемых (особенно в среднем диапазоне шкалы способностей), чем
задания с более «пологими» кривыми.
Параметр, определяющий «крутизну» характеристических кривых заданий, на-
зывают
дифференцирующей силой задания. Он используется в двухпараметрической
модели Бирнбаума.
Модель Бирнбаума аналитически описывается формулой
Параметр
α
j
определяет «крутизну»
кривой в точке ее перегиба; его значение
прямо пропорционально тангенсу угла наклона касательной к характеристической
кривой задания теста в точке
(рис 6.8).
Do'stlaringiz bilan baham: