В. Н. Дружинин экспериментальная психология



Download 3,35 Mb.
Pdf ko'rish
bet88/147
Sana24.02.2022
Hajmi3,35 Mb.
#189938
TuriКнига
1   ...   84   85   86   87   88   89   90   91   ...   147
Bog'liq
eksperimentalnaja psihologia (1)

j
 = С
j
. 
Рассмотрим еще одну модель, которую предложил В. С. Аванесов. Как мы уже 
заметили, в IRT не решается проблема валидности: успешность решения задачи зависит 
в моделях IRT только от одного свойства. Иначе говоря, каждое задание теста считается 
априорно валидным. 
Аванесов обратил внимание на это обстоятельство и ввел дополнительный, чет-
вертый, параметр, который можно обозначить как внутреннюю валидность задания. 
Успешность решения задания определяется не только «основной» способностью (
θ
), но 
и множеством условий, нерелевантных заданию, однако влияющих на деятельность 
испытуемого. 
Четырехпараметрическая модель представляет, по мнению ряда исследователей, 
лишь теоретический интерес: 
где 
γ
j
 — валидность тестового задания. 


Онлайн Библиотека http://www.koob.ru 
174
Если 
γ
j
 > 1, то тест не является абсолютно валидным. Следовательно, вероятность 
решения задания не только определяется теоретически выделенным свойством, но и 
зависит от других психических особенностей личности. 
Бирнбаум считает, что количество информации, обеспеченное j-м заданием теста, 
при оценивании q
j
является величиной, обратно пропорциональной стандартной 
ошибке измерения данного значения q
j
 j-м заданием. Более подробно вычисление 
информационной функции рассмотрено в работе М. Б. Челышковой [Челышкова М.Б., 
1995]. 
Многие авторы, в частности Пол Клайн [Клайн П., 1994], отмечают, что IRT об-
ладает множеством недостатков. Для того чтобы получить надежную и не зависимую 
от испытуемых шкалу свойств, требуется провести тестирование большой выборки (не 
менее 1000 испытуемых). Тестирование достижений показывает, что существуют 
значительные расхождения между предсказаниями модели и эмпирическими данными. 
В 1978 г. Вуд [цит. по: Клайн П., 1994] доказал, что любые произвольные данные 
могут быть приведены в соответствие с моделью Раша. Кроме того, существует очень 
высокая корреляция шкал Раша с классическими тестовыми шкалами (около 0,90). 
Шкалирование, по мнению Раша, способно привести к образованию бессмыслен-
ных шкал. Например, попытка применить его модель к опроснику EPQ Айзенка по-
родила смесь шкал N, Е, Р и L. 
Главный же недостаток IRT — игнорирование проблемы валидности. В психоло-
гической практике не наблюдается случаев, когда ответы на задания теста были бы 
обусловлены лишь одним фактором. Даже при тестировании общего интеллекта 
модели IRT неприменимы. 
Клайн рекомендует использовать модели IRT для коротких тестов с валидными 
заданиями (факторно простые тесты). 
В пособии Клайна «Справочное руководство по конструированию тестов» (Киев, 
1994) приведен алгоритм конструирования тестов на основе модели Раша. 
В заключение рассмотрим вероятностную модель тестов «уровня» Ф. М. Юсупова 
[Дружинин В. Н., 1998], аспиранта лаборатории психологии способностей Института 
психологии РАН. Его модель разработана для тестов с «закрытыми» заданиями 
(выбором ответов из множества), различающимися по уровню трудности. В 
«закрытых» тестах испытуемый может применить стратегию «угадывания» ответа. 
Вероятность угадывания 
где т — число альтернатив.
Сложность тестового задания 
где п — число испытуемых, способных решить задание, N — общее количество ис-
пытуемых в выборке валидизации. 
При W < Р невозможно определить, решена задача случайно или закономерно. 
Предполагается, что биноминальное распределение вероятности успешного выпол-
нения тестового задания при больших аппроксимируется нормальным. 
Должны выполняться следующие условия: 
1. Правильный ответ выбирается неслучайно, если: 
— его экспериментально полученная частота больше 1 /т; 
 это превышение статистически значимо; 
— оценивать его можно с помощью t-критерия Стьюдента. 
2. Все ложные варианты ответов должны выбираться не чаще, чем случайные: 
q = n
j
/N 

 1/m, 
где п
j
 — частота выбора неверного ответа. 
Тем самым тестовое задание стимулирует испытуемого к выбору правильного от-
вета. 


Онлайн Библиотека http://www.koob.ru 
175
3. В тестах «уровня» диапазон изменения показателя сложности 0 

 W 

 1 должен 
быть уменьшен «слева» на величину W', значимо отличающуюся от W, в которой t = 
t
кр.
(t — критерий Стьюдента). Чем больше вариантов ответов в тесте, тем меньше Wu 
шире область допустимых значений показателя сложности тестового задания. 
Например, для N = 100, 
α
 = 0,05 (t
кр
= 1,90) и 10 > т > 3 расчет показывает, что уже 
при т > 6 скорость расширения области значений показателя сложности значимо 
замедляется. Поэтому рекомендуется выбирать 6–10 вариантов ответа. 
В тесте «уровня» число градаций сложности и число заданий связано. Чем точнее 
оценка свойства, тем больше число градаций. Но это влечет снижение достоверности 
измерения, так как длина теста (число заданий) ограничена. Уменьшение числа 
градаций приведет к нивелированию различий между испытуемыми. 
Предельно возможное число заданий в тесте выбирается при условии, что различие 
в уровне их сложности гарантируется с выбранной вероятностью. 
Поскольку дисперсия биноминального распределения максимальная в центре ин-
тервала 0—1 и уменьшается к периферии до 0, шаг градаций сложности на разных 
участках этого интервала будет различным: на периферии он должен стремиться к 
нулю. 
Удобно принять в качестве шага градации сложности 1/10 интервала. Для 
α
 = 0,05, 
N = 100 получается 7 значений показателя сложности, что при шаге, равном 0,1, 
гарантирует различение между уровнями с вероятностью 0,9. 
Если учесть условие минимизации случайного выбора правильного ответа, то 
число градаций сложности должно быть еще меньше. Например, при 6 вариантах 
ответа число заданий разного уровня сложности не может быть больше 6. 
Эти выводы верны в том случае, если биноминальное распределение аппрокси-
мируется нормальным распределением. При большом числе испытуемых такая ап-
проксимация возможна. 
Расчеты показывают, что минимально необходимый объем выборки для апробации 
тестовых заданий не так уж и велик — 56 человек при достоверности 0,9. 
Следовательно, исходя из вероятностной модели теста и не прибегая к допуще-
ниям о моделях тестирования, можно рассчитать параметры теста как предельные 
характеристики, обеспечивающие достоверность измерения. 

Download 3,35 Mb.

Do'stlaringiz bilan baham:
1   ...   84   85   86   87   88   89   90   91   ...   147




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish