(ф - поощрять взаимооценку и самооценку учащегося, учить анализиро-
вать ответы товарищей и свои собственные;
- мотивировать выставление оценки для того, чтобы учащиеся поняли
ее объективность [26, с. 109].
Недопустимыми являются следующие действия:
■m
вместо оценки знаний давать моральную оценку ученику;
допускать бездельничание, изгонять из класса;
перебивать, делать замечания, настраивающие ученика на неуверенный ответ или принижающие личное достоинство;
- ставить неудовлетворительную отметку за нарушение дисциплины.
Столь широкий список ограничений и предупреждений свидетельствует о серьезных диагностических недостатках этого метода. Так, С.Р.Сакаева отмечает следующие недостатки устной формы проверки знаний [263, с. 13]:
эффект контраста (сильный учащийся отвечает после слабого или наоборот) приводит к разбросу баллов от 2,95 до 3,84 (по 5-ти балльной шкале);
эффект темпа речи (быстрый, медленный) приводит к разбросу баллов от 2,51 до 3,38;
- эффект очередности ответа вообще не поддается контролю.
Тестирование - наиболее удачный метод диагностики в обучении, так
(0 как он позволяет преодолеть субъективизм в оценке знаний, а также выявить
условия, наилучшим образом соответствующие возможностям обучения раз-
143
личных учащихся. В психологии тесты - это стандартизованные и обычно краткие и ограниченные во времени испытания, предназначенные для установления количественных и качественных индивидуально-психологических различий между людьми. [57, с.32].
В учебном пособии по педагогике под редакцией П.И.Пидкасистого под тестом понимается совокупность заданий, ориентированных на определение (измерение) уровня (степени) усвоения определенных аспектов (частей) содержания обучения [224, с.413]. За рубежом в обучении используют различные по виду тесты: тест-эссе (изложение, сочинение), «малтипл чойс» (контроль знания фактического материала), вопросно-ответный тест и др. [240, с.13]. В России в настоящее время начался период возрождения идеи тестирования (после 1936 г.) и предпринимаются попытки разработки сквозного школьного тестирования.
В данном исследовании нас, в первую очередь, интересуют тесты достижений, или тесты объективного контроля успешности, предназначенные для оценки степени продвинутости знаний, навыков, умений после прохождения человеком соответствующего обучения. В этих тестах предполагается правильный ответ на каждый их пункт, а показателем успешности является количество правильно выполненных заданий.
К настоящему времени тестология достаточно хорошо разработана. Требования к тестам достижений содержатся в руководствах по изучению педагогики [224]. Правильно составленные тесты должны быть:
относительно краткосрочными, т.е. не требовать больших затрат времени на ответы на пункты теста;
однозначными, т.е. не допускать произвольного толкования тестовых заданий;
правильными, т.е. исключать возможность формулирования многозначных ответов;
относительно краткими (требующими сжатых ответов);
144
информационными, т.е. такими, которые обеспечивают возможность соотнесения количественной оценки за выполнение теста с порядковой или даже интервальной шкалами измерений;
удобными, т.е. пригодными для быстрой математической обработки результатов тестирования;
стандартными, т.е. пригодными для широкого практического использования - измерения уровня обученности возможно более широких контингентов обучаемых, овладевающих одинаковым объемом знаний на одном и том же уровне обучения.
Требование однозначности теста означает [51,с.61], что качество его выполнения учащимися должно оцениваться одинаково различными экспертами, то есть в тестах должны быть выделены некоторые единицы, позволяющие вести их уверенную обработку и счет, чтобы получить вполне определенный и конструктивный результат.
Качество тестов достижений определяют с помощью критериев таких, как валидность, надежность, правильность, дифференцированность. Главными критериями являются два первых.
Валидность теста означает пропорциональность представления в нем всех элементов изучаемых знаний и умений. Чем выше «коэффициент» пропорциональности, тем большую величину действенности имеет тест. Это значит, что составитель теста обязан тщательно изучить соответствующие разделы учебной программы, стандарта образования, учебных пособий. Валидность теста можно установить статистическими методами путем сравнения с другими способами измерения качества объекта. Она считается высокой, если коэффициент корреляции находится в пределах от 0,7 до 0,9; удовлетворительной, если коэффициент корреляции достигает величины 0,45 - 0,55, и неудовлетворительной при более низких значениях.
Степень надежности характеризуется стабильностью, устойчивостью показателей при повторных измерениях с помощью того же теста или его
145
равноценного заменителя. Количественно эти показатели характеризуются вероятностью достижения запроектированных результатов. Надежность теста повышается при увеличении количества тестовых заданий. Тест, нацеленный на проверку усвоения конкретной темы, всегда более надежен по сравнению с тестом, направленным на проверку всего курса в целом, тек как содержательное разнообразие последнего может оказаться чрезмерно большим, то есть надежность теста связана с содержательным разнообразием последнего.
Надежность теста понимают и как коэффициент точности [219]. Она может зависеть и от уровня развития испытуемых. Так, если тест окажется очень трудным для группы индивидов, то они прибегают к угадыванию ответов, что снижает надежность измерения.
Рассмотрим наиболее широко распространенные методы измерения, применяющиеся в тестах достижений. Наиболее полный список таких методов дан С.С.Пановяном [219, с.57].
Метод ранжирования. Все п стимулов предъявляются одновременно, и индивид должен их ранжировать (упорядочивать) по величине определенного признака.
Метод парных сравнений. Стимулы предъявляются парами, и каждый раз индивид оценивает, какой член пары обладает большей величиной признака.
Метод одного стимула Стимулы предъявляются по одному, и каждый раз индивид соглашается (одобряет, принимает) или не соглашается с тем утверждениям, которое содержится в этом стимуле. Согласие или несогласие могут быть предъявлены не в двух, а в большем числе альтернативных категорий: полностью не согласен, не согласен, индеферентен, согласен, полностью согласен.
Метод выбора Из одновременно предъявляемых индивиду п стимулов (вербальных утверждений) он должен выбирать один или несколько, с которыми он более всего согласен.
146
5. Метод оценки величины стимула. Стимулы предъявляются по одному, и индивид должен непосредственно оценивать их величину (величина стандартного стимула указывается экспериментатором).
К этим пяти основным методам следует добавить еще метод пробелов, который используется в тестах обученности в американских школах [240].
Следует также заметить, что существуют различные промежуточные экспериментальные планы.
В.П.Беспалько в книге «Теория учебника» отмечает, что «при конструировании пунктов тестов необходимо добиться их определенности» для учащихся. Это значит, что, читая тест, учащийся должен хорошо понимать, какие знания и в каком объеме он должен продемонстрировать. Пункты теста должны быть достаточно просты, то есть они должны иметь «возможно более четкую и прямолинейную формулировку задания» [47, с.60].
В основу классификации педагогических тестов во французской тесто-логии положено понятие об их функции и дидактическом назначении [339]. В соответствии с тремя выделенными видами функций различают диагностические, прогностические и констатирующие тесты.
Диагностические педагогические тесты используются для выявления слабых сторон в усвоении знаний учащихся (при поступлении детей в начальную школу, при переходе к средней ступени образования, в конце обучения).
В задачи диагностических тестов входит выявление:
способностей для решения определенного класса задач;
уровня усвоения базовых знаний;
способности к вычислению «системы» и обобщению техники решения;
усвоенных навыков, которые тормозят прогресс;
способности преодолевать трудности при столкновении с проблемой;
147
6) соответствия методики преподавания уровню способностей учащегося и скорости его обучаемости.
G.Landscheere [338, с. 170] отмечает, что «построение диагностических тестов требует, с одной стороны, детального изучения предметов и процесса обучения, а с другой - изучения статистических и клинических анкет о совершаемых ошибках и недостатках».
Дидактическая значимость диагностического теста заключается в том, что он дает возможность «лечебного» и предупредительного обучения, позволяет выявить учащихся, которые нуждаются в «лечении», выявляет индивидуальные дефекты и разнообразные формы их проявления и позволяет «назначить» адекватное «лечение» для каждого индивидуального случая, оценить эффект проведенной с ребенком работы [17, с.39].
Прогностические педагогические тесты, или тесты педагогической зрелости, должны давать обучающему персоналу информацию о подготовленности учащихся к обучению. При этом тесты должны охватывать физический, умственный, эмоциональный, мотивационныи аспекты в развитии детей [342]. Назначение прогностических тестов заключается в том, чтобы:
дать возможность объективной оценки зрелости ученика;
помочь школьному учителю в разработке курса пропедевтического обучения;
облегчить создание гомогенных групп;
выработать объективные критерии для сравнения прогресса учащихся.
Различают тесты общей и тесты специфической зрелости. Тест общей зрелости используется при приеме в начальную школу. Тесты специфической зрелости бывают 3-х видов:
1) тесты на установление формы рассуждения и способностей, необходимых для усвоения определенного предмета (например, способности к визуальному разграничению при обучении чтению);
148
Do'stlaringiz bilan baham: |