В статье рассматриваются методы определения количества тестовых заданий по химии, приводятся расчетные формулы определения и обоснования к ним.
Ключевые слова: субтест, тестовые высказывания, понятийный индикатор, поправочный коэффициент, процедура тестирования.
В технологии разработки и конструировании дидактических тестов (субтестов) важное место занимает определение необходимого минимума тестовых высказываний [1].
Теоретически планируемое число тестовых высказываний (тестовых заданий) в социологических тестах определяется произведением количества понятийных (K) и эмпирических (n) индикаторов, раскрывающие сущность основного понятия, т. е. N = K * n. При этом значения данных величин меняются в интервале: K = 2 - 6 и n = 8 - 10.
Мы предлагаем определять количество тестовых заданий в зависимости от их назначения, удельного веса (значимости) темы (для субтеста) в учебном курсе и формы их предъявления, т. е. допускать широкий диапазон от 10 до 150.
При оценки обучаемости студентов считается, что для самоконтpоля достаточно 10 заданий для теста I уровня, и 10 заданий, отличающихся степенью сложности и количеством операций для тестов II уpовня («откpытого типа»).
Более подробно данный вопрос рассмотрен Б. Л. Фарберманом, который предлагает при определении количества заданий исходить из количества учебных часов, целей диагностирования, уровня усвоения дидактического материала. При этом он считает целесообразным увеличить количество заданий в 2–3 раза больше, чем запланировано, объясняя это необходимостью иметь несколько параллельных форм теста по одной и той же учебной дисциплине [1].
Как показывает опыт работы по разработке и апробации дидактических тестов для многоэтапного контроля знаний студентов по химическим дисциплинам, оптимальное число тестовых заданий целесообразно определить в виде произведения эмпирических величин:
N=n * m * УЭ
где, УЭ — учебные элементы, выступающие в качестве понятийных индикаторов и m — поправочный коэффициент, характеризующий их удельный вес (значимость) относительно изучаемой темы, и, следовательно, в этом случае K = m * УЭ.
Необходимость введения величины m диктуется тем, что в дидактической тестологии пока еще отсутствуют методы количественной оценки значимости понятийного индикатора, да и само понятие «учебный элемент» несет различные смысловые нагрузки. Большинство тестологов в качестве учебного элемента предлагают принимать законы, категории и основные понятия учебного курса.
На наш взгляд, желательно оценить значимость каждого учебного элемента, т. к. нельзя воспринимать как равнозначные, например, основной закон светопоглощения и толщину поглощающего слоя (L), хотя сама по себе величина L имеет весьма важную практическую и теоретическую значимость.
Поэтому, нами предложен весовой коэффициент (m), учитывающий удельный вес данного учебного элемента в изучаемой теме. Введение m позволяет дифференцировать учебные элементы по их значимости, оценить их процентный удельный вес и более точно определить количество тестовых высказываний, необходимых для полного раскрытия сущности понятийного индикатора. m — определяется в виде множителя, численно равного количеству терминов, параметров или понятий, которые входят в конструкцию (логическую структуру) понятийного индикатора.
При конструировании дидактических предметных тестов необходимое число тестовых заданий и их представительность определяется в зависимости от содержания учебного курса, количества дидактически значимых учебных элементов и их удельного (процентного) веса. Хотя определение значения весового коэффициента (m) все еще остается уделом опытных педагогов, использующих при экспертизе метод групповых экспертных оценок.
В пользу экспертного подхода высказывается и В. С. Аванесов, один из ведущих тестологов СНГ: «только опытный педагог может сказать, можно ли посредством того или иного набора вопросов (заданий) валидно проверить знание учащихся» [1].
На наш взгляд, чем больше тестовых высказываний, скоррелированных по степени трудности, тем выше надежность теста. Большинство тестологов [2,3] отмечают, что опытные разработчики тестов школьной успеваемости создают на 50 % или 100 % (т. е. в 1,5–2 раза) больше тестовых заданий, чем требуется в окончательной форме теста.
На определение количества заданий могут влиять следующие факторы: цели и задачи диагностирования, назначение тестов (входной, текущий, рубежный или итоговый контроль), тип и уровень сложности, их направленность (теоретические вопросы, лабораторные или семинарские занятия, расчетные задачи или моделирование производственных ситуаций, задачи, СРС, и др.), процедура тестирования (компьютерные, компьютеризованные, бланковые), гетерогенность и гомогенность теста, программно-методическое и техническое обеспечение процедуры тестирования и способы обработки полученных результатов.
В гетерогенном тесте, состоящем из нескольких гомогенных тестов (субтестов), число заданий увеличивается в кратном размере, но их должно быть не менее 20 в гетерогенных и 10 в гомогенных тестах.
Как свидетельствует накопленный опыт апробации дидактических тестов, оптимальное количество заданий в субтесте должно быть в пределах 25–40. Использование функции RND при автоматическом режиме подготовки информационных файлов УБД позволяет варьировать количество заданий в достаточно широком диапазоне.
Оптимальное количество тестовых заданий в контрольном варианте должно уточняться по мере апробации и стандартизации теста при соблюдении главного условия — не уменьшить валидность и надежность предметного дидактического теста.
Литература:
- Фарберман Б. Л., Асомов Д. К. Педагогик тестлар ва талабалар билимини назорат килиш ва бахолашнинг рейтинг системаси. — Т.: РУМЦ, 1995. — 101 с.
- Зияходжаев М. З., Бокиев Р. Р., Кодиров Р. Х. Тестлар тузиш ва улардан фойдаланиш. — Т.: 1992. — 36 с.
- Кувандиков О. К., Ким В. С. Методические указания по составлению тестовых заданий. — Самарканд.: СамГУ, 1992. — 47 с.