Важное место в технологии создания предметных дидактических тестов занимают вопросы объективной оценки качества тестовых заданий и компетентности эксперта. Следует отметить, что несмотря на довольно большое число работ, посвященных вопросам экспертизы качества дидактических материалов, в них недостаточное внимание уделено вопросам оценки качества тестовых заданий [1–3].
Основным экспертным методам, применяемым в настоящее время в педагогических исследованиях относят: индивидуальную экспертную оценку; морфологический экспертный метод; рейтинг; самооценки обследуемых; педагогический консилиум; групповые экспертные оценки (ГЭО) и др.
На наш взгляд при использовании экспертных методов в дидактической диагностике одной из ключевых методологических проблем является компетентность экспертов. Поэтому данному вопросу уделяется достаточно большое внимание, разработаны различные системы требований и способы оценки профессиональных качеств экспертов.
Разработка компьютерной методики количественного определения основных нормативных характеристик (коэффициенты усвоения и селективности, степеней трудности и сложности, нормативного времени выполнения отдельного тестового задания и дидактического предметного теста в целом) позволяет:
- оценить адаптируемые или разрабатываемые стандартизированные дидактические предметные тесты различного типа и уровня сложности для многоэтапного контроля знаний студентов;
- разработать единые методики отбора и экспертизы дидактического материала, как для оценки уровня знаний и умений студентов, так и для оценки качества подготовки, организации и проведения учебного процесса в целом;
- компьютеризовать рутинную работу преподавателя и привлечь массы педагогических работников к разработке качественных дидактических тестов, используя богатые дидактические возможности компьютерной техники;
- проводить широкомасштабные педагогические эксперименты по дидактическому тестированию и внедрить положительные результаты в систему образования.
При отборе тестовых заданий, по нашему мнению, необходимо учитывать:
- содержательную валидность;
- логическую структуру и формы предъявления заданий, допускающих компьютерную обработку ответов тестируемых;
- качество тестовых заданий по параметрам.
Первые два пункта требований, как было показано выше, выполняются, т. к. использованные в PK1 тестовые задания были отредактированы, подвергнуты предварительной экспертизе, одобрены методической комиссией и утверждены на заседании кафедры.
Третий пункт требований является решающим при окончательной отборке заданий, т. к. уже имеются определенные результаты их апробации в учебном процессе, получены результаты по отдельным качественным параметрам теста.
Разработанная нами методика отбора тестовых заданий основана на дифференцировании нормативных характеристик по их значимости для оценки диагностичности заданий.
На основе анализа сложившихся теоретических положений и практики дидактической тестологии нами предлагаются следующие нормативные характеристики и их рабочий диапазон:
- Ksel.- 0.3–1.0, т. к. чем выше селективность, тем выше диагностичность задания по отношению к «сильному» и «слабому» студентам;
- Ksel.- 0.3–1.0, т. к. чем выше селективность, тем выше диагностичность задания по отношению к «сильному» и «слабому» студентам;
- Кусв.- 0.3–0.9, т. е. слишком легкие и трудные задания должны быть исключены из теста, как снижающие валидность и надежность измерений;
- Из 4-х дистракторов должны «работать» не менее 3. Следует отметить, что балансированность тестовых заданий является тем инструментом, который позволяет объективно оценить научно-методический уровень разработчиков, выявляет качества составления заданий, и следовательно, всего дидактического теста.
- Qtrudn. — эта величина служит для рациональной дозировки дидактического материала, т. к. известно, что любой сложный материал можно разложить на отдельные составляющие элементы, повышая тем самым их доступность к пониманию и увеличивая степень их усвоения. Поэтому, оптимальным значением Qtrudn, мы считаем, диапазон 3–6 ед. по 9 балльной шкале, равноценных на диапазон 9–18 ед. по ДЕЛЬТА шкале, имеющей протяженность 25 единиц;
- Сложность задания и оптимальный диапазон ее варьируется в 20–80 %.
- Контрольное время выполнения (tcont.) зависит от многих факторов. Наиболее значимыми являются уровень деятельности и количество существенных операций, требуемых для выполнения задания.
Литература:
1. Машбиц Е. И. Психолого-педагогические проблемы компьютеризации обучения. — М.: Педагогика, 1988.
2. Куклин В. Ж., Мешалкин В. И., Наводнов В. Г. и др. О компьютерной технологии оценки качества знаний. // Высш. обр. в России. — 1993. — N % 3.
3. Зияходжаев М. З., Бокиев Р. Р., Кодиров Р. Х. Тестлар тузиш ва улардан фойдала-ниш. — Т.: 1992.