Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Poyasnitelnaya_zapiska.doc
Скачиваний:
19
Добавлен:
20.03.2015
Размер:
220.16 Кб
Скачать

1.2 Критерии качества теста

Как инструмент для проведения педагогического измерения тест должен удовлетворять определенным критериям качества.

  1. Дифференцирующая способность теста

Кривая распределения тестовых баллов должна быть достаточно широкой. Существуют статистические методы оценки того, на сколько каждое задание теста способствует выполнению данного критерия.

  1. Валидность теста.

Валидность означает пригодность тестовых результатов для той цели, ради чего проводилось тестирование. Высокая валидность теста означает, что тест свободен от субъективных факторов и беспристрастно измеряет то, для чего он предназначен. Можно выделить множество различных составляющих общего понятия «валидность».Содержательная валидность теста означает, что задания теста полностью охватывают, и при том в нужной пропорции, все основные аспекты той области знания, подготовленность в которой этот тест оценивает, измеряет. Валидность зависит от качества заданий, их числа, от степени полноты и глубины охвата содержания учебной дисциплины по данной теме в заданиях теста, от баланса и распределения заданий по трудности, от метода отбора заданий в тест и др.

  1. Надежность теста.

Надежность понимается как мера одинаковости, повторяемости или связанности двух измерений одного и того же качества одним и тем же тестом или его параллельными вариантами.

На практике используются три основных метода оценки надежности теста:

  1. Повторное тестирование (ретестирование).

  2. Параллельное тестирование.

  3. Расщепление теста на части.

Первый метод состоит в проведении повторного тестирования через некоторый интервал времени теми же заданиями. Надежность теста вычисляется как мера корреляции между результатами двух проверок.

Недостаток метода: неопределенность интервала времени (от двух недель до 6 месяцев), испытуемые знают содержание теста, интеллектуально выросли за прошедшее время и т.д.

Второй метод - повторное тестирование по параллельному тесту. Интервал времени может быть минимальным.

Метод расщепления теста на части применяется тогда, когда повторное тестирование нежелательно, и существует только один вариант теста. Самое простое деление - на две части. При этом распределение оценок за выполнение всего теста в целом должно быть близко к распределению оценок при выполнении частей теста. Надежность определяется качеством заданий, условиями проведения тестирования, психологическим состоянием тестируемых и др. факторами.

2. Глава

Апробация тестовых заданий

После проведения экспертизы тестовых заданий, их доработки, с учетом результатов экспертизы можно перейти к следующему этапу разработки теста: необходимо упорядочить задания и провести апробацию тестовых заданий (другие названия: пробное тестирование, предварительное тестирование, испытание, эмпирическая проверка и т. п.).

При предварительном объединении заданий в тест следует сделать следующее.

1. Проверить содержание и формулировку задач во взаимосвязи друг с другом.

2. При апробации теста следует включить в инструкцию пункт о том, что если испытуемому не удается справиться с заданием, его необходимо пропустить. Пропущенное задание возвращается в банк тестовых заданий, как шар в барабан, и будет предъявлено еще раз, если у испытуемого останется время.

3. Не комплектуйте вместе такое количество заданий, что среднему испытуемому для их выполнения потребуется более часа. Примерно столько длится период сосредоточения у испытуемых.

4. Проверьте выполнение требований к пространственному и шрифтовому оформлению тестовых заданий.

5. Важные части инструкции, должны быть подчеркнуты или выделены особым шрифтом.

6. Подготовьте инструкции для испытуемых, инструкции для ведущих, инструкции по апробации тестовых заданий.

По результатам апробации часть заданий будет отбракована. Исходя из этого, для апробации, следует взять некоторый запас заданий. Рекомендации по этому вопросу достаточно разноречивы – от 20 да 100 процентов от планируемого количества заданий. Из опыта создания тестов учебных достижений можно сказать, что важно не только общее количество заданий, а сохранение их баланса согласно технологической матрице. Возможен случай, когда приходится отбраковать 3-4 задания, однако эти задания относятся к одной группе технологической матрицы. В результате возникают серьезные трудности в создании теста. Считается целесообразным взять для апробации по 1-2 дополнительных задания от планируемого для каждой группы заданий в соответствии с технологической матрицей.

Целей апробации тестовых заданий (напомним, что в данном случае речь идет об апробации тестовых заданий, а не теста целиком) может быть несколько.

1. Определение трудности заданий с целью оценки его годности для испытуемых.

2. Определение тех заданий, в которых есть существенные недостатки.

3. Выявление случайных ошибок (опечаток, недостатков орфографии и пунктуации и т. д.).

4. Определение времени, необходимого на решения задания или всего теста целиком.

5. Анализ ответов на открытые вопросы с целью возможного уточнения формулировки правильных ответов или оценочной схемы.

6. Выявление недостатков в инструкциях.

Определение статистических характеристик является главным (после экспертной проверки содержания) средством диагностики тестовых свойств заданий. Статистические расчеты проводятся с целью выявления заданий, в которых есть недостатки, а не являются самоцелью процедуры апробации.

Вывод

Нами были разработаны и апробированы тесты по Excell. Для работы над данным проектом нам потребовался обширный спектр знаний, были изучены различные материалы.

Тесты были апробированы на учащихся групп операторов компьютерного набора. Результаты теста были удовлетворительными. Фундаментом для проведения тестов стала, среда дистанционного обучения LMS Moodle. Которая используется в нашем учебном заведении, это очень удобно для компьютерного тестирования.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]