Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Линда Джуэлл Индустриально-организационная псих....doc
Скачиваний:
29
Добавлен:
12.07.2019
Размер:
15.84 Mб
Скачать

Исследования крупным планом неполная эквивалентность обычной и компьютерной версий батареи тестов общих способностей

Вопрос исследования: Эквивалентны ли печатный и компьютерный варианты

батареи тестов общих способностей?

Тип исследования: Лабораторный эксперимент.

Испытуемые: 250 мужчин и 76 женщин в возрасте от 16 до 31 года, поступавших в Королевскую военную академию (Нидерланды).

Независимая переменная: Проведение теста на компьютере или в письменной форме.

Зависимые переменные: Количество вопросов, на которые даны ответы, и доля вопросов, на которые даны правильные ответы.

Общая процедура: Половине испытуемых предлагался компьютерный вариант батареи тестов общих способностей (GABT); другая половина проходила тестиро­вание в обычной письменной форме. Две группы испытуемых были сопоставимы по возрасту, полу и результатам теста общего интеллекта.

Результаты: Испытуемые, которым был предложен компьютерный вариант теста, работали быстрее и ответили на большее количество вопросов. Испытуемые, ко­-

торым предлагался стандартный вариант теста, ответили на меньшее количество вопросов, но у них была выше доля правильных ответов; этот эффект был силь­нее выражен в случае простых тестов.

Вывод: «...эквивалентность компьютерного и печатного вариантов теста должна быть продемонстрирована, а не принята в качестве предположения...» (стр. 858).

На основе статьи

F. J. R. Van de Vijver and M. Harsveld, «The Incomplete Equivalence of the Paper-and-Pencil and Computerized Versions

of the General Aptitude Test Battery»,

Journal of Applied Psychology, 1994, 79, 852-859.

Интерпретация коэффициента надежности

В результате применения любого из описанных трех методов оценки степени надеж­ности теста как измерительного инструмента получается одно число — коэффициент корреляции. Это число, которое обозначают буквой r, может изменяться в пределах от 0 до 1,00, но что это означает? Например, если = 0,60, означает ли это, что тест имеет приемлемую надежность, или нет?

Большинство психологов согласятся с тем, что приемлемым является коэффици­ент надежности теста, превышающий 0,80, а наиболее желательны его значения выше 0,90. Мнения по поводу минимального приемлемого значения могут расходиться, по-скольку тесты используются с. самыми разнообразными целями. Например, Дреер и Мэй-Дальтон (Dreher & Mai-Dalton, 1983) пришли к выводу, что для теста под назва­нием Manifest Needs Questionnaire («Вопросник проявляющихся в поведении потреб­ностей») «минимально значимой» будет оценка внутренней согласованности, равная 0,60.

По идеальным стандартам значение г = 0,60 является низким; оно также ниже тра­диционного нижнего предела для Альфа-оценки Кронбаха внутренней согласованно­сти (Nunnally, 1978). Но Manifest Needs Questionnaire чаще всего используется с ис­следовательскими целями, и в таком контексте стандарты надежности могут быть бо-лее.гибкими. Когда результаты теста используются для принятия решений, имеющих важное значение в жизни человека, таких как прием на работу или поступление в колледж, применяются традиционные, более высокие стандарты. Поэтому стандарты оценки коэффициента надежности, как и выбор метода, в какой-то степени зависят от цели исследования.

Соображения, которые следует учитывать при оценке доказательств надежности теста, подробно рассматриваются в учебниках по тестологни. Не имея глубоких зна­ний по этому вопросу, лучше всего, по-видимому, воспользоваться проверенным эм­пирическим правилом «чем выше надежность, тем лучше», поскольку надежность теста непосредственно влияет на стандартную погрешность измерения с помощью данного теста. Эта статистическая характеристика, в свою очередь, важна для практического использования теста.