- •Математические методы
- •Содержание
- •Раздел I
- •Тема 1. Измерения в психологии
- •Тема 2. Представление данных
- •Тема 3. Меры центральной тенденции
- •Тема 4. Меры изменчивости
- •Тема 5. Распределение признака.
- •Тема 6. Понятие выборки
- •1.2 Шкалы измерения
- •Представление данных
- •2.1 Группировка данных
- •2.2 Табулирование данных
- •2.3 Ранговый порядок
- •2.4 Распределение частот
- •2.5 Статистические ряды
- •2.6 Понятие распределения
- •Меры центральной тенденции
- •3.1 Мода
- •Замечание
- •3.2 Медиана
- •3.3 Среднее
- •3.4 Мода, медиана и среднее значение объединенных групп
- •3.5 Интерпретация моды, медианы и среднего значения
- •3.6 Выбор мер центральной тенденции
- •Меры изменчивости
- •4.1 Размах
- •4.2 Дисперсия и стандартное отклонение
- •Задача 4.1
- •Свойства дисперсии
- •Распределение признака. Нормальное распределение
- •5.1 Параметры распределения
- •5.2 Нормальное распределение
- •5.3 Асимметрия
- •5.4 Эксцесс
- •5.4 Применение нормального распределения
- •Понятие выборки
- •6.1 Полное и выборочное исследования
- •6.2 Зависимые и независимые выборки
- •6.3 Требования к выборке
- •6.4 Репрезентативность выборки
- •6.5 Формирование выборки
- •6.6 Определение объема выборки
- •Раздел II
- •Тема 7. Статистические гипотезы и
- •Тема 8. Классификация психологических
- •7.2 Статистические критерии
- •7.3 Параметрические и непараметрические методы
- •7.4 Уровни статистической значимости
- •Замечание
- •7.5 Правило отклонения нулевой и принятия альтернативной гипотезы
- •Задача 7.1
- •7.6 Мощность критериев
- •Классификация психологических задач, решаемых с помощью статистических методов
- •8.1 Классификация задач
- •Показатели группы а п Эффективность воздействия признаковризнак 1
- •После изменения
- •Показатели группы а п Степень согласованности или взаимосвязь ризнак 1
- •Показатели группы а у Сопоставление индивидуальных значений при изменении условийсловие 1
- •8.2 Принятие решения о задаче и методе
- •Раздел III
- •Тема 9. Корреляционный анализ
- •Тема 10. Выявление различий в уровне исследуемого признака
- •Тема 11. Оценка достоверности сдвига в значениях исследуемого
- •Тема 12. Критерии согласия
- •9.2 Коэффициент ранговой корреляции rS спирмена
- •9.3 Коэффициент линейной корреляции пирсона
- •9.4 Расчет уровней значимости коэффициентов корреляции
- •9.5 Коэффициент корреляции
- •Тема 10
- •Выявление различий в уровне исследуемого признака
- •10.1 Постановка задачи
- •10.2 Q – критерий розенбаума
- •10.3 S – критерий тенденций джонкира
- •Определим величину a: . Теперь определим величину b по формуле (10.11):
- •Тема 11
- •Оценка достоверности сдвига в значениях исследуемого признака
- •11.1 Постановка задачи
- •11.2 T – критерий вилкоксона
- •Типичными сдвигами в этой задаче являются сдвиги в сторону увеличения – их больше. Нетипичными – в сторону уменьшения.
- •Гипотезы к задаче
- •Тема 12
- •Выявление различий в распределении признака
- •12.1 Постановка задачи
- •12.2 2 Критерий пирсона
- •Гипотезы к задаче
- •12.3 – Критерий колмогорова-смирнова
- •12.4 Критерий * - угловое преобразование фишера
- •Гипотезы к задаче
- •Значение функции (ординаты единичной нормальной кривой)
- •Критические значения выборочного коэффициента корреляции рангов
- •Критические значения выборочного коэффициента линейной корреляции rxy Пирсона
- •Критические значения t-критерия Стьюдента при различных уровнях значимости
- •Критические значения критерия q-Розенбаума для уровней статистической значимости 0,05 и 0,01
- •Критические значения критерия s-Джонкира для количества групп (с) от трех до шести и количества испытуемых в каждой группе от двух до десяти
- •Критические значения критерия t Вилкоксона для уровней статистической значимости
- •Критические значения критерия 2 для уровней статистической значимости α 0,05 и α 0,01 при разном числе степеней свободы V
- •Критические значения dmax соответствующие уровням статистической значимости ,05 и 0,01 при сопоставлении эмпирического распределения с теоретическим
- •Таблицы для углового преобразования Фишера
- •Уровни статистической значимости разных значений критерия * Фишера
- •Лабораторные работы по дисциплине «Математические методы в психологии»
- •Лабораторная работа №1 Представление данных
- •Лабораторная работа №2 Графическое представление данных
- •Лабораторная работа № 3 Описательная статистика
- •Лабораторная работа №4 Корреляционный анализ
- •Данные для вариантов 1-6 (х1 – усредненные эталонные оценки, х2 – индивидуальные показатели преподавателя н-ва):
- •Данные для вариантов 7-12 (х1 – количество аварийных ситуаций, х2 – стаж вождения автомобиля):
- •Лабораторная работа №5 Оценка достоверности различий между двумя выборками по уровню признака
- •Данные для вариантов 7-12 (х1 – данные по детям из неблагополучных семей, х2 – данные по детям из благополучных семей):
- •Лабораторная работа №6 Оценка достоверности различий между несколькими выборками по уровню признака
- •Лабораторная работа №7 Оценка достоверности сдвига
- •Лабораторная работа №8 Оценка достоверности расхождения или согласия распределений (критерий Пирсона)
- •Лабораторная работа №9 Оценка достоверности расхождения или согласия распределений (критерий - Колмогорова-Смирнова)
- •Лабораторная работа №10 Многофункциональный критерий Фишера
- •Описание статистических функций табличного процессора Microsoft Excel
- •Частота
- •______________________________ Ранг
- •______________________________ Мин
- •______________________________ Срзнач
- •______________________________ Медиана
- •______________________________ Мода
- •______________________________ Счёт
- •______________________________ Счётесли
- •______________________________ Дисп
- •______________________________ Стандотклон
- •______________________________ Скос
- •Эксцесс
- •______________________________ Хи2тест
- •______________________________ Хи2обр
- •Применение пакета анализа для решения статистических задач в табличном процессоре Microsoft Excel
- •Корреляция
- •Литература
- •Математические методы в психологии Учебно-методическое пособие
6.5 Формирование выборки
Возникает закономерный вопрос: как сформировать репрезентативную выборку? С точки зрения статистики, репрезентативность выборки означает, что представленное в выборке распределение изучаемых признаков соответствует (с определенной долей погрешности) их распределению в генеральной совокупности.
Опишем два метода, обеспечивающие репрезентативность выборки.
Первый метод – формирование простой случайной выборки. В этом случае выборка состоит из элементов, отобранных из генеральной совокупности таким образом, чтобы каждый элемент этой совокупности имел равные возможности (равную вероятность) попасть в выборку. Полученная таким образом выборка называется простой случайной выборкой.
Получить простую случайную выборку можно путем обычной жеребьевки (по аналогии с лотереей) или с помощью специальных таблиц случайных чисел. В последнем случае элементы генеральной совокупности перенумеровываются и из таблицы случайных чисел, открытой на произвольной странице, выписываются номера элементов, которые должны быть взяты в выборку. Данная процедура трудно осуществима, поскольку для ее реализации необходимо учитывать каждого представителя генеральной совокупности.
Второй метод основывается на понятии стратифицированной случайной выборки. Для этого необходимо разбить элементы генеральной совокупности на страты (группы) в соответствии с некоторыми характеристиками. Например, при обследовании спроса на некоторый товар генеральную совокупность желательно разбить на группы, различающиеся по величине дохода, социальной принадлежности или даже по месту жительства (город, деревня). Если произведена подобная разбивка совокупности и случайная выборка производится отдельно из каждой группы (страты), то полученная в итоге выборка носит название стратифицированная случайная выборка.
6.6 Определение объема выборки
Как определяется объем выборки? Подчеркнем, что он зависит, прежде всего, от задач исследования. Психолог может изучать единичные случаи, если те по каким-либо причинам представляют особый интерес для науки. Так, например, строится работа с одаренными детьми, каждый из которых, как правило, имеет свои неповторимые особенности. Предметом отдельного исследования могут служить также редкие или уникальные случаи нарушения развития. В частности, пристальное внимание известного ученого П.К. Анохина и его сотрудников было сосредоточено на изучении особенностей функционирования организма сросшихся сиамских близнецов Маши и Даши (это пример так называемой минимальной выборки).
Когда психолог ставит целью изучение характеристик, присущих многим представителям генеральной совокупности, возникает вопрос о наиболее приемлемом объеме выборки. В этих случаях очевидно, что больший объем выборки позволяет получить более надежные результаты. Объем выборки зависит также от степени однородности изучаемого явления. Как правило, чем более однородно изучаемое явление, тем меньше может быть объем выборки. Например, психолог изучает выраженность уровня маскулинности-феминности у мастеров спорта по хоккею. Поскольку подобная группа спортсменов представляет собой достаточно однородную выборку, то ее объем может быть весьма небольшим, например, в пределах одной команды – 12-20 человек.
Кроме того, объем выборки зависит от тех статистических методов, которые предполагается использовать. Одни методы требуют большого количества испытуемых в выборке, другие могут применяться при относительно небольшом их количестве. Например, некоторые непараметрические критерии различий могут использоваться при сравнении групп численностью в 5-7 человек, а факторный анализ наиболее адекватен, если объем выборки составит около 100 человек.
Для психологических исследований рекомендуется использовать экспериментальную и контрольную группы, так чтобы численность обеих сравниваемых групп была не менее 30-35 испытуемых в каждой.
В целом для определения объема выборки в социальных системах можно выделить следующие методы:
вольный подход по «методу научного тыка»; например, определяется, что достаточное количество опрошенных для получения надежных результатов в социологии или педагогике должно быть 5 или 10% от совокупности. Анализ литературных источников, посвященных расчетам объемов выборок, ни теоретически, ни эмпирически не подтверждает такие объемы;
принято считать, что при n 60 выборка большая или репрезентативная, но такое деление тоже весьма условно;
по аналогии с другими исследованиями, например, известно, что при социологических опросах выборка составляет 1000–1200 человек, соответственно назначается и размер данной выборки;
с учетом стоимости затрат; когда сумма, что может быть использована на исследования, определена заблаговременно;
на основе статистического анализа, когда объем выборки определяется, исходя из условий надежности и достоверности полученных результатов.
Для определения статистически обоснованного объема выборки различные источники дают одну формулу, основанную на уже известных характеристиках распределения:
(6.1)
где n– объем выборки,
σ– стандартное отклонение,
N– объем генеральной совокупности,
– предельная ошибка репрезентативности, задается обычно в пределах от 0,01 до 0,10 с наиболее частым употреблением 0,05 (5%);
t– табулированная константа, табличные значения этой величины следующие:t=1,96, при=0,05;t=2,58, при=0,01.
Если о характеристиках статистических величин ничего не известно, то дисперсия может быть оценена по правилу «шести сигм»:
(6.2)
где хmax – максимальное значение шкалы измерения,
хmin – минимальное значение шкалы,
K– значение, установленное по таблице 6.1 (по Плохинскому, 1970).
Таблица 6.1
n |
2-5 |
6-15 |
16-49 |
50-200 |
201-1000 |
>1000 |
K |
2 |
3 |
4 |
5 |
6 |
7 |
Для исследования в социальных системах можно использовать также таблицу 6.2
Таблица 6.2
Объем генеральной совокупности N, (ед.) |
500 |
1000 |
2000 |
3000 |
4000 |
5000 |
10000 |
100000 |
|
Объем выборки, n (ед.) |
222 |
286 |
333 |
350 |
360 |
370 |
385 |
398 |
400 |
В завершение приведем несколько рассуждений об оптимальном объеме выборок.
Рассмотрим следующий пример, заимствованный из Nisbett, etal., 1987. Имеются 2 больницы. Предположим, что в первой из них ежедневно рождается 120 детей, во второй только 12. В среднем отношение числа мальчиков, рождающихся в каждой больнице, к числу девочек 50/50. Однажды девочек родилось вдвое больше, чем мальчиков. Спрашивается, для какой больницы данное событие более вероятно? Ответ очевиден для статистика, однако он не столь очевиден неискушенному. Конечно, такое событие гораздо более вероятно для маленькой больницы. Объяснение этого факта состоит в том, что вероятность случайного отклонения (от среднего) возрастает с уменьшением объема выборки.
Если связь между переменными «объективно» слабая (т.е. свойства выборки близки к свойствам генеральной совокупности), то не существует иного способа проверить такую зависимость, кроме как исследовать выборку достаточно большого объема. Даже если выборка, находящаяся в вашем распоряжении, совершенно репрезентативна, эффект не будет статистически значимым, если выборка мала. Аналогично, если зависимость «объективно» (в генеральной совокупности) очень сильная, тогда она может быть обнаружена с высокой степенью значимости даже на очень маленькой выборке.
Другой пример. Представьте, что вы бросаете монету. Если монета слегка несимметрична и при подбрасывании орел выпадает чаще «решки» (например, в 60% подбрасываний выпадает орел, а в 40% «решка»), то 10 подбрасываний монеты было бы недостаточно, чтобы убедить кого бы то ни было, что монета асимметрична, даже если был бы получен, казалось, совершенно репрезентативный результат: 6 «орлов» и 4 «решки». Не следует ли отсюда, что 10 подбрасываний вообще не могут доказать что-либо? Нет, не следует, потому что если эффект, в принципе, очень сильный, то 10 подбрасываний может оказаться вполне достаточно для его доказательства. Представьте, что монета настолько несимметрична, что всякий раз, когда вы ее бросаете, выпадает «орел». Если вы бросаете такую монету 10 раз и всякий раз выпадает «орел», большинство людей сочтут это убедительным доказательством того, что с монетой что-то не то. Другими словами, это послужило бы убедительным доказательством того, что в генеральной совокупности, состоящей из бесконечного числа подбрасываний этой монеты «орел» будет встречаться чаще, чем «решка». В итоге этих рассуждений мы приходим к выводу: если зависимость сильная, она может быть обнаружена даже на малой выборке.
? ВОПРОСЫ И УПРАЖНЕНИЯ
Дайте определение следующим понятиям: выборка и генеральная совокупность; выборочное и сплошное исследования; зависимые и независимые выборки; выборки повторные и бесповторные.
Дайте характеристики следующим выборкам: однородная, простая, случайная, стратифицированная, репрезентативная.
Перечислите и охарактеризуйте методы формирования выборки и методы определения ее объема.
Психолог ставит целью своего исследования доказать различия в результативности обучения чтению в двух группах первоклассников, обучающихся по разным методикам. Определите для исследования требования к выборкам учащихся.