- •Статистические методы в психологии Учебно-методический комплекс
- •Содержание
- •Введение
- •Краткое содержание лекционных занятий
- •2. Проблемы измерения в психолого-педагогических исследованиях
- •3. Основные проблемы применения статистических методов в психологических исследованиях
- •Библиография
- •Лекция 2.
- •2. Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий.
- •Библиография
- •Лекция 3.
- •2. Понятие вероятности
- •3. Алгебра событий
- •4. Основная терминология в алгебре событий
- •Библиография
- •Лекция 4.
- •2. Закон распределения случайных величин
- •3. Биномиальное распределение (распределение Бернулли)
- •4. Распределение Пуассона
- •5. Нормальное (гауссовское) распределение
- •6. Равномерное распределение
- •7. Распределение Стьюдента
- •Библиография
- •Лекция 5.
- •2. Первичный взгляд на данные. Графическая визуализация данных выборки. Диаграмма рассеяния
- •3. Количественное описание выборочных данных
- •4. Выборочное среднее значение
- •Библиография
- •Лекция 6 Статистические таблицы
- •1. Понятие о статистической таблице. Элементы статистической таблицы
- •2. Виды таблиц по характеру подлежащего
- •3. Виды таблиц по разработке сказуемого
- •4. Основные правила построения таблиц
- •5. Чтение и анализ таблицы
- •6. Таблицы сопряженности
- •Библиография
- •Лекция 7 Шкалы измерения
- •1. Понятие измерения
- •2. Измерительные шкалы
- •Библиография
- •Лекция 8. Средние величины. Кривая нормального распределения
- •1. Распределения переменных величин
- •Проверка нормальности распределения
- •Библиография
- •Лекция 9 Понятие о генеральной и выборочной совокупности
- •1. Генеральная совокупность и выборка
- •2. Проблема репрезентативности выборки
- •Библиография
- •Лекция 10. Статистические гипотезы
- •Библиография
- •Лекция 11 Статистические критерии
- •Библиография
- •2. Определение надёжности тестов
- •3. Стандартизация психодиагностических тестов
- •Библиография
- •Лекция 13 Критерии различия в уровне исследуемого признака
- •Библиография
- •Лекция 14. Критерии оценки достоверности сдвига в значениях исследуемого признака
- •Алгоритм подсчета g – критерия знаков
- •Алгоритм вычисления т – критерия Вилкоксона
- •5. Применение непараметрических критериев: классификация сдвигов и критериев оценки их статистической достоверности
- •Библиография
- •Лекция 15. Критерии различия в распределении признака
- •1. C2 критерий Пирсона
- •Библиография
- •Лекция 16. Многофункциональные статистические критерии
- •1. Критерий j* - угловое преобразование Фишера
- •Алгоритм расчета критерия φ*
- •3. Биномиальный критерий m
- •Библиография
- •Лекция 17–18
- •2. Коэффициент корреляции Пирсона
- •3. Корреляция метрических переменных
- •4. Корреляция ранговых переменных
- •5. Корреляция дихотомических переменных
- •Библиография
- •Лекция 19.
- •2. Множественный регрессионный анализ
- •3. Нелинейная регрессия
- •Однофакторный линейный регрессионный анализ (простая регрессия). Метод наименьших квадратов
- •5. Многофакторный линейный регрессионный анализ
- •6. Нелинейный регрессионный анализ
- •7. Проблемы регрессионного анализа
- •Библиография
- •Лекция 20. Кластерный анализ
- •1. Понятие кластерного анализа
- •2. Выбор переменных
- •3. Выбор метода кластерного анализа
- •9. Метод к-средних
- •4. Последовательность кластерного анализа
- •Библиография
- •Лекция 21. Факторный анализ
- •1. Понятие факторного анализа
- •3. Методы факторного анализа
- •4. Вращение матрицы факторных нагрузок
- •Библиография
- •Лекция 22 Дисперсионный анализ
- •1. Понятие дисперсионного анализа.
- •2. Основные идеи дисперсионного анализа
- •3. Ограничения и предположения дисперсионного анализа
- •5. Многофакторый дисперсионный анализ
- •3 Уровня
- •2 Уровня
- •Библиография
- •Тематика практических занятий
- •Тема: Понятие о случайной величине
- •Тема: Понятие о событии. Система событий.
- •Тема: Вероятность
- •Тема: Распределение случайной величины
- •Практическое занятие 6 -7
- •Практическое занятие 8
- •Практическое занятие 9
- •Практическое занятие 10–11 Тема: Стандартизация данных психологических тестов (4 часа)
- •Практическое занятие 12 Тема: Выборка и генеральная совокупность (2 часа)
- •Практическое занятие 13 Тема: Точечное и интервальное оценивание (2 часа)
- •Практическое занятие 14 Тема: Статистические гипотезы и статистические критерии (2 часа)
- •Практическое занятие 15 Тема: Ошибки вывода (2 часа)
- •Практическое занятие 16 Тема: Меры центральной тенденции. Меры изменчивости (2 часа)
- •Практическое занятие 17–18 Тема: Понятие корреляции. Коэффициенты корреляции (4 часа)
- •Практическое занятие 19–20
- •Практическое занятие 21
- •Практическое занятие 22
- •Практическое занятие 23 Тема: Однофакторный дисперсионный анализ (2 часа)
- •Практическое занятие 24–25 Тема: Многофакторный дисперсионный анализ (4 часа)
- •Практическое занятие 26
- •Практическое занятие 27–28
- •Практическое занятие 29–30 Тема: Гистографический анализ (4 часа)
- •Практическое занятие 31
- •Практическое занятие 32–33
- •Практическое занятие 34–35
- •Практическое занятие 36
- •Практическое занятие 37
- •Практическое занятие 38–39
- •Практическое занятие 40
- •Практическое занятие 41–42 Тема: Применение метода моделирования в психологии (2 часа)
- •Тестовые задания
- •Тема 1. Понятие о событии и системе событий
- •Тема 2. Понятие о величине. Распределение случайной величины
- •Тема 3. Статистические таблицы
- •Тема 4. Выборка. Выборочная и генеральная совокупность
- •Тема 5. Меры центральной тенденции
- •Тема 6. Понятие измерения. Измерительные шкалы
- •Тема 7. Статистические критерии и гипотезы
- •Тема 8. Выявление различий в уровне исследуемого признака
- •Тема 9. Понятие корреляции
- •Тема 10. Многомерные методы
- •Тема 11. Факторный анализ
- •Тема 12. Многомерное шкалирование
- •Тема 13. Множественный регрессионный анализ
- •Тема 14. Кластерный анализ
- •Тема 15. Дискриминантный анализ
- •Тема 16. Дисперсионный анализ
- •Тема 17. Стандартизация данных психологических тестов
- •Тема 18. Общие понятия курса
- •Варианты контрольных работ
- •Вопросы к зачёту
- •Вопросы к экзамену
- •Основная литература
- •Дополнительная литература
- •Ключ к тестовым заданиям
- •Глоссарий
6. Нелинейный регрессионный анализ
В большинстве случаев нелинейные регрессионные зависимости между случайными величинами стараются объяснить, используя технику линейного анализа. Для этого выполняются следующие процедуры:
преобразование и замену переменных, которая приводит к линейной модели, затем
линейный регрессионный анализ и, наконец,
обратное преобразование и замену переменных, для получения оценок параметров нелинейной регрессионной модели.
Случаи, наиболее часто встречающиеся на практике, иллюстрируются приведенной ниже таблицей:
Исходная модель |
Преобразование |
Тип преобразования |
|
|
логарифмическое |
|
|
обратное (отношение) |
|
|
Полиномиальное |
|
7. Проблемы регрессионного анализа
Регрессионный анализ является основой для предсказания поведения случайного явления (процесса) за пределами данных. Уже в самом простом случае – линейной регрессии – продолжение регрес-сионной прямой за пределы интервала данных (аргумента) является простейшей формой предсказания. Помимо этого, для предсказания – прогноза развития явления или процесса по располагаемым данным – наиболее часто применяются следующие стандартные процедуры, которые представлены в пакете анализа MSExcel:
Скользящее среднее. Используется для расчета значений в прогнозируемомпериоде на основе среднего значения переменной для указанного числа предшествующих периодов. Скользящее среднее, в отличие от простого среднего для всей выборки, содержит сведения о тенденциях изменения данных. Этот метод может использоваться для прогноза сбыта, запасов и других процессов. Расчет прогнозируемых значений выполняется по следующей формуле:
где:
n – число предшествующих периодов, входящих в скользящее среднее;
Aj – фактическое значение в момент времениj;
FT– прогнозируемое значение в момент времениT.
Экспоненциальное сглаживание. Применяется для предсказания значения на основе прогноза для предыдущего периода, скорректированного с учетом погрешностей в этом прогнозе. При анализе используется константа сглаживания a, по величине которой определяется степень влияния на прогнозы погрешностей в предыдущем прогнозе. Прогноз выполняется по формуле:
Проблемы регрессионного анализа.К числу типичных проблем, возникающих при регрессионном анализе данных, относятся мультиколлинераность, гетероскедастичность и автокорреляция в остатках.
Мультиколлинеарность – термин, означающий наличие высокой степени корреляции влияющих переменных; в результате влияние таких факторов оказывается трудно разделить. Для обнаружения явления мультиколлинеарности в данных используется стандартная техника корреляционного анализа – определяются парные коэффициенты корреляции данных, описывающих влияющие переменные. Если в этих данных обнаруживается тесная корреляция, то, обычно, понижают размерность регрессионной модели исключением одной или нескольких переменных.
Гетероскедастичность– термин, обозначающий неоднородность дисперсии. В отношении регрессии речь идет о неоднородности дисперсии ошибок (остатков). Следует помнить, что метод наименьших квадратов – основа регрессионного анализа – предполагает постоянство дисперсии ошибок (только в этом случае оценки параметров линейной регрессии получаютсяBLUE–BestLinearUnbiasedEstimators(наилучшие линейные несмещенные оценки)). Простейший тест, обнаруживающий гетероскедастичность, заключается в упорядочении данных в порядке возрастания влияющей переменных и проведении регрессионного анализа для двух вариантов – для интервала малых значений и для интервала больших значений влияющей переменной (опуская, к примеру, 5-ю часть средних по величине значений). Затем проводят анализ отношения сумм квадратов ошибок по первому и второму вариантам с использованиемF-распределения с(N – D – 2k)/2степенями свободы (здесьN– полное число наблюдений,D– число исключенных наблюдений,k– число оцениваемых параметров), используя в качестве нуль-гипотезы гипотезу о том, что это отношение существенно отлично от 0.Примечание:Если дисперсия ошибки пропорциональнаX2 (частый случай!), то гетероскедастичность может быть устранена делением каждого члена уравнения регрессии наXи переоценкой регрессии в модифицированной таким образом модели.
Автокорреляция (остатков) – явление, встречающееся в регрессионном анализе временных рядов и заключающееся в том, что ошибка (остаток) в один момент времени положительно коррелирован с ошибкой (остатком) в предшествующий момент времени (автокорреляция первого порядка). На практике явление автокорреляции приводит к смещению стандартных оценок параметров регрессии вниз, к некорректности результатов статистических тестов и оценкам доверительных интервалов