- •1.Таблица одномерных частот, возможности ее использования для анализа данных.
- •2. Таблица сопряженности, ее назначение и возможности для анализа данных
- •3. Возможности использования мер центральной тенденции для анализа данных
- •4. Основные виды абсолютных и относительных частот в таблице сопряженности
- •5. Основные способы и правила преобразования переменных
- •6. Проверка нулевой статистической гипотезы на основе критерия Хи- квадрат
- •7. Понятие и роль дисперсии в анализе данных
- •8. Корреляционная матрица, ее назначение и возможности для анализа данных
- •9. Методы сравнения средних значений, их преимущества и недостатки
- •10. Коэффициенты симметричной и направленной связи между переменными
- •11. Назначение, основные этапы и требования к применению факторного анализа
- •12. Назначение содержание и возможности кластерного анализа
- •13. Назначение, содержание и возможности регрессионного анализа
- •14. Назначение, содержание и возможности дискриминантного анализа
4. Основные виды абсолютных и относительных частот в таблице сопряженности
5. Основные способы и правила преобразования переменных
Цель перекодировки значений переменных: сжатие информации, подготовка переменных для получения более компактных таблиц сопряженности.
Для перекодировки в SPSS используется процедура «Преобразовать» (Transforme), «Перекодировать в другие переменные» (Recode into Different Variables).
Общее принципиальное правило при перекодировке: сколько бы значений не имела та или иная переменная, все они могут быть сведены к двум дихотомическим.
Правило 1. Все переменные, измеренные по метрическим шкалам, т.е. имеющие непрерывный характер, необходимо преобразовать в прерывистые (дискретные).
Задаем статистики: меры центральной тенденции, изменчивости, значения процентилей (по 10%).
Правило 2. Все переменные, измеренные по пятичленной порядковой шкале, можно преобразовать в трехчленные, сохраняя порядок.
При преобразовании в трехчленную шкалу необходимо 0 объявить пропущенным значением.
Правило 3. Все переменные, измеренные по порядкововым и неполностью упорядоченным шкалам, при ненаполненности ответов (ответы считаются ненаполненными, если их выбрали менее 20 респондентов), либо при их явной ненаполненности по отношению к модальным значениям преобразуются в статистически значимые группы или дихотомические категории.
Правило 4. Значения переменных: «затрудняюсь ответить», «другой ответ», либо набравших не более 5 ответов необходимо объявить пропущенными. Выполнение этой процедуры осуществляется в окне «Переменные» - Столбец «Пропущенные» (Missing).
6. Проверка нулевой статистической гипотезы на основе критерия Хи- квадрат
При проведении теста Хи - квадрат проверяется взаимная независимость двух переменных таблиц сопряженности. Эта процедура соответствует идее нулевой гипотезы, широко используемой в математической статистике. Выдвигая нулевую гипотезу, мы утверждаем: связь между рассматриваемыми переменными отсутствует. Проверка нулевой гипотезы основана на сравнении значений наблюдаемых и ожидаемых частот. Определяют значимо или не значимо расхождение частот. Две переменные считаются взаимно независимыми, если значения наблюдаемых частот в ячейках совпадают со значениями ожидаемых. Опровержение нулевой гипотезы позволяет утверждать о возможной связи между спрягаемыми переменными.
Величина Хи - квадрат всей таблицы получается в результате вычисления суммы квадратов нормированных остатков по всем ячейкам таблицы. Эта величина не нормирована и может изменяться от нуля до бесконечности. При отсутствии связи будут преобладать значения Хи-квадрата близкие к нулю, поскольку полное отсутствие связи означает равенство наблюдаемых и ожидаемых частот. Большое значение Хи-квадрат должно приводить нас к утверждению о наличии связи.
В целом показатель асимптотической двухсторонней значимости Хи -квадрат Пирсона является наиболее доступным простым способом для опровержения или соглашения с нулевой гипотезой. Если данный вид значимости меньше 0,05 - нулевая гипотеза опровергается, если больше 0,05 возможность существования связи между сопрягаемыми переменными отклоняется.
Корректность проведения теста Хи-квадрат определяется еще очень важным условием: количество ожидаемых частотот значения которых меньше пяти, должны встречаться не более чем в 20% ячеек таблицы. В противном случае необходимо уменьшить размерность таблицы путем перекодирования одних значений переменных в другие - укрупненные или присвоить им код пропущенных, если количество таких переменных незначительно.