- •29. Понятие и виды документов
- •30.Традиционный/неформализованный анализ документов
- •31. Количественные методы анализа документов
- •32.Контент-анализ: понятие и виды
- •33.Процедуры контент-анализа
- •34. Ивент-анализ
- •35. Процедуры ивент-анализа.
- •36.Когнитивное картирование.
- •37. Когнитивное картирование
- •38. Интент-анализ
- •39. Процедуры интент-анализа
- •40.Дискурс-анализ
- •1.)Лингвистический анализ.
- •41. Статистический анализ в политологии.
- •42. Анализ одномерных распределений.
- •43. Анализ связи между двумя переменными
- •44. Изучение взаимосвязи между несколькими переменными
- •45.Статистика хи-квадрат (х2)
- •46. Корреляционный анализ
- •49. Процедуры множественного регрессионного анализа.
- •50. Факторный анализ
- •51. Процедура факторного анализа
- •52. Кластерный анализ
- •53.Процедуры кластерного анализа.
- •54.Сетевой анализ
- •55. Процедуры сетевого анализа
- •56. Политическая экспертиза: понятие и структура
- •57. Методы политической экспертизы
- •58. Мозговой штурм(брейнсторминг)
- •59. Swot
- •60. Методы качественного анализа в прикладном исследовании
44. Изучение взаимосвязи между несколькими переменными
Основные положения совпадают с требованиями к билету №43,увеличится лишь размерность таблицы и надо после раскрытия основных положений, сходных с билетом 43, -перечислить основные методики анализа связи между несколькими переменными- а именно- метод хи квадрат(билет 45), регрессионный анализ, корреляционный анализ, кластерный, анализ, сетевой анализ, факторный анализ.
45.Статистика хи-квадрат (х2)
Понятие и расчет у2
Статистический анализ полученных с помощью массового опроса данных, как и анализ наблюдений изучаемого явления или статистических данных, включает несколько уровней сложности и возможностей получения дополнительной (скрытой) информации. Только слабо подготовленные специалисты, не стремящиеся предоставить заказчику максимально полные и объективные сведения об изучаемом явлении, ограничиваются описанием в отчете сведений об одномерных или двумерных сгруппированных данных в процентах. Современные методы обработки данных в статистических пакетах позволяют с помощью простых манипуляций получить дополнительные сведения об устойчивости, непротиворечивости и т.п. взглядов респондентов. Процентные распределения ответов респондентов всего лишь фиксируют «картинку» на момент опроса, в то время как более сложные методы обработки информации позволяют ответить на ключевые вопросы, которые не могут не волновать заказчика: насколько обнаруженные данные являются устойчивыми и закономерными, насколько применима к ним процедура экстраполяции во времени? Обязательной процедурой с точки зрения современных стандартов аналитики являются оценка плотности связи между переменными, осуществляемая с помощью корреляционного анализа, и предшествующая ей процедура оценки критерия хи-квадрата по Пирсону. Эту процедуру считают необязательной в трех следующих случаях (хотя ее выполнить можно): при оценке плотности связи переменных в таблице размерностью 2x2, при проведении процедуры ранговой корреляции для двух переменных, построенных на основе порядковых шкал, и при оценке степени синхронности процессов в двух динамических рядах. Условия проведения расчета статистики хи-квадрат, обеспечивающие ее универсальность, очень мягкие, нежесткие.
Расчет статистики можно выполнять на переменных, измеренных с помощью как абсолютных метрических, интервальных, порядковых, так и номинальных шкал.
Переменные могут быть как дискретными, так и непрерывными.
Предварительного исследования характера распределения изуча
емых признаков не требуется.
Критерий статистики хи-квадрат является непараметрическим, так как он не требует проверки нормальности распределения, которому подчинялась бы выборка.
В социальных и политических исследованиях результат наблюдений, подтверждающий справедливость выдвинутой гипотезы, крайне редко выступает основанием для ее принятия как истинной, поскольку он может также сочетаться и с рядом других объяснительных гипотез. Например, успешность политической карьеры национального лидера может объясняться его личностными характеристиками (яркость личности, волевые характеристики, интеллект, способность к эффективной коммуникации и т.д.). Но это отнюдь не означает, что успешность политической карьеры не может быть объяснена и другими причинами, например принадлежностью к определенному клану или месту получения образования.
Тест хи-квадрат используется для двухвходовых таблиц сопряженности (комбинированные таблицы, связывающие два признака). Затем формулируют нулевую и альтернативную гипотезы. Нулевая гипотеза (Hf) — утверждение, отрицающее зависимость между радами переменных. Доказательство ее ложности свидетельствует о том, что связь между переменными существует. Для нашего случая — «электоральная активность мужчин и женщин совпадает». Альтернативная гипотеза (HJ — гипотеза о наличии связи между признаками. Для нашего случая — «уровень электоральной активности мужчин и женщин различается». Затем строят дополнительную таблицу ожидаемой (теоретической) частоты. Для заполнения ее ячеек произведение соответствующих маргинальных частот (значения соответствующих маргинальных — итоговых — строкй и столбца) делят на общее число респондентов:
Далее полученное значение необходимо сравнить с табличным критическим значением. Для этого нам необходимо определить так называемые степени свободы (df).
Другая необходимая величина — уровень статистической значимости. Он показывает, насколько вероятна связь, зафиксированная между двумя признаками в выборке, т.е. этот показатель оценивает вероятность того, что при отборе других наблюдений из генеральной совокупности мы получим аналогичный результат.
Условия корректного проведения расчета х2
Надежность полученных результатов проведения теста у} определяется рядом условий.
Во-первых, нежелательно, чтобы у каждой из переменных, включенных в анализ, число градаций превышало четыре (если число значений у переменных больше четырех, значительно снижаются возможности для интерпретации и надежность вывода).
Во-вторых, выборка (число наблюдений) не должна быть слишком мала. Это означает, что наполнение ячеек в анализируемой таблице не должно быть меньше 10, согласно В. А. Ядову — менее пяти, т.е. он указывает на более мягкие требования, так как в противном случае нельзя будет анализировать стандартизованные остатки (в таблице реальных наблюдений вообще не должно быть пустых ячеек). Кроме того, выборка признается «маленькой», если для большого числа ячеек таблицы сопряженности ожидаемые частоты < 5. Возможный вариант решения проблемы — предварительное объединение некоторых ячеек. Если это не удается сделать, то можно использовать и нескорректированный критерий, но трактовать результат с известной степенью осторожности.
Но выборка не должна быть и слишком большой. Методические эксперименты показывают, что статистика хи-квадрат очень чувствительна к количеству наблюдений, так как расчетное у2 растет с той же скоростью, что и объем выборки. Например, при удвоении объема выборки во столько же раз возрастет и значение у}. В случае если выборка большая (массовый опрос, выборка около 1000 респондентов), для получения более точного результата допустимо рассчитывать этот показатель в относительных частотах (в процентах).
В-третьих, отклонения ожидаемых частот в таблице вероятностного распределения ответов от реальных наблюдений в исходной анализируемой таблице менее чем на пять единиц (< 5) должны встречаться не более чем в 20% полей таблицы.
В-четвертых, суммы по строкам и столбцам всегда должны быть больше нуля, величина уровня значимости для расчета критерия хи- квадрат не должна превышать 0,05 (а в идеале — < 0,001).
Однако на этом процедуры, связанные со статистикой хи-квадрат, не заканчиваются. Мы можем посмотреть на так называемые стандартизованные остатки и оценить скрытые закономерности, даже если значение хи-квадрат не позволяет нам отбросить нулевую гипотезу.