Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции. Статистика.docx
Скачиваний:
4
Добавлен:
30.07.2019
Размер:
118.88 Кб
Скачать

Анализ связи двух качественных признаков.

Примеры: Пол и курение. Пол и студенческая группа.

Этапы анализа:

  1. Построение таблицы сопряжённости.

  2. Проверка гипотезы о наличии связи.

  3. Если гипотеза подтвердилась, то расчёт коэффициента который оценивает силу взаимосвязи.

  1. Таблица сопряжённости – это таблица в которой показаны частоты (%) одновременно по двум признакам.

Пример:

Исследуется взаимосвязь частоты покупок продукции фирмы А с полом потребителя т.е. изучается вопрос мужчины или женщины являются наиболее типичными потребителями данной продукции.

Пол

Постоянно покупают

Покупают изредка

Никогда не покупают

Всего

Мужчина

25/31,1

35/42,7

65/51,2

125

Женщина

66/59,9

90/82,3

85/98,8

241

Всего

91

125

150

366

По исходным данным нельзя выдвинуть гипотезу о наличии связи поскольку группы различаются по численности. Для корректного анализа требуется уравнять группы т.е. принять за 100% отдельно каждую группу.

Пол

Постоянно покупают%

Покупают изредка%

Никогда не покупают %

Всего

Мужчина

20

28

52

100%

Женщина

27

38

25

100%

На основании представленных данным можно выдвинуть гипотезу женщины чаше покупают данную продукцию. Их больше и в категории постоянных покупателей (27% против 20%) они преобладают и среди непостоянных покупателей (38% против 28%), таким образом можно выдвинуть гипотезу, что пол определяет потребительское поведение в отношении товара А.

В домашней работе в если даже нет взаимосвязи всё равно в учебных целях продолжаем анализ.

  1. Проверка гипотезы о наличии связи.

Проверку осуществляют с помощью критерия (Хи)2 .

Техника проверки осуществляется в 3 этапа:

А) По формуле расчитывается значение (хи)2.

Б) по таблице находится значение (Хи)2.

В) сравнивается наблюдаемое и табличное значение. Если (хи)2 наблюдаемое будет меньше (Хи)2 табличного, то связь не подтверждается, а если наоборот, то гипотеза подтвердилась.

Формула: (Хи)2= Сумма(нi-нiштрих)/нiштрих. нi – наблюдаемое значение или наблюдаемая частота то количество наблюдений которое находится в клетках таблицы. Нiштрих – теоретическая частота – то количество наблюдений, которое было бы в каждой клетке таблицы, если бы признаки были независимы. Для её расчёта необходим инструментарий теории вероятности.

Нiштрих=рi*н. Н-объём выборки. Рi- вероятность попадания в каждую клетку таблицы.

Рм+м+.= 125/366*91/366=0,08.

Нштрихм+=0,08*366=31,1.

Рм+-м+-=125/366*125/366=0,11

Нштрихм+-=0,11*366=42,7.

Рж+=241/366*91/366=0,16

Нштрих=0,16*366=59,9.

(Хи)2=(25-31,1)2/31,1 + (35-42,7)2/42,7 + ….=9,57

Найдём табличное значение критерия, для этого зададим параметры:

  1. Альфа=0,05

  2. Df- число степеней свободы = (m-1)(p-1) m и p – число строк и столбцов в таблице.= (2-1)*(3-1)=2. В таблице критерии (хи)2 находят число на пересечении df и альфа. (хи)2 табличное = 5,99. Наблюдаемое значение критерия больше табличного, следовательно гипотеза о наличии связи подтвердилась, пол определяет потребительское поведение в отношении данного товара.

3-й этап . Оценим силу обнаруженной взаимосвязи, для этого рассчитывают специальные коэффициенты, чаще всего рассчитывают коэффициент Крамера. Vкрамера=Корень Хи2/н*М.= корень 9,57/366*1=0,162

М- меньшее из двух чисел. М-1=1, р-1=2. Н объём выборки.

Связь между признаками слабая, т.е. пол в незначительной степени определяет потребительское поведение.