Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
10.docx
Скачиваний:
46
Добавлен:
20.02.2016
Размер:
522.74 Кб
Скачать

6. Построение таблиц сопряженности признаков

Помимо ответов на вопросы, относящихся к анализу одной переменной, маркетологов часто интересуют дополнительные вопросы о связи этой переменной с другими переменными.

• Как много мужчин среди приверженцев данной торговой марки?

• Связано ли использование товара (потребление его в больших, средних, малых количествах и не потребление) с отдыхом на открытом воздухе (высокая, средняя и низкая активность)?

• Связана ли осведомленность о новом товаре с возрастом и уровнем образования?

• Связана ли покупка товара с доходом человека (высокий, средний или низкий доход)?

На эти и подобные вопросы можно ответить с помощью таблицы сопряженности признаков.

Построение таблиц сопряженности признаков, кросс-табуляция (cross-tabulation) - статистический метод, который одновременно характеризует две или больше переменных и заключается в создании таблиц сопряженности признаков, отражающих совместное распределение двух или больше переменных с ограниченным числом категорий или определенными значениями.

Кросс-табуляция представляет собой процесс объединения распределений частот значений двух или больше переменных в одну таблицу. Она объясняет, как одна переменная, например лояльность торговой марке, связана с другой переменной, такой как пол. Категории одной переменной помешают в таблицу так, чтобы они размещались в ней (сопрягались) в соответствии с категориями другой или другими несколькими переменными.

Предположим, нас интересует, действительно ли использование Internet связано с полом. Чтобы построить таблицу сопряженности признаков, респондентов разделили в зависимости от того, сколько времени они пользуются сетью. Пользующихся Internet пять часов и меньше отнесли к мало пользующимся, а остальных — ко много. Итог процедуры кросс-табуляции приведен в табл.3.

Таблица 3. Пол и использование Internet

использование интернет

пол

итого

мужчины

женщины

Мало (1)

5

10

15

Много(2)

10

5

15

итого

15

15

Кросс-табуляция предусматривает создание ячейки для каждой комбинации категорий двух переменных. Число в каждой ячейке показывает количество респондентов, давших эту комбинацию ответов. В табл. 3 видим, что 10 респондентов, ответивших, что они мало используют Internet — женщины. Итоговые значения таблицы показывают, что из 30 респондентов с достоверными ответами по обеим переменным 15 человек ответили, что они мало используют Internet, a 15 — много. Что касается пола, то 15 респондентов оказались женщинами, а 15 — мужчинами. Обратите внимание, что эту информацию можно было бы получить из отдельного распределения частот для каждой переменной.

Рассматриваемые данные должны быть качественными или категориальными, поскольку предполагается, что каждая переменная должна измеряться только по номинальной шкале. Таблицами сопряженности широко пользуются при проведении прикладных маркетинговых исследований.

Мы рассмотрим построение таблиц сопряженности для двух и трех переменных.

Две переменные

Кросс-табуляцию с двумя переменными можно рассматривать как двумерную. Сначала рассмотрим кросс-табуляцию данных, касающихся пола и использования Internet, представленную в табл. 3. Связано ли использование Internet с полом? Это можно выяснить из табл. 3. Мы видим, что непропорционально большое количество респондентов, проводяших много времени в Internet, — мужчины. Лучше понять этот вопрос поможет процентное вычисление.

Исходя из того, что обе переменные подвергаются процедуре кросс-табуляции, мы можем посчитать проценты применительно к колонке (табл. 4) либо к строке (табл. 5).

Таблица 4. Использование Internet в зависимости от пола

Пользование интернет

пол

мужчины

женщины

Мало

33,3%

66,7%

Много

66,7%

33,3%

итого

100%

100%

Таблица 5. Пол человека в зависимости от использования Internet

Пол

Использование интернет

мало

много

Итого

Мужчины

33,3%

66,7%

100%

женщины

66,7%

33,3%

100%

Какая из этих двух таблиц полезнее? Ответ на данный вопрос зависит от того, какая переменная рассматривается как независимая, а какая как зависимая. Общее правило, которое необходимо соблюдать, гласит — проценты необходимо вычислять для каждой категории независимой переменной (так, чтобы суммарное значение категорий зависимой переменной применительно к каждой категории независимой переменной давало 100%). В нашем анализе пол можно рассматривать как независимую переменную, использование Internet — как зависимую, а правильный способ вычисления процентов показан в табл. 4. Заметим, что мужчины больше используют Internet, чем женщины. Это видно из того, что 66,7%, активно пользующихся Internet, составляют мужчины, тогда как на долю женщин в этой категории приходится всего лишь 33,3%.

Вычисление процентов в направлении зависимой переменной через независимую, как показано в табл. 5, бессмысленно. Табл. 5 подразумевает, что интенсивное пользование Internet — причина того, что такими людьми являются мужчины. Это последнее утверждение неправдоподобно. Однако, возможно, что связь между пользованием Internet и полом человека опосредована третьей переменной, например возрастом или доходом. Поэтому необходимо проверить влияние третьей переменной.

Три переменные

Часто введение третьей переменной позволяет маркетологу четче уяснить природу исходной связи между двумя переменными. Как показано на рис. 15.7, третья переменная может привести к четырем возможностям.

1. Уточнить связь, наблюдаемую между двумя исходными переменными.

2. Указать на отсутствие связи между двумя переменными, хотя первоначально связь наблюдалась, Другими словами, третья переменная покажет, что исходная связь между двумя переменными была ложной.

3. Показать некоторую связь между двумя переменными, хотя первоначально она не наблюдалась. В этом случае третья переменная показывает скрытую связь между первыми двумя переменными.

4. Не показать никаких изменений в первоначальной связи.

Эти возможности объясняются на примерах, в основе которых лежит выборка в тысячу респондентов.

Уточнение исходной связи. В результате изучения связи между покупкой модной одежды и семейным положением получены данные, приведенные в табл. 6.

Таблица 6. Покупка модной одежды в зависимости от семейного положения

Покупка модной одежды

Семейное положение

Женат (замужем)

Не женат (не замужем)

Много

31%

52%

Мало

69%

48%

Итого

100%

100%

Число респондентов

700

300

Респондентов поделили на две категории покупателей модной одежды: много покупающие и мало покупающие. Семейное положение тоже имело две категории: женат (замужем) либо не женат (не замужем). Как видно из табл. 6, в категорию лиц, покупающих много модной одежды, попали 52% несемейных респондентов и только 31% семейных. Перед тем как заключить, что респонденты, не имеющие семьи, покупают больше модной одежды, чем имеющие семью, в анализ была введена третья переменная — пол.

Таблица 7. Связь покупки модной одежды с семейным положением

Покупка модной одежды

пол

мужской

женский

женат

неженат

замужем

Не замужем

много

35%

40%

25%

60%

мало

65%

60%

75%

40%

итого

100%

100%

100%

100%

Число респондентов

400

120

300

180

Пол респондентов вводился в качестве третьей переменной на основании результатов предшествующего маркетингового исследования. Связь между покупкой модной одежды и семейным положением пересмотрена в свете третьей переменной, как показано в табл.7. Что касается женщин, то из них 60% незамужних попали в категорию покупающих больше модной одежды по сравнению с 25% замужних женщин, С другой стороны, для мужчин эта разница в процентах не так велика: 40% холостых и 35% женатых попали в категорию покупателей, приобретающих много модной одежды. Следовательно, третья переменная, уточнила связь между семейным положением и покупкой модной одежды (начальными переменными). Вероятность попадания в категорию покупателей, приобретающих много модной одежды, выше для несемейных респондентов по сравнению с семейными, причем она выше для женщин.

Исходная связь между двумя переменными ложна. Маркетолог проводит исследование для рекламного агентства, разрабатывающего рекламу для автомобилей стоимостью свыше 30 тысяч долларов. Он попытался проанализировать факторы, влияющие на владение дорогими автомобилями (табл. 8).

Таблица 8. Зависимость владения дорогами автомобилями от образовательного уровня

Наличие дорогого автомобиля

Образование

Выпускник колледжа

Без степени колледжа

Да

32%

21%

Нет

68%

79%

Итого

100%

100%

Число респондентов

250

750

Из таблицы видно, что 32% выпускников колледжа имеют дорогой автомобиль, в то время как среди не окончивших колледж дорогим автомобилем владеют только 21%. Исследователь убежден, что уровень образования влияет на приобретение дорогого автомобиля. Решив, что на его покупку влияет и доход, исследователь перепроверил связь между образованием и наличием дорогого автомобиля в свете уровня доходов. Результаты приведены в табл.9.

Таблица 9. Влияние образования и уровня дохода на наличие дорогого автомобиля.

Наличие дорогого автомобиля

Доход

низкий

высокий

образование

образование

колледж

нет

колледж

нет

да

20%

20%

40%

40%

нет

80%

80%

60%

60%

итого

100%

100%

100%

100%

Число респондентов

100

700

150

50

Заметим, что процент тех, кто имеют дорогой автомобиль, среди окончивших колледж или не окончивших его одинаков для каждой из групп, разбитых по доходу. Если данные по группам с высокими и низкими доходами проверить отдельно, то связь между образованием и наличием дорогого автомобиля исчезает, а это значит, что первоначально наблюдаемая связь между этими двумя переменными была ложной.

Третья переменная показывает подавленную связь между первыми двумя переменными. Маркетолог, исследуюший сферу туристических поездок за границу, предположил, что на желание путешествовать влияет возраст. Однако таблица сопряженности двух переменных (табл. 10) не выявила никакой связи. Когда в качестве третьей переменной ввели пол, получили данные, представленные в табл. 11.

Таблица 10. Зависимость желания совершить туристическую поездку за границу от возраста

Желание совершить туристическую поездку за границу

Возраст

До 45лет

45 лет и старше

Да

50%

50%

Нет

50%

50%

Итого

100%

100%

Число респондентов

500

500

Таблица 11. Связь между желанием совершить туристическую поездку за границу, возрастом и полом

Желание совершить туристическую поездку за границу

пол

мужской

женский

До 45лет

45 лет и старше

До 45лет

45 лет и старше

Да

60%

40%

35%

65%

Нет

40%

60%

65%

35%

Итого

100%

100

100%

100%

Число респондентов

300

300

200

200

Среди мужчин до 45 лет 60% изъявили желание отправиться в турпоездку заграницу, а после 45 лет — всего лишь 40%. Обратная ситуация наблюдалась для женщин: в возрасте до 45 лет желающих отправиться посмотреть мир оказалось 35%, а после 45 лет — 65%. Поскольку связь между желанием путешествовать и возрастом различна для мужчин и женшин и с противоположной направленностью, связь между этими двумя переменными была скрыта, пока данные не учитывали переменную "пол", как это сделано в табл.10. Но при проверке влияния пола, как показано в табл. 11, проигнорированная связь между желанием путешествовать и возрастом была обнаружена для отдельных категорий: мужчин и женшин.

Никаких изменении в первоначальной связи. В некоторых случаях третья переменная не изменяет первоначально наблюдаемую связь, независимо от того, были ли исходные переменные взаимосвязаны. Это означает, что третья переменная никак не влияет на связь между двумя первыми переменными. Рассмотрим кросс-табуляцию двух переменных: размер семьи и частоту посещения ресторанов быстрого питания, представленную в табл.12.

Таблица 12. Связь частоты посещения ресторанов быстрого питания с размером семьи.

Частота посещения ресторана быстрого питания

Размер семьи

небольшая

большая

Большая

65%

65%

Маленькая

35%

35%

Итого

100%

100%

Число респондентов

500

500

Респондентов разделили (используя медиану) на две равные по размеру категории по 500 респондентов в каждой: небольшая и большая семья, Не наблюдалось никакой связи, Затем, по этому же принципу респондентов разделили на категории: семьи с большим и малым доходом. При введении в анализ третьей переменной получили табл. 13. И снова не наблюдалось никакой связи.

Таблица 13. Связь частоты посещения ресторанов быстрого питания с размером семьи и уровнем дохода

Частота посещения ресторана быстрого питания

Доход

Семьи с низким доходом

Семьи с высоким доходом

малая

большая

малая

большая

Большая

65%

65%

65%

65%

Маленькая

35%

35%

35%

35%

Итого

100%

100%

100%

100%

Число респондентов

250

250

250

250

Можно построить таблицу сопряженности больше, чем для трех переменных, но интерпретация полученных результатов достаточно сложная. Кроме того, поскольку число ячеек многократно увеличится, проблематично оставить необходимое количество респондентов или случаев в каждой ячейке. Как правило, чтобы вычислить статистику в каждой ячейке, должно быть, по крайней мере, пять наблюдений. Таким образом, кросс-табуляция — неэффективный способ проверки связей для ситуаций с несколькими переменными, она рассматривает просто связь между переменными, а не причинность. Чтобы изучить причинно-следственную связь, необходимо провести соответствующее причинно-следственное исследование.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]