Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IBM_SPSS_Statistics_Base.pdf
Скачиваний:
171
Добавлен:
19.05.2015
Размер:
5.37 Mб
Скачать

Глава

OLAP Кубы

8

Процедура OLAP (Online Analytical Processing) Кубы вычисляет итоги, средние значения и другие одномерные статистики для количественных подытоживаемых переменных внутри категорий одной или нескольких категориальных группирующих переменных. Для каждой категории каждой группирующей переменной в таблице создается отдельный слой.

Пример. Суммарные продажи и средние объемы одной продажи для разных регионов и видов товаров внутри регионов.

Статистики. Сумма, число наблюдений, среднее значение, медиана, групповая медиана, стандартная ошибка среднего, минимум, максимум, размах, значение переменной для первой категории группирующей переменной, значение переменной для последней категории группирующей переменной, стандартное отклонение, дисперсия, эксцесс, стандартная ошибка эксцесса, асимметрия, стандартная ошибка асимметрии, процент от общего количества наблюдений, процент общей суммы, процент общего количества

наблюдений в категориях группирующих переменных, процент общей суммы в категориях группирующих переменных, геометрическое среднее, гармоническое среднее.

Данные. Подытоживаемые переменные являются количественными (непрерывными переменными, измеренными в интервальной шкале или шкале отношений), а группирующие переменные являются категориальными. Значения группирующих переменных могут быть числовыми и текстовыми.

Предположения. Некоторые статистики для подгрупп, например, среднее и стандартное отклонение, основаны на теории нормального распределения и подходят для количественных переменных с симметричными распределениями. Робастные статистики, такие как медиана и размах, годятся и для количественных переменных, которые могут не удовлетворять условию нормальной распределенности.

Как получить OLAP Кубы

E Выберите в меню:

Анализ > Отчеты > OLAP кубы...

© Copyright IBM Corporation 1989, 2011.

43

44

Глава 8

Рисунок 8-1

Диалоговое окно OLAP Кубы

E Выберите одну или несколько количественных подытоживаемых переменных.

EВыберите одну или несколько категориальных группирующих переменных. Дополнительно можно:

Выбрать различные итожащие статистики (щелкните мышью по кнопке Статистики). Перед выбором статистик необходимо задать одну или более группирующих переменных.

Вычислить разности между парами переменных и парами групп, заданных группирующей переменной (щелкните по Разности).

Создать и отредактировать заголовки (щелкните мышью по кнопке Заголовок).

Скрыть частоты, меньшие заданного целого. Скрытые значения будут выводиться как <N, где N - заданное целое. Заданное целое должно быть больше или равно 2.

45

OLAP Кубы

Статистики в процедуре OLAP Кубы

Рисунок 8-2

Диалоговое окно OLAP Кубы: Статистики

Вы можете выбрать одну или несколько статистик подгрупп для подытоживаемых переменных в каждой категории группирующей переменной: сумма, число наблюдений, среднее значение, медиана, групповая медиана, стандартная ошибка среднего значения, минимум, максимум, размах, значение переменной для первой категории группирующей переменной, значение переменной для последней категории группирующий переменной, стандартное отклонение, дисперсия, эксцесс, стандартная ошибка эксцесса, асимметрия, стандартная ошибка асимметрии, процент от общего числа наблюдений, процент от общей суммы, процент от общего числа наблюдений в категориях группирующих переменных, процент от общий суммы в категориях группирующих переменных, геометрическое среднее, гармоническое среднее.

Вы можете изменить порядок, в котором выводятся статистики подгрупп. Порядок, в котором статистики приведены в списке Статистики в ячейках, определяет их порядок при выводе. Итожащие статистики также выводятся для каждой переменной по всем категориям.

Первое. Выводит первое значение данных, встреченное в файле данных. Геометрическое среднее. Корень n-й степени из произведения n значений наблюдений.

Групповая медиана. Медианы, вычисленные для данных, закодированных по принадлежности к группам. Например, для данных о возрасте каждое значение для 30-летних кодируется как 35, каждое значение для 40-летних кодируется как 45 и т.д.; групповая медиана - это медиана, вычисленная по закодированным данным.

Гармоническое среднее. Используется для оценки среднего объема группы, когда объемы выборок в группах различаются. Гармоническое среднее - это общее число выборок, деленное на сумму величин, обратных объемам отдельных групп.

46

Глава 8

Эксцесс. Мера сгруппированности наблюдений вокруг центральной точки. Для нормального распределения значение эксцесса равно 0. Положительный эксцесс указывает на то, что по отношению к нормальному распределению наблюдения для таких распределений сгруппированы более плотно около центра и имеют более тонкие хвосты до экстремумов распределения, и более толстые хвосты в области экстремальных значений. Отрицательный эксцесс указывает на то, что по отношению к нормальному распределению наблюдения для таких распределений сгруппированы менее плотно около центра и имеют более толстые хвосты до экстремумов распределения, и более тонкие хвосты в области экстремальных значений.

Последнее. Выводит последнее значение в файле данных. Максимум. Наибольшее значение числовой переменной.

Среднее. Мера центральной тенденции. Арифметическое среднее; сумма, деленная на число наблюдений.

Медиана. Значение, выше и ниже которого попадает по половине наблюдений, иначе 50-й процентиль. Если число наблюдений четно, медиана есть арифметическое среднее двух находящихся в середине значений, если выборку упорядочить по убыванию или по возрастанию. Медиана представляет собой меру центральной тенденции, которая нечувствительна к выбросам, в отличие от среднего значения, которое могут исказить несколько экстремально больших или малых значений.

Минимум. Наименьшее значение числовой переменной. Количество. Число случаев (наблюдений или записей).

Процент от N в. Процент от количества наблюдений для указанной группирующей переменной внутри категорий другой группирующей переменной. Если имеется только одна группирующая переменная, это значение совпадает с процентом от общего числа наблюдений.

Процент от суммы в. Процент от суммы для указанной группирующей переменной внутри категорий другой группирующей переменной. Если имеется только одна группирующая переменная, это значение совпадает с процентом от общей суммы.

Процент от общего N. Процент от общего количества наблюдений в каждой категории. Процент от общей суммы. Процент от общей суммы в каждой категории.

Диапазон. Разность между наибольшим и наименьшим значениями числовой переменной; максимум минус минимум.

Асимметрия. Мера асимметрии распределения. Нормальное распределение симметрично, и для него асимметрия равна 0. Распределение со значимой положительной асимметрией имеет длинный хвост справа. Распределение со значимой отрицательной асимметрией имеет длинный хвост слева. В качестве грубого правила можно сказать, что значение асимметрии, более чем вдвое превышающее ее стандартную ошибку, указывает на наличие асимметрии распределения.

Стандартная ошибка эксцесса. Отношение эксцесса к его стандартной ошибке можно использовать как критерий нормальности (то есть, можно отвергнуть нормальность, если это отношение меньше –2 или больше +2). Большое положительное значение эксцесса

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]