Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
IBM_SPSS_Statistics_Base.pdf
Скачиваний:
171
Добавлен:
19.05.2015
Размер:
5.37 Mб
Скачать

Глава

Исследовать

4

Процедура Исследовать вычисляет итожащие статистики и выводит диаграммы как для всех наблюдений, так и отдельно для групп наблюдений. У этой процедуры много полезных способов применения: с ее помощью производится отслеживание данных, идентификация выбросов, описание, проверка предположений и описание различий между группами наблюдений. Отслеживание данных может показать наличие необычных значений, экстремальных значений, разрывов в данных или других особенностей. Процедура Исследовать позволяет определить, подходят ли для анализа Ваших данных статистические методы, которые Вы собираетесь использовать. Результаты процедуры Исследовать могут показать, что необходимо провести преобразование данных, если применение выбранного метода требует нормально распределенных данных. Или Вы можете решить, что надо воспользоваться непараметрическими критериями.

Пример. Рассмотрим распределение времени, необходимого крысам на изучение лабиринта, при применении четырех различных схем кормления. Для каждой из четырех групп можно посмотреть, является ли распределение времени приближенно нормальным, и проверить, совпадают ли четыре дисперсии. Можно выделить наблюдения, которым соответствуют пять наименьших и пять наибольших значений времени. Ящичные диаграммы и диаграммы “ствол-лист” графически подытоживают информацию о распределении времени на изучение для каждой группы.

Статистики и графики. Среднее значение, медиана, 5%-е усеченное среднее, стандартная ошибка, дисперсия, стандартное отклонение, минимальное и максимальное значения переменных, размах, межквартильный размах, асимметрия, эксцесс, стандартные ошибки асимметрии и эксцесса, доверительный интервал для среднего с задаваемым уровнем, процентили, робастные оценки центральной тенденции (М-оценки Хубера, Эндрюса, Хемпеля и Тьюки), пять наименьших и пять наибольших значений переменных, статистика Колмогорова-Смирнова с уровнем значимости Лильефорса для проверки на нормальность, статистика Шапиро-Уилкса. Ящичные диаграммы, диаграммы “ствол-лист”, гистограммы, нормальные вероятностные графики, диаграммы разброса по уровням с критерием Ливиня и возможностью задать преобразование данных.

Данные. Процедура Исследовать используется для анализа количественных переменных, заданных в интервальной шкале или шкале отношений. Факторная переменная (используемая для разбиения наблюдений на группы) должна иметь разумное число различных значений (категорий). Эти значения могут быть числовыми или короткими текстовыми. Переменная в поле Метить значениями используется для того, чтобы ее значениями метить выбросы в ящичных диаграммах. Она может быть короткой текстовой, длинной текстовой (первые 15 байтов) или числовой.

Предположения. Распределение исследуемых данных не обязательно должно быть симметричным или нормальным.

© Copyright IBM Corporation 1989, 2011.

17

18

Глава 4

Как Исследовать данные

E Выберите в меню:

Анализ > Описательные статистики > Разведочный анализ...

Рисунок 4-1

Диалоговое окно “Исследовать”

EВыберите одну или несколько зависимых переменных. Дополнительно Вы можете:

Выбрать одну или несколько факторных переменных, значения которых зададут разбиение наблюдений на группы.

Выбрать идентификационную переменную, чтобы метить наблюдения.

Щелкнуть мышью по кнопке Статистики, чтобы задать вывод робастных оценок, выбросов, процентилей, частотных таблиц.

Щелкнуть мышью по кнопке Графики и задать построение гистограмм, графиков и критериев для проверки нормальности, а также диаграмм разброса по уровням с критерием Ливиня.

Щелкнуть мышью по кнопке Параметры и задать способ работы с пропущенными значениями.

19

Исследовать

Статистики процедуры Исследовать

Рисунок 4-2

Диалоговое окно Исследовать: Статистики

Описательные статистики. Эти характеристики центральной тенденции и разброса выводятся по умолчанию. Характеристики центральной тенденции описывают положение распределения; они включают среднее значение, медиану и 5%-е усеченное среднее. Характеристики разброса отражают степень различия значений исследуемых данных; они включают стандартную ошибку, дисперсию, стандартное отклонение, минимальное и максимальное значения переменных, размах и межквартильный размах. Описательные статистики включают также характеристики формы распределения, такие как асимметрия и эксцесс, которые выводятся вместе со своими стандартными ошибками. Выводится также 95% доверительный интервал для среднего, можно задать иное значение доверительного уровня.

М-оценки. Робастные альтернативы выборочным среднему и медиане для оценивания положения. Они различаются весами, приписываемыми наблюдениям. Выводятся следующие оценки: М-оценка Хубера, волновая оценка Эндрюса, нисходящая М-оценка Хампеля, бивес-оценка Тьюки.

Выбросы. Выводятся пять наименьших и пять наибольших значений с метками наблюдений.

Процентили. Выводятся значения 5%-го, 10%-го, 25%-го, 50%-го, 75%-го, 90%-го и 95%-го процентилей.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]