- •IBM SPSS Statistics Base 20
- •Содержание
- •1. Информация о данных
- •Вкладка Информация о данных: Вывод
- •Вкладка Информация о данных: Статистики
- •2. Частоты
- •Статистики в процедуре Частоты
- •Диаграммы в процедуре Частоты
- •Частоты: Формат
- •3. Описательные
- •Параметры процедуры Описательные статистики
- •Команда DESCRIPTIVES: дополнительные возможности
- •4. Исследовать
- •Статистики процедуры Исследовать
- •Графики процедуры Исследовать
- •Степенные преобразования в процедуре Исследовать
- •Параметры процедуры Исследовать
- •Команда EXAMINE: дополнительные возможности
- •5. Таблицы сопряженности
- •Слои таблиц сопряженности
- •Кластеризованные столбиковые диаграммы в процедуре Таблицы сопряженности
- •Таблицы сопряженности, выводящие переменные слоев в слоях таблицы
- •Вывод в ячейках для таблиц сопряженности
- •Формат таблиц сопряженности
- •6. Подытожить
- •Параметры процедуры Подытожить наблюдения
- •Статистики процедуры Подытожить наблюдения
- •7. Средние
- •Параметры процедуры Средние
- •8. OLAP Кубы
- •Статистики в процедуре OLAP Кубы
- •OLAP Кубы: Разности
- •OLAP Кубы: Заголовок
- •9. T-критерии
- •T-критерий для независимых выборок
- •Параметры процедуры T-критерий для независимых выборок
- •T-критерий для парных выборок
- •Параметры процедуры Т-критерий для парных выборок
- •Одновыборочный T-критерий
- •Параметры процедуры Одновыборочный T-критерий
- •Команда T-TEST: дополнительные возможности
- •10. Однофакторный дисперсионный анализ
- •Контрасты для однофакторного дисперсионного анализа
- •Апостериорные критерии для однофакторного дисперсионного анализа
- •Параметры процедуры Однофакторный дисперсионный анализ
- •Команда ONEWAY: дополнительные возможности
- •11. Общая линейная модель: одномерный анализ
- •Общая линейная модель (ОЛМ)
- •Создать члены
- •Сумма квадратов
- •Контрасты ОЛМ
- •Типы контрастов
- •Графики профилей в ОЛМ
- •Апостериорные сравнения в ОЛМ
- •Сохранение новых переменных в ОЛМ
- •Параметры процедуры ОЛМ
- •Команда UNIANOVA: дополнительные возможности
- •12. Парные корреляции
- •Параметры процедуры Парные корреляции
- •13. Частные корреляции
- •Параметры процедуры Частные корреляции
- •Команда PARTIAL CORR: дополнительные возможности
- •14. Расстояния
- •Меры различия
- •Меры сходства
- •Команда PROXIMITIES: дополнительные возможности
- •15. Линейные модели
- •Как запустить процедуру построения линейной модели
- •Цели
- •Основные параметры
- •Подбор модели
- •Ансамбли
- •Дополнительные параметры
- •Параметры модели
- •Сводка для модели
- •Автоматическая подготовка данных
- •Важность предикторов
- •Предсказанные против наблюденных
- •Остатки
- •Выбросы
- •Эффекты
- •Коэффициенты
- •Оцененные средние
- •Сводка по построению модели
- •16. Линейная регрессия
- •Методы отбора переменных для линейной регрессии
- •Задание правила отбора наблюдений для линейной регрессии
- •Графики процедуры Линейная регрессия
- •Линейная регрессия: Сохранение новых переменных
- •Статистики процедуры Линейная регрессия
- •Параметры процедуры Линейная регрессия
- •Команда REGRESSION: дополнительные возможности
- •17. Порядковая регрессия
- •Порядковая регрессия: Параметры
- •Порядковая регрессия: Вывод
- •Порядковая регрессия: Модель положения
- •Создать члены
- •Порядковая регрессия: Модель масштаба
- •Команда PLUM: дополнительные возможности
- •18. Подгонка кривых
- •Модели подгонки кривых
- •Подгонка кривых: Сохранить
- •19. Регрессия частично наименьших квадратов
- •Модель
- •Параметры
- •20. Анализ методом ближайших соседей
- •Соседи
- •Показатели
- •Группы
- •Сохранить
- •Вывод
- •Параметры
- •Вид Модель
- •Пространство показателей
- •Важность переменных
- •Соседи
- •Расстояния до ближайших соседей
- •Диаграмма квадрантов
- •Значения ошибок при отборе показателей
- •Значения ошибок при выборе k
- •Значения ошибок при отборе показателей и выборе k
- •Таблица классификации
- •Сводка ошибок
- •21. Дискриминантный анализ
- •Задание диапазона в процедуре Дискриминантный анализ
- •Отбор наблюдений для процедуры дискриминантного анализа
- •Статистики в процедуре Дискриминантный анализ
- •Метод пошагового отбора процедуры Дискриминантный анализ
- •Дискриминантный анализ: Классификация
- •Дискриминантный анализ: Сохранить
- •Команда DISCRIMINANT: дополнительные возможности
- •22. Факторный анализ
- •Отбор наблюдений для факторного анализа
- •Описательные статистики факторного анализа
- •Выделение факторов в процедуре Факторный анализ
- •Вращение факторов для факторного анализа
- •Значения факторов в процедуре факторного анализа
- •Параметры процедуры Факторный анализ
- •Команда FACTOR: дополнительные возможности
- •23. Выбор процедуры кластеризации
- •24. Двухэтапный кластерный анализ
- •Параметры процедуры Двухэтапный кластерный анализ
- •Вывод процедуры Двухэтапный кластерный анализ
- •Средство просмотра кластеров
- •Закладка Средство просмотра кластеров
- •Перемещение по средству просмотра кластеров
- •Фильтрация записей
- •25. Иерархический кластерный анализ
- •Задание метода иерархического кластерного анализа
- •Статистики для процедуры Иерархический кластерный анализ
- •Графики для процедуры Иерархический кластерный анализ
- •Сохранение новых переменных в процедуре Иерархический кластерный анализ
- •Эффективность кластерного анализа методом k-средних
- •Итерации в кластерном анализе методом k-средних
- •Сохранение новых переменных в кластерном анализе методом k-средних
- •Параметры процедуры Кластерный анализ методом К-средних
- •Команда QUICK CLUSTER: дополнительные возможности
- •27. Непараметрические критерии
- •Одновыборочные непараметрические критерии
- •Чтобы получить одновыборочные непараметрические критерии
- •Вкладка Поля
- •Вкладка Параметры
- •Непараметрические критерии для независимых выборок
- •Чтобы получить непараметрические критерии для независимых выборок
- •Вкладка Поля
- •Вкладка Параметры
- •Непараметрические критерии для связанных выборок
- •Чтобы применить непараметрические критерии для связанных выборок
- •Вкладка Поля
- •Вкладка Параметры
- •Представление модель
- •Сводка по проверке гипотез
- •Сводка по доверительным интервалам
- •Одновыборочный критерий
- •Критерии для связанных выборок
- •Критерий для независимых выборок
- •Информация по категориальным полям
- •Информация по количественным полям
- •Парные сравнения
- •Однородные подмножества
- •Команда NPTESTS: дополнительные возможности
- •Устаревшие диалоговые окна
- •Критерий хи-квадрат
- •Биномиальный критерий
- •Критерий серий
- •Одновыборочный критерий Колмогорова-Смирнова
- •Критерии для двух независимых выборок
- •Критерии для двух связанных выборок
- •Критерии для нескольких независимых выборок
- •Критерии для нескольких связанных выборок
- •28. Анализ множественных ответов
- •Задание наборов множественных ответов
- •Частоты для множественных ответов
- •Таблицы сопряженности для множественных ответов
- •Задание диапазонов переменных в таблицах сопряженности для наборов множественных ответов
- •Параметры процедуры Таблицы сопряженности для множественных ответов
- •Команда MULT RESPONSE: дополнительные возможности
- •29. Создание отчетов
- •Итоги по строкам
- •Как запустить процедуру выдачи итожащего отчета: Итоги по строкам
- •Параметры группировки отчета
- •Параметры отчета
- •Компоновка отчета
- •Заголовки отчета
- •Итоги по столбцам
- •Как запустить процедуру выдачи итожащего отчета: Итоги по столбцам
- •Итожащие функции столбцов данных
- •Формат столбцов отчета
- •Параметры группировки отчета с итогами по столбцам
- •Параметры отчета для итогов по столбцам
- •Компоновка отчета с итогами по столбцам
- •Команда REPORT: дополнительные возможности
- •30. Анализ пригодности
- •Статистики процедуры Анализ пригодности
- •Команда RELIABILITY: дополнительные возможности
- •31. Многомерное шкалирование
- •Многомерное шкалирование: Форма данных
- •Создание меры для многомерного шкалирования
- •Модель многомерного шкалирования
- •Параметры процедуры Многомерное шкалирование
- •Команда ALSCAL: дополнительные возможности
- •32. Статистики отношений
- •Статистики отношений
- •33. Кривые ROC
- •Параметры процедуры ROC Кривые
- •Указатель
Глава
Исследовать
4
Процедура Исследовать вычисляет итожащие статистики и выводит диаграммы как для всех наблюдений, так и отдельно для групп наблюдений. У этой процедуры много полезных способов применения: с ее помощью производится отслеживание данных, идентификация выбросов, описание, проверка предположений и описание различий между группами наблюдений. Отслеживание данных может показать наличие необычных значений, экстремальных значений, разрывов в данных или других особенностей. Процедура Исследовать позволяет определить, подходят ли для анализа Ваших данных статистические методы, которые Вы собираетесь использовать. Результаты процедуры Исследовать могут показать, что необходимо провести преобразование данных, если применение выбранного метода требует нормально распределенных данных. Или Вы можете решить, что надо воспользоваться непараметрическими критериями.
Пример. Рассмотрим распределение времени, необходимого крысам на изучение лабиринта, при применении четырех различных схем кормления. Для каждой из четырех групп можно посмотреть, является ли распределение времени приближенно нормальным, и проверить, совпадают ли четыре дисперсии. Можно выделить наблюдения, которым соответствуют пять наименьших и пять наибольших значений времени. Ящичные диаграммы и диаграммы “ствол-лист” графически подытоживают информацию о распределении времени на изучение для каждой группы.
Статистики и графики. Среднее значение, медиана, 5%-е усеченное среднее, стандартная ошибка, дисперсия, стандартное отклонение, минимальное и максимальное значения переменных, размах, межквартильный размах, асимметрия, эксцесс, стандартные ошибки асимметрии и эксцесса, доверительный интервал для среднего с задаваемым уровнем, процентили, робастные оценки центральной тенденции (М-оценки Хубера, Эндрюса, Хемпеля и Тьюки), пять наименьших и пять наибольших значений переменных, статистика Колмогорова-Смирнова с уровнем значимости Лильефорса для проверки на нормальность, статистика Шапиро-Уилкса. Ящичные диаграммы, диаграммы “ствол-лист”, гистограммы, нормальные вероятностные графики, диаграммы разброса по уровням с критерием Ливиня и возможностью задать преобразование данных.
Данные. Процедура Исследовать используется для анализа количественных переменных, заданных в интервальной шкале или шкале отношений. Факторная переменная (используемая для разбиения наблюдений на группы) должна иметь разумное число различных значений (категорий). Эти значения могут быть числовыми или короткими текстовыми. Переменная в поле Метить значениями используется для того, чтобы ее значениями метить выбросы в ящичных диаграммах. Она может быть короткой текстовой, длинной текстовой (первые 15 байтов) или числовой.
Предположения. Распределение исследуемых данных не обязательно должно быть симметричным или нормальным.
© Copyright IBM Corporation 1989, 2011. |
17 |
18
Глава 4
Как Исследовать данные
E Выберите в меню:
Анализ > Описательные статистики > Разведочный анализ...
Рисунок 4-1
Диалоговое окно “Исследовать”
EВыберите одну или несколько зависимых переменных. Дополнительно Вы можете:
Выбрать одну или несколько факторных переменных, значения которых зададут разбиение наблюдений на группы.
Выбрать идентификационную переменную, чтобы метить наблюдения.
Щелкнуть мышью по кнопке Статистики, чтобы задать вывод робастных оценок, выбросов, процентилей, частотных таблиц.
Щелкнуть мышью по кнопке Графики и задать построение гистограмм, графиков и критериев для проверки нормальности, а также диаграмм разброса по уровням с критерием Ливиня.
Щелкнуть мышью по кнопке Параметры и задать способ работы с пропущенными значениями.
19
Исследовать
Статистики процедуры Исследовать
Рисунок 4-2
Диалоговое окно Исследовать: Статистики
Описательные статистики. Эти характеристики центральной тенденции и разброса выводятся по умолчанию. Характеристики центральной тенденции описывают положение распределения; они включают среднее значение, медиану и 5%-е усеченное среднее. Характеристики разброса отражают степень различия значений исследуемых данных; они включают стандартную ошибку, дисперсию, стандартное отклонение, минимальное и максимальное значения переменных, размах и межквартильный размах. Описательные статистики включают также характеристики формы распределения, такие как асимметрия и эксцесс, которые выводятся вместе со своими стандартными ошибками. Выводится также 95% доверительный интервал для среднего, можно задать иное значение доверительного уровня.
М-оценки. Робастные альтернативы выборочным среднему и медиане для оценивания положения. Они различаются весами, приписываемыми наблюдениям. Выводятся следующие оценки: М-оценка Хубера, волновая оценка Эндрюса, нисходящая М-оценка Хампеля, бивес-оценка Тьюки.
Выбросы. Выводятся пять наименьших и пять наибольших значений с метками наблюдений.
Процентили. Выводятся значения 5%-го, 10%-го, 25%-го, 50%-го, 75%-го, 90%-го и 95%-го процентилей.