- •Что такое статистика. Предмет. Цели. Составные части.
- •Классификация признаков.
- •Абсолютные и относительные показатели.
- •Способы формирования выборок.
- •План статистического наблюдения.
- •Виды статистического наблюдения:
- •Степенные средние.
- •5 Базовых показателей вариационного ряда.
- •Мода и медиана.
- •Квартили и квинтили.
- •Децили и перцентили.
- •Основные показатели изменчивости.
- •Простое и взвешенное стандартное отклонение (для выборки и гс).
- •Дисперсия.
- •Относительные показатели изменчивости
- •Основные параметры нормального распределения.
- •Асимметрия.
- •Эксцесс.
- •Классификация гипотез.
- •Понятие и классификация критериев проверки гипотез.
- •Критерий Розенбаума.
- •Правила ранжирования
- •Алгоритм 4 Подсчет критерия u Манна-Уитни.
- •Критерий χ2 Пирсона.
- •Корреляция: цели, виды.
- •Надежность коэффициента корреляции.
- •Регрессия: цели, виды
- •Регрессия: ошибка выбранной математической модели.
- •Множественная регрессия.
- •Факторный анализ: цели, этапы
- •1 Этап: Построение матрицы попарных корреляций
- •Кластерный анализ: цели, Евклидово расстояние.
- •Кластерный анализ: методы объединения объектов.
- •Кластерный анализ: стандартизация.
- •Основные характеристики кластеров.
- •Дисперсионный анализ: цели, классификация.
- •Однофакторый дисперсионный анализ: основные формулы, область применения.
Кластерный анализ: методы объединения объектов.
«Ближнего соседа» Расстояние между двумя кластерами определяется расстоянием между двумя наиболее близкими объектами (ближайшими соседями) в различных кластерах.
Позволяет выделять кластеры сложной формы при условии, что части таких кластеров соединены цепочками близких друг к другу элементов.
«Дальнего соседа» Расстояние между двумя кластерами определяется расстоянием между двумя наиболее далекими объектами в различных кластерах.
Хорошо использовать, когда объекты действительно происходят из различных "рощ"
Центроидный
Варда В качестве расстояния между кластерами берется прирост суммы квадратов расстояний объектов до центров кластеров, получаемый в результате их объединения
Объединение близко расположенных кластеров и "стремление" создавать кластеры малого размера
Невзвешенного попарного среднего
Взвешенного попарного среднего
Кластерный анализ: стандартизация.
Стандартизация – выбор масштаба
Z-шкалы (Z-Scores)
Из значений переменных вычитается их среднее, и эти значения делятся на стандартное отклонение.
Кластерный анализ: дендрограмма.
Иерархические кластеры - Последовательное объединение исходных элементов. Суть иерархической кластеризации состоит в последовательном объединении меньших кластеров в большие или разделении больших кластеров на меньшие.
Дендрограмма - Графическое изображение процесса объединения кластеров.
Вертикальная
Горизонтальная
Основные характеристики кластеров.
Характеристики кластера:
Размер кластера может быть определен либо по радиусу кластера, либо по среднеквадратичному отклонению объектов для этого кластера.
Объект относится к кластеру, если расстояние от объекта до центра кластера не больше радиуса кластера. Если это условие выполняется для двух и более кластеров, объект является спорным.
Дисперсионный анализ: цели, классификация.
Параметрический метод для проверки значимости различий, применяемый, когда нас интересуют сравнение двух и более выборок.
Являются ли различия между выборками достаточно большими для того, чтобы отвергнуть нулевую гипотезу? Сравниваем изменчивость между категориями с изменчивостью внутри категорий.
Допущения для использования ДА:
Независимые случайные выборки
Зависимая переменная является количественным признаком
Генеральные совокупности подчиняются нормальному распределению
В нутригрупповая вариация измеряет насколько неоднородна каждая выборка.
ni – количество объектов в i-й выборке Si – стандартное отклонение i-й выборки n – общее количество исследуемых объектов k – количество степеней свободы (выборок)
Общее среднее
Сравнение эмпирического (экспериментального) значения F критерия с критическим
Критические значения для распределения F-критерия при условии справедливости нулевой гипотезы содержатся в F-таблице
Вывод по дисперсионному анализу:
Внутригрупповая вариация
Межгрупповая вариация
Виды ДА:
сколько факторов принимает участие в исследовании (одно - , многофакторный),
сколько переменных подвержены действию факторов (одно, многомерный),
как соотносятся друг с другом выборки значений (связанных, несвязанных выборок).