Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы статистика.docx
Скачиваний:
3
Добавлен:
16.09.2019
Размер:
432.6 Кб
Скачать
  1. Кластерный анализ: методы объединения объектов.

  • «Ближнего соседа» Расстояние между двумя кластерами определяется расстоянием между двумя наиболее близкими объектами (ближайшими соседями) в различных кластерах.

Позволяет выделять кластеры сложной формы при условии, что части таких кластеров соединены цепочками близких друг к другу элементов.

  • «Дальнего соседа» Расстояние между двумя кластерами определяется расстоянием между двумя наиболее далекими объектами в различных кластерах.

Хорошо использовать, когда объекты действительно происходят из различных "рощ"

  • Центроидный

  • Варда В качестве расстояния между кластерами берется прирост суммы квадратов расстояний объектов до центров кластеров, получаемый в результате их объединения

Объединение близко расположенных кластеров и "стремление" создавать кластеры малого размера

  • Невзвешенного попарного среднего

  • Взвешенного попарного среднего

  1. Кластерный анализ: стандартизация.

Стандартизация – выбор масштаба

Z-шкалы (Z-Scores)

Из значений переменных вычитается их среднее, и эти значения делятся на стандартное отклонение.

  1. Кластерный анализ: дендрограмма.

Иерархические кластеры - Последовательное объединение исходных элементов. Суть иерархической кластеризации состоит в последовательном объединении меньших кластеров в большие или разделении больших кластеров на меньшие.

Дендрограмма - Графическое изображение процесса объединения кластеров.

  • Вертикальная

  • Горизонтальная

  1. Основные характеристики кластеров.

Характеристики кластера:

  • Размер кластера может быть определен либо по радиусу кластера, либо по среднеквадратичному отклонению объектов для этого кластера.

  • Объект относится к кластеру, если расстояние от объекта до центра кластера не больше радиуса кластера. Если это условие выполняется для двух и более кластеров, объект является спорным.

  1. Дисперсионный анализ: цели, классификация.

Параметрический метод для проверки значимости различий, применяемый, когда нас интересуют сравнение двух и более выборок.

Являются ли различия между выборками достаточно большими для того, чтобы отвергнуть нулевую гипотезу? Сравниваем изменчивость между категориями с изменчивостью внутри категорий.

Допущения для использования ДА:

  • Независимые случайные выборки

  • Зависимая переменная является количественным признаком

  • Генеральные совокупности подчиняются нормальному распределению

В нутригрупповая вариация измеряет насколько неоднородна каждая выборка.

ni – количество объектов в i-й выборке Si – стандартное отклонение i-й выборки n – общее количество исследуемых объектов k – количество степеней свободы (выборок)

Общее среднее

Сравнение эмпирического (экспериментального) значения F критерия с критическим

Критические значения для распределения F-критерия при условии справедливости нулевой гипотезы содержатся в F-таблице

Вывод по дисперсионному анализу:

Внутригрупповая вариация

Межгрупповая вариация

Виды ДА:

  • сколько факторов принимает участие в исследовании (одно - , многофакторный),

  • сколько переменных подвержены действию факторов (одно, многомерный),

  • как соотносятся друг с другом выборки значений (связанных, несвязанных выборок).