9 Элементы теории корреляции. Коэффициент ранговой корреляции Спирмена.

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный университет международных отношений МИД России (МГИМО)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Теория вероятностей.docx

Скачиваний:

Добавлен:

21.04.2019

Размер:

507.32 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 1918 19 > Следующая >>>

линейно зависимы,
линейно независимы.
9 Элементы теории корреляции. Коэффициент ранговой корреляции Спирмена.
Коэффициент ранговой корреляции Спирмена используется в случаях, когда: - переменные имеют ранговую шкалу измерения; - распределение данных слишком отличается от нормального или вообще неизвестно; - выборки имеют небольшой объём (N < 30).
Интерпретация рангового коэффициента корреляции Спирмена не отличается от коэффициента Пирсона, однако его смысл несколько отличен. Чтобы понять различие этих методов и логически обосновать области их применения сравним их формулы.
Коэффициент корреляции Пирсона: Коэффициент корреляции Спирмена:
Как видим формулы значительно различаются. Сравним формулы
В формуле корреляции Пирсона используется среднее арифметическое и стандартное отклонение коррелируемых рядов, а в формуле Спирмена не используется. Таким образом, для получения адекватного результата по формуле Пирсона, необходимо, чтобы коррелируемые ряды были приближены к нормальному распределению (среднее и стандартное отклонение являются параметрами нормального распределения). Для формулы Спирмена это не актуально.
Элементом формулы Пирсона является стандартизация каждого ряда в z-шкалу.
Как видим, перевод переменных в Z-шкалу присутствует в формуле коэффициента корреляции Пирсона. Соответственно, для коэффициента Пирсона абсолютно не имеет значение масштаб данных: к примеру, мы можем коррелировать две переменных, одна из которых имеет мин. = 0 и макс. = 1, а вторая мин. = 100 и макс. = 1000. Как бы не различался размах диапазона значений, все они будут переведены в стандартные z-значения одинаковые по своему масштабу.
В коэффициенте Спирмена такой нормализации не происходит, поэтому
ОБЯЗАТЕЛЬНЫМ УСЛОВИЕМ ИСПОЛЬЗОВАНИЯ КОЭФФИЦИЕНТА СПИРМЕНА ЯВЛЯЕТСЯ РАВЕНСТВО РАЗМАХА ДВУХ ПЕРЕМЕННЫХ.
Перед использованием коэффициента Спирмена для рядов данных с различным размахом, необходимо обязательно их ранжировать. Ранжирование приводит к тому, что значения этих рядов приобретают одинаковый минимум = 1 (минимальный ранг) и максимум, равный количеству значений (максимальный, последний ранг = N, т.е. максимальному количеству случаев в выборке).
В каких случаях можно обойтись без ранжирования
Это случаи, когда данные имеют исходно ранговую шкалу. К примеру, тест ценностных ориентаций Рокича.
Также, это случаи, когда количество вариантов значений невелико и в выборке присутствуют фиксированные минимум и максимум. К примеру, в семантическом дифференциале минимум = 1, максимум = 7.
10 Точечные оценки параметров распределенияи методы их нахождения. Метод моментов.

4.1. Точечная оценка параметров распределения

Метод моментов

Метод предложен К. Пирсоном в 1894 г. Сущность метода:

выбирается столько эмпирических моментов, сколько требуется оценить неизвестных параметров распределения. Желательно применять моменты младших порядков, так как погрешности вычисления оценок резко возрастают с увеличением порядка момента;

вычисленные по ЭД оценки моментов приравниваются к теоретическим моментам;

параметры распределения определяются через моменты, и составляются уравнения, выражающие зависимость параметров от моментов, в результате получается система уравнений. Решение этой системы дает оценки параметров распределения генеральной совокупности.

Пусть — выборка из распределения , зависящего от параметра . Пусть есть функция , такая что g(X) интегрируема относительно меры , и

где — биекция. Тогда оценка

называется оценкой параметра методом моментов.

Преимущества и недостатки метода

В известной мере, при оценке параметров из известного семейства вероятностных распределений, этот метод упраздняется Фишеровским методом максимального правдоподобия, так как максимально правдоподобная оценка имеет большую вероятность оказаться ближе к истинному значению оцениваемой величины.

Тем не менее, в некоторых случаях, например, как выше в случае Гамма-распределения, использование метода максимального правдоподобия требует использования компьютеров в то время, как метод моментов может быть быстро и легко реализован вручную.

Оценки, полученные методом моментов, могут быть использованы как первое приближение для метода максимума правдоподобия. Дальнейшее улучшение оценок может быть получено с использованием метода Ньютона-Рафсона.

В некоторых случаях, редких при больших объемах данных и более частых при малом их количестве, оценки, даваемые методом моментов могут оказаться вне допустимой области. Такая проблема никогда не возникает в методе максимального правдоподобия. Также, оценки по методу моментов не обязательно оказываются достаточной статистикой, то есть, они иногда извлекают из данных не всю имеющуюся в них информацию.

11 Точечные оценки параметров распределения и методы их нахождения. Понятие о методе наименьших квадратов. Метод наименьших квадратов (расчёт коэффициентов)

На практике линия регрессии чаще всего ищется в виде линейной функции Y = b₀ + b₁X₁ + b₂X₂ + ... + b_NX_N (линейная регрессия), наилучшим образом приближающей искомую кривую. Делается это с помощью метода наименьших квадратов, когда минимизируется сумма квадратов отклонений реально наблюдаемых Y от их оценок (имеются в виду оценки с помощью прямой линии, претендующей на то, чтобы представлять искомую регрессионную зависимость):

(M — объём выборки). Этот подход основан на том известном факте, что фигурирующая в приведённом выражении сумма принимает минимальное значение именно для того случая, когда Y = y(x₁,x₂,...x_N).

Для решения задачи регрессионного анализа методом наименьших квадратов вводится понятие функции невязки:

Условие минимума функции невязки:

Полученная система является системой N + 1 линейных уравнений с N + 1 неизвестными b₀...b_N

Если представить свободные члены левой части уравнений матрицей

а коэффициенты при неизвестных в правой части матрицей

то получаем матричное уравнение: , которое легко решается методом Гаусса. Полученная матрица будет матрицей, содержащей коэффициенты уравнения линии регрессии:

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 1918 19 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
18.11.2019168.96 Кб9Тема 3. Основы теории конституционализма.doc
#
08.09.201987.55 Кб2Тема 5- 2711.doc
#
08.09.201991.14 Кб6Тема ф.организ.doc
#
18.09.2019407.24 Кб6Теоретический метериал геополитика.docx
#
24.03.201529.33 Кб184Теории происхождения древ-рус гос-ва.docx
#
21.04.2019507.32 Кб13Теория вероятностей.docx
#
16.11.201944.15 Кб2теория менеджмента лекции.docx
#
19.09.201948.58 Кб3Теория менеджмента семинары.docx
#
24.03.201542.95 Кб127Теория познания Канта.docx
#
19.11.2019452.07 Кб5Теория производства.docx
#
16.11.2019231.69 Кб2Теория спроса 1.docx