Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по Статистике .doc
Скачиваний:
252
Добавлен:
24.03.2015
Размер:
3.19 Mб
Скачать

2.2 Модели дисперсионного анализа

Рассмотренная схема дисперсионного анализа дифференцируется в зависимости : а) от характера признака , по которому совокупность подразделена на группы ( выборки;) ;б) от числа признаков , по которым совокупность подразделяется на группы ( выборки ) ; в ) от способа формирования выборок.

Значения признака. который подразделяет совокупность на группы могут представлять собой генеральную или близкую к ней по численности совокупность. В этом случае схема проведения дисперсионного анализа соответствует выше рассмотренной. Если же значения признака, который формирует разные группы представляют собой выборку из генеральной совокупности, то меняется постановка нулевой и альтернативной гипотез. В качестве нулевой гипотезы выдвигается предположение, что между группами присутствуют различия, то есть групповые средние обнаруживают некоторую вариацию. В качестве альтернативной гипотезы выдвигается предположение, что колеблемость отсутствует. Очевидно, что при такой постановке гипотез нет оснований проводить конкретизацию результатов сопоставления дисперсий.

При увеличении числа группировочных признаков, например, до 2-х во- первых возрастает число нулевых и соответственно альтернативных гипотез . В этом случае первая нулевая гипотеза говорит об отсутствии различий между средними по группам первого группировочного признака, вторая нулевая гипотеза говорит об отсутствии различий в средних по группам второго группировочного признака и наконец третья нулевая гипотеза говорит об отсутствии так называемого эффекта взаимодействия факторов ( группировочных признаков ).

По эффектом взаимодействия понимается такое изменение значения результативного признака, которое не может быть объяснено суммарным действием двух факторов. Для проверки трех выдвинутых пар гипотез необходим расчет трех фактических значений критерия F- Фишера, что в свою очередь предполагает следующий вариант разложения общего объема вариации

Необходимые для получения F- критерия дисперсии получают известным способом поделив объемы вариации на число степеней свободы.

Как известно, выборки могут быть зависимыми независимыми. Если выборки зависимые , то в общем объеме вариации следует выделить так называемую вариацию по повторностям . Если ее не выделить, то эта вариация может существенно увеличить вариацию внутригрупповую (), что может исказить результаты дисперсионного анализа.

Вопросы для повторения

17-1.В чем состоит конкретизация результатов дисперсионного анализа?

17-2. В каком случае для конкретизации используется критерий Q-Тьюки ?

17-3.Что представляют собой разницы первого, второго и так далее порядков ?

17-4. Как найти фактическое значение критерия Q-Тьюки ?

17-5.Какие гипотезы выдвигается относительно каждой разницы ?

17-6. От чего зависит табличное значение критерия Q-Тьюки ?

17-7. Какова будет нулевая гипотеза , если уровни группировочного признака представляют собой выборку ?

17-8.Как раскладывается общий объем вариации при группировке данных по двум признакам ?

17-9. В каком случае выделяется вариация по повторностям () ?

Резюме

Рассмотренный механизм конкретизации результатов дисперсионного анализа позволяет придать ему законченный вид. Следует обратить внимание на ограничения при использовании критерия Q-Тьюки. В материале были изложены также основные принципы классификации моделей дисперсионного анализа. Необходимо подчеркнуть, что это всего лишь принципы. Детальное изучение особенностей каждой модели требует отдельного более глубокого изучения.

Тестовые задания к лекции

ТЕСТ 7-1

Относительно каких статистических характеристик выдвигаются гипотезы при дисперсионном анализе ?

  1. Относительно двух дисперсий

  2. Относительно одной средней

  3. Относительно нескольких средних

  4. Относительно одной дисперсии

ТЕСТ 7-2

В чем состоит содержание альтернативной гипотезы при дисперсионном анализе ?

  1. Сравниваемые дисперсии не равны между собой

  2. Все сравниваемые средние не равны между собой

  3. Хотя бы две генеральные средние не равны между собой

  4. Межгрупповая дисперсии больше дисперсии внутригрупповой

ТЕСТ 7-3

Какие уровни значимости наиболее часто используемы при дисперсионном анализе

  1. 0,5

  2. 0,05

  3. 0,01

  4. 0,2

ТЕСТ 7-4

Если внутригрупповая вариация больше вариации межгрупповой , следует ли продолжать дисперсионный анализ или сразу согласиться с Н0 либо с НА ?

1. Следует продолжить, определив необходимые дисперсии ?

2. Следует согласиться с Н0

3. Следует согласиться с НА

ТЕСТ 7- 5

Если внутригрупповая дисперсия оказалась равной межгрупповой, каковы должны последовать действия, проводящего дисперсионный анализ ?

  1. Согласиться с нулевой гипотезой о равенстве генеральных средних

  2. Согласиться с альтернативной гипотезой о наличии хотя бы пары средних неравных между собой

  3. Рассчитать фактическое значение критерия F

ТЕСТ 7- 6

Какая дисперсия всегда должна быть в числителе при расчете критерия F-Фишера ?

  1. Любая

  2. Только внутригрупповая

  3. В любом случае межгрупповая

  4. Межгрупповая, если она больше внутригрупповой

ТЕСТ 7-7

Каково должно быть фактическое значение критерия F-Фишера ?

  1. Любым

  2. Всегда меньше 1

  3. Всегда больше 1

  4. Равным или больше 1

ТЕСТ 7-8

От чего зависит табличное значение критерия F-Фишера ?

1.От принятого уровня значимости

2. От числа степеней свободы общей вариации

3. От числа степеней свободы межгрупповой вариации

4. От числа степеней свободы внутригрупповой вариации

5. От величины фактического значения критерия F-Фишера ?

ТЕСТ 7-9

Увеличение числа наблюдений в каждой группе при равенстве дисперсий повышает вероятность принятия ……

1.Нулевой гипотезы

2.Альтернативной гипотезы

3.Не влияет на принятие как нулевой ,так и альтернативной гипотезы

ТЕСТ 7-10

В чем смысл конкретизации результатов дисперсионного анализа ?

  1. Уточнить верно ли проведены расчеты дисперсий

  2. Установить какие из генеральных средних оказались равными между собой

  3. Уточнить какие из генеральных средних не равны между собой

ТЕСТ 7-11

Верно ли высказывание : « При конкретизации результатов дисперсионного анализа все средние генеральные оказались равными между собой»

  1. Верно

  2. Может быть верным и неверным

  3. Не верно, это может иметь место вследствие допущенных ошибок в расчетах

ТЕСТ 7-12

Можно ли при конкретизации дисперсионного анализа прийти к выводу, что все генеральные средние не равны между собой ?

1. Вполне возможно

2. Возможно в исключительных случаях

3. Невозможно в принципе.

4. Возможно только при допущении ошибок в расчетах

ТЕСТ 7-13

Если по критерию F-Фишера была принята нулевая гипотеза требуется ли конкретизация дисперсионного анализа ?

1.Требуется

2.Не требуется

3.По усмотрению проводящего дисперсионный анализ

ТЕСТ 7-14

В каком случае для конкретизации результатов дисперсионного анализа используется критерий Тьюки.?

1. Если число наблюдений по группам ( выборкам ) одинаково

2. Если число наблюдений по группам ( выборкам ) разное

3.Если имеются выборки как с равными ,так и с неравными чис-

ленностями

ТЕСТ 7-15

Что представляет собой НСР при конкретизации результатов дисперсионного анализа на основе критерия Тьюки ?

1.Произведение средней ошибки на фактическое значение критерия

Тьюки

2. Произведение средней ошибки на табличное значение критерия

Тьюки

3. Отношение каждой разницы между выборочными средними к

средней ошибке

4. Разность между выборочными средними

ТЕСТ 7-16

Если выборочная совокупность разбита на группы по 2- признакам на сколько источников как минимум должна быть разбита общая вариация признака ?

  1. На 2

  2. На 3

  3. На 4

  4. На 5

  5. На 6

ТЕСТ 7-17

Если наблюдения по выборкам ( группам ) являются зависимыми , на сколько источников должна быть разбита общая вариация ( группировочный признак один ) ?

  1. на 2

  2. на 3

  3. на 4

  4. на 5

ТЕСТ 7- 18

Каков источник ( причина ) межгрупповой вариации ?

  1. Игра случая

  2. Совместное действие игры случая и фактора

  3. Действие фактора ( факторов)

  4. Выяснится после проведения дисперсионного анализа

ТЕСТ 7-19

Каков источник ( причина ) внутригрупповой вариации ?

1.Игра случая

2.Совместное действие игры случая и фактора

3.Действие фактора ( факторов)

4. Выяснится после проведения дисперсионного анализа

ТЕСТ 7-20

Какой способ преобразования исходных данных используется , если значения признака выражены в долях ?

  1. Логарифмирование

  2. Извлечение корня

  3. Фи- преобразование

Лекция 8 Корреляция

Аннотация

Важнейшим методом изучения связи между признаками является метод корреляции. В данной лекции раскрывается содержание этого метода, подходы к аналитическому выражению этой связи. Особое внимание уделяется таким специфическим показателям , как показатели тесноты связи

Ключевые слова

Корреляция. Метод наименьших квадратов. Коэффициент регрессии. Коэффициенты детерминации и корреляции.

Рассматриваемые вопросы

  1. Связь функциональная и корреляционная

  2. Этапы построения корреляционного уравнения связи. Интерпретация коэффициентов уравнения

  3. Показатели тесноты связи

  4. Оценка выборочных показателей связи

Модульная единица 1 Сущность корреляционной связи. Этапы построения корреляционного уравнения связи, интерпретация коэффициентов уравнения.

Цель и задачи изучения модульной единицы 1 состоят в уяснении особенностей корреляционной связи. освоении алгоритма построения уравнения связи, уяснении содержания коэффициентов уравнения.

    1. Сущность корреляционной связи

В природных и общественных явлениях имеют место два типа связей – связь функциональная и связь корреляционная. При функциональной связи каждому значению аргумента соответствуют строго определенные ( одно или несколько ) значений функции. Примером функциональной связи может служить связь между длиной окружности и радиусом, которая выражается уравнением. Каждому значению радиусаr соответствует единственное значение длины окружности L . При корреляционной связи каждому значению факторного признака соответствует несколько не вполне определенных значений результативного признака. Примерами корреляционной связи может служить связь между весом человека ( результативный признак ) и его ростом ( признак факторный ), связь между количеством внесенных удобрений и урожайностью, между ценой и количеством предлагаемого товара. Источником возникновения корреляционной связи является то обстоятельство, что ,как правило, в реальной жизни значение результативного признака зависит от множества факторов, в том числе имеющих случайный характер своего изменения. Например, тот же вес человека зависит от возраста, пола., питания, рода занятий и множества других факторов. Но вместе с тем , очевидно , что в целом решающим фактором является именно рост. Ввиду указанных обстоятельств корреляционную связь следует определить как связь неполную, которую можно установить и оценить только при наличии большого числа наблюдений, в среднем.

1.2 Этапы построения корреляционного уравнения связи.

Как и функциональная связь, корреляционная связь выражается уравнением связи. Для его построения необходимо последовательно пройти следующие шаги ( этапы ).

Вначале следует уяснить причинно-следственные связи, выяснить соподчиненность признаков, то есть какие из них являются причинами (факторными признаками ) , а какие следствием ( признаками результативными ). Причинно- следственные отношения между признаками устанавливаются теорией того предмета , где используется метод корреляции. Например, наука «анатомия человека» позволяет сказать каков источник взаимосвязи между весом и ростом, какой из этих признаков является фактором , какой результатом, наука «экономика» раскрывает логику взаимосвязи цены и предложения, устанавливает что и на каком этапе является причиной, а что следствием. Без такого предварительного теоретического обоснования интерпретация полученных в дальнейшем результатов затруднена, а иногда может привести к абсурдным выводам.

Установив наличие причинно- следственных отношений , далее следует эти отношения формализовать, то есть выразить с помощью уравнения связи, при этом сначала надо выбрать вид уравнения. Для выбора вида уравнения можно рекомендовать ряд приемов. Можно обратиться к теории того предмета, где используется метод корреляции, скажем наука «агрохимия» возможно уже получила ответ на вопрос каким уравнением следует выразить связь : урожайность – удобрения . Если такого ответа нет , то для выбора уравнения следует воспользоваться некими эмпирическими данными соответствующим образом их обработав. Сразу следует сказать , что выбрав вид уравнения на основе эмпирических данных , надо ясно представлять, что этот вид уравнения может быть использован для описания связи использованных данных. Основным приемом обработки этих данных является построение графиков, когда на оси абсцисс откладываются значения факторного признака, а на оси ординат возможные значения признака результативного. Поскольку по определению одному и тому же значению факторного признака соответствует множество неопределенных значений признака результативного, в результате указанных выше действий мы получим некоторую совокупность точек которая получила название корреляционного поля. Общий вид корреляционного поля позволяет в ряде случаев высказать предположение о возможном виде уравнения.. При современном развитии вычислительной техники одним из основных приемов выбора уравнения является перебор различных видов уравнений, при этом в качестве наилучшего выбирают то уравнение, которое обеспечивает самый высокий коэффициент детерминации, речь о котором пойдет ниже. Прежде чем перейти к расчетам надо проверить насколько привлекаемые для построения уравнения эмпирические данные удовлетворяют неким требованиям. Требования относятся к факторным признакам и к совокупности данных. Факторные признаки, если их несколько, должны быть независимыми друг от друга. Что касается совокупности то она должна быть во- первых однородна

( понятие однородности рассматривалось ранее ), а во- вторых достаточно большой. На каждый факторный признак должно приходится не менее чем 8-10 наблюдений.

После выбора уравнения следующим шагом является расчет коэффициентов уравнения. Расчет коэффициентов уравнения чаще всего производится на основе метода наименьших квадратов. С точки зрения корреляции использование метода наименьших квадратов состоит в получении таких коэффициентов уравнения , чтобы =min, то есть чтобы сумма квадратов отклонений фактических значений результативного признака ( ) от расчетных по уравнению () была величиной минимальной . Это требование реализуется построением и решением известной системы так называемых нормальных уравнений. Если в качестве уравнения корреляционной связи междуy и x выбрано уравнение прямой , где система нормальных уравнений, как известно будет такой :

Решая эту систему относительно a и b , получим необходимые значения коэффициентов. Правильность расчета коэффициентов проверяется равенством