Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
66 Молчанова Статистика УМК без титула (1).pdf
Скачиваний:
149
Добавлен:
11.03.2015
Размер:
1.63 Mб
Скачать

164 0,954 ошибка выборки не превышала 5 мин. При среднем квадратическом отклонении 15 мин.

Решение:

 

 

 

 

 

n =

t 2σ 2 N

 

;

 

 

 

 

 

 

 

2 N + t 2σ 2

 

 

 

 

t=2, т.к. р=0,954;

 

 

 

 

 

 

 

 

 

 

 

σ =15; N=153,4;

 

=5;

 

 

 

 

 

 

n =

 

22 ×152 ×153,4

=

 

 

900 ×153,4

 

=

138060

» 29,2 тыс. чел.

 

×153,4 +22 ×152

15

×153,4 +900

 

4735

52

 

 

 

 

 

3.За одну смену АО «Колос» выпустил 15000 буханок хлеба, каждая по 800 грамм. Предполагается провести обследование среднего веса буханки методом механического отбора. Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка не превышала 20 грамм, если по данным пробного обследования дисперсия составила 240?

4.Для обследования качества, продукция была распределена на 75 равновеликих серий. На основе механического отбора было проверено 15 серий, в которых удельный вес недоброкачественной продукции составил 15%. С вероятностью 0,683 установите границы качества всей продукции, если межсерийная дисперсия равна 860.

5.Для изучения общественного мнения населения области о проведении определённых мероприятий методом случайного отбора было опрошено 1000 человек. Из числа опрошенных 540 человек одобрили мероприятия.

Свероятностью 0,954 определите пределы, в которых находится доля лиц, одобривших мероприятия.

6.При планировании выборочного обследования занятости населения сельских районов региона имеются следующие данные:

Район

Численность населения

Удельный вес

 

в трудоспособном

занятого населения,

 

возрасте, тыс. чел.

% (оценка)

1

4,2

70

2

7,3

82

3

3,5

75

4

5,8

80

С вероятностью 0,997 определите необходимый объём типической пропорциональной выборки для установления границ генеральной доли, чтобы ошибка выборки не превышала 5%.

165

7.Партия елочных гирлянд упакована в 300 коробок по 20 шт. в каждой. Средняя длительность горения гирлянд составляет 1100 ч, а межсерийная дисперсия – 250. Качество гирлянд проверяется на основе серийного 2%-ного случайного бесповторного отбора.

Определите:

а) предельную ошибку при установлении средней длительности горения гирлянд;

б) пределы контролируемого параметра в генеральной совокупности. Выводы сделайте с вероятностью 0,997.

8.Определите, сколько персональных компьютеров следует подвергнуть обследованию в порядке случайной бесповторной выборки, чтобы с вероятностью 0,954 предельная ошибка (в процентах к среднему сроку службы компьютера) не превышала 3%. Коэффициент вариации среднего срока службы компьютеров по данным предыдущих обследований составляет 15%, а вся партия состоит из 1250 компьютеров.

9.По данным 20% выборочного обследования 100 семей переселенцев из зоны строгого радиационного контроля, количество детей в семьях составляет:

Количество детей

0

1

2

3

4

Итого

Количество семей

10

32

33

18

7

100

Определите:

1)среднее количество детей в семьях переселенцев и доверительный интервал для средней с вероятностью 0,954;

2)с той же вероятностью определите предельную ошибку, и доверительный интервал для доли семей, имеющих 3 и более детей.

10.При случайном способе отбора из партии было взято 100 проб продукта А. В результате обследования установлено, что доля брака продукта А в выборке составляет 2%. С вероятностью 0,954 определите пределы, в которых находится доля брака продукта А в партии.

11.Для определения среднего возраста рабочих предприятия была произведена 10%-ная механическая выборка рабочих методом случайного бесповторного отбора. В результате обследования были получены следующие данные:

Рабочие в возрасте, лет

20 - 30

30 - 40

40 - 50

50 –

60

Итого

Число рабочих, чел.

20

60

15

5

 

100

Свероятностью 0,997 определите:

1)пределы, в которых находится средний возраст рабочих предприятия;

2)пределы, в которых находится доля рабочих предприятия в возрасте старше 50 лет.

166

12.По результатам контрольной проверки налоговыми службами 500 бизнесструктур, у 175 из них в налоговых декларациях не полностью указаны доходы, подлежащие налогообложению.

Определите долю бизнесструктур, скрывших часть доходов от уплаты налогов, и доверительные границы доли с вероятностью 0,997.

13.Для выявления затрат времени на обработку деталей рабочими разной квалификации на предприятии была произведена 10%-я типическая выборка пропорционально численности выделенных групп (внутри типических групп произведён механический отбор). Результаты обследования могут быть представлены следующим образом:

Группы

Число

Средние затраты

Среднее

рабочих

рабочих

времени на обработку

квадратическое

по разряду

 

одной детали, мин.

отклонение, мин.

I

30

10

1

II

50

14

4

III

20

20

2

С вероятностью 0,954 определите пределы, в которых находятся средние затраты времени на обработку деталей рабочими.

14. По данным опроса из 400 респондентов, основными источниками информации о недвижимости считают:

Радио и телевидение

......................................................................120

Газеты и журналы.................................................................

180

Интернет…………………....................................................100

Для каждого источника информации определите его долю и предельную ошибку выборки с вероятностью 0,997.

15.С целью прогнозирования урожая овса в хозяйстве была произведена 10%-я серийная выборка, в которую попали три участка. В результате обследования установлено, что урожайность овса на участках составила 26, 30 и 34 ц/га. С вероятностью 0,954 определите пределы, в которых будет находиться средняя урожайность овса в хозяйстве.

16.При обследовании семейных бюджетов населения города была организована 10%-ная типическая пропорциональная выборка. Результаты обследования представлены в следующей таблице:

Группы населения

Объем выборки

Доля расходов

по семейному положению

 

на оплату жилья, %

Одинокие

55

9

Семейные

145

6

167 С вероятностью 0,683 установите границы доли расходов на оплату

жилья населением города.

Тест 1. Как называется статистическая совокупность, из которой производится отбор?

а) генеральная; б) выборочная.

2. Доверительный интервал выборочной средней и доли при малой выборке является односторонним или двусторонним?

а) односторонним; б) двусторонним.

3. При выборочном обследовании бюджета времени работающих отбирается каждое пятое предприятие из общего списка их отрасли, а затем на отобранных предприятиях отбирается каждый десятый рабочий или служащих. Укажите способ такого отбора:

а) механический; б) типический;

в) многоступенчатый; г) многофазный; д) многомерный.

4. Различия между выборочными оценками и характеристиками генеральной совокупности называются:

а) ошибками регистрации; б) ошибками репрезентативности.

5.Ошибка механической выборки вычисляется по формуле:

а) повторной выборки; б) бесповторной выборки.

6.Определите предельную ошибку выборки с вероятностью 0,9,

если средняя ошибка равна 100:

а) 90; б) 164; в) 200.

7. По данным выборочного обследования 25 фирм (19%-й отбор) средняя продолжительность оборота дебиторской задолженности – 72 дня при среднем квадратическом отклонении 10 дней. Определите предельную ошибку выборки для средней продолжительности оборота с вероятностью 0,954.

а) 1,8; б) 2,0; в) 3,6; г) 4,0.

8. При вычислении ошибки типической выборки используют:

а) общую дисперсию;

168 б) среднюю из групповых дисперсий; в) межгрупповую дисперсию.

9. С вероятностью 0, 954 определить необходимую численность выборки для оценки среднего размера семьи при условии, что ошибка выборочной средней не должна превышать 0,5 чел. при среднем квадратическом отклонении 2,0 чел.

а) 64; б) 45; в) 57.

10. При каком отборе одни и те же единицы подвергаются обследованию по расширенной программе?

а) при комбинированном; б) при многоступенчатом; в) при многофазном; г) при механическом.

11. Определите с вероятностью 0,95 предельную ошибку, если средняя ошибка равна 30:

а) 28,5; б) 58,8; в) 60,0.

12. В каком случае предельная ошибка доли признака в генеральной совокупности будет больше (при прочих равных условиях), если общая дисперсия в 3,5 раза больше межгрупповой:

а) при отборе 100 единиц; б) при отборе 25 серий.

13. Что произойдет с предельной ошибкой выборки, если вероятность, гарантирующую результат, увеличить с 0,683 до 0,954?

а) увеличится на 27%; б) увеличится в 1,4 раза. в) увеличится в два раза;

г) уменьшится в два раза;

14. Обследовано 36% продукции предприятия. На сколько процентов ошибка собственно случайной бесповторной выборки меньше ошибки повторной выборки?

а) 36; б) 20; в) 18; г) 6;

д) предсказать результат невозможно.

15. С вероятностью 0,997 определите предельную ошибку выборки, если известно, что средняя ошибка равна 50.

а) 100; б) 50,997; в) 150; г) 49,85.

16. При прочих равных условиях ошибка выборки будет меньше при:

169

а) механическом отборе; б) типическом отборе; в) серийном отборе.

17. Сколько респондентов необходимо опросить, оценивая качество гостиничного обслуживания (удовлетворяет, не удовлетворяет), чтобы предельная ошибка выборки долей с вероятностью 0,954 при этом не превысила 5%?

а) 400; б) 100; в) 200; г) 20.

18. Из партии готовой продукции в 1000 шт. в случайном бесповторном порядке обследовано 100 штук. Доля забракованных изделий составила 10%. Определите вероятность того, что допущенная погрешность не превысит 5%

а) t=1,67; б) t=1,76; в) t=2,0

19. Для каких способов формирования выборочной совокупности ошибка выборки определяется по одинаковым формулам?

а) для собственно-случайного и механического; б) для собственно–случайного и типического; в) для механического и типического.

20. По данным выборочного опроса 46% респондентов считают рекламу основным источником информации о товарном рынке. Средняя ошибка выборки этого показателя – 2,5%. С вероятностью 0,954 можно утверждать, что рекламой пользуются:

а) не менее 43,5% потребителей; б) не более 48,5%; в) не менее 41 и не более 51%; г) не менее 51%.

170

1.9 Статистические методы изучения взаимосвязей социально-экономических явлений

1.9.1 Причинность, регрессия, корреляция

Исследование объективно существующих зависимостей и взаимосвязей между явлениями и процессами - важнейшая задача теории статистики, которая играет в экономике значительную роль и позволяет глубже понять сложный механизм причинно-следственных отношений между явлениями. Причинно-следственные отношения - это такая связь явлений и процессов, когда изменение одного из них - причины ведет к изменению другого - следствия.

Все социально-экономические явления взаимосвязаны и представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо выявлять главные, основные причины, абстрагируясь от второстепенных.

Признаки по их значению для изучения взаимосвязи делятся на два класса. Признаки, характеризующие причины и условия связи, называются факторными (х), а признаки, которые характеризуют следствия связи, – результативными (у).

Между признаками х и у возникают разные по природе и характеру связи, а именно: функциональные и стохастические. При функциональной связи каждому значению признака х соответствует одно определенное значение у. Эта связь проявляется однозначно в каждом отдельном случае. При стохастической связи каждому значению признака х соответствует определенное множество значений у, образующих так называемое условное распределение. Как закон эта связь проявляется только в массе случаев и характеризуется изменением условных распределений у. Если заменить условное распределение

средней величиной y , то образуется разновидность стохастической связи – корреляционная. В случае корреляционной связи каждому значению признака х соответствует среднее значение результативного признака y .

Связи между явлениями и их признаками классифицируются:

по степени тесноты;

по направлению;

по аналитическому выражению.

По степени тесноты связи представлены в таблице 1.9.1.

По направлению выделяют:

171

Прямую связь - это такая связь, при которой с увеличением или с уменьшением значений факторного признака происходит увеличение или уменьшение значений результативного. Так, например, рост производительности труда способствует увеличению уровня рентабельности производства.

Обратную связь – это такая связь, при которой значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака. Так с увеличением уровня фондоотдачи снижается себестоимость единицы производимой продукции.

Таблица 1.9.1

Количественные критерии оценки тесноты связи

Величина коэффициента

Характер связи

корреляции

 

до ±0,3

практически отсутствует

±0,3 - ±0,5

слабая

±0,5 - ±0,7

умеренная

±0,7 - ±1,0

сильная

По аналитическому выражению выделяют связи:

прямолинейные (или просто линейные);

нелинейные.

Если статистическая связь между явлениями может быть приблизительно выражена уравнением прямой линии, то ее называют линейной связью вида:

yx = a0 + a1 x (1.9.1)

Если же связь может быть выражена уравнением какой-либо кривой линии, например, параболы, то такую связь называют нелинейной или криволинейной:

yx = a0 + a1 x + a2 x2 (1.9.2)

Для выявления наличия связи, ее характера и направления в

статистике используются методы:

приведения параллельных данных;

аналитических группировок;

графический;

корреляции.

172

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере. Сравним изменение двух величин:

X

1

2

3

4

5

6

7

8

9

Y

5

9

6

10

14

17

15

20

23

Мы видим, что с увеличением величины X величина Y также возрастает. Можно сделать предположение, что связь между ними прямая и что ее можно описать или уравнением прямой или уравнением параболы второго порядка.

Графически взаимосвязь двух признаков изображается с помощью поля корреляции. В системе координат на оси абсцисс откладываются значения факторного признака, а на оси ординат - результативного.

Каждое пересечение линий, проводимых через эти оси, обозначаются точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

Корреляция - это статистическая зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению среднего значения другой.

Варианты корреляционной зависимости:

1)парная корреляция - связь между двумя признаками (результативным и факторным, или двумя факторными).

2)частная корреляция - зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.

3)множественная корреляция - зависимость результативного и двух или более факторных признаков, включенных в исследование.

Корреляционный анализ имеет своей задачей количественное

определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции, которые, давая количественную характеристику тесноты связи между признаками, позволяют определять «полезность» факторных признаков при построении уравнения множественной регрессии.

173 Регрессия тесно связана с корреляцией: первая оценивает силу

(тесноту) статистической связи, вторая исследует ее форму.

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторов).

Одной из проблем построения уравнений регрессии является их размерность, то есть определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным.

Сокращение размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую. В то же время, построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс.

При построении моделей регрессии должны соблюдаться следующие требования:

1.Совокупность исследуемых исходных данных должна быть однородной

иматематически описываться непрерывными функциями.

2.Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей.

3.Все факторные признаки должны иметь количественное (цифровое) выражение.

4.Наличие достаточно большого объема исследуемой выборочной совокупности.

5.Причинно-следственные связи между явлениями и процессами должны описываться линейной или приводимой к линейной форме зависимостью.

6.Отсутствие количественных ограничений на параметры модели связи.

7.Постоянство территориальной и временной структуры изучаемой совокупности.

Соблюдение данных требований позволяет построить модель, наилучшим образом описывающую реальные явления и процессы.

1.9.2Парная регрессия на основе метода наименьших

квадратов и метода группировок Парная регрессия характеризует связь между двумя признаками:

результативным и факторным. Аналитически связь между ними описывается уравнениями:

прямой

yx = a0 + a1 x

174

 

 

 

 

1

гиперболы

 

 

ух

= а0 + а1

 

 

 

 

 

х

параболы

yx

= a0 + a1x + a2 x2

(1.9.3)

 

показательной функции

yx

= a0

+ a1х

 

 

полулогарифметической функции

yx

= a0

+ a1 lg x

и так далее.

Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.

Оценка параметров уравнений регрессии ( а0 , а1 и а2 - в

уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении

параметров модели ( а0 , а1 ), при которых минимизируется сумма

квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

S = å ( y - yx )2 ® min (1.9.4)

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

ì na0 + a1 åx = åy

(1.9.5)

í

åx + a1 åx

2

= åxy

îa0

 

 

где n - объем исследуемой совокупности (число единиц наблюдения).

175

В уравнениях регрессии параметр a 0 показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков; коэффициент регрессии a 1 показывает, на сколько изменяется

в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

Пример. По данным наблюдения окупаемость затрат на радиоприборы зависит от срока освоения их производства (см. табл. 1.9.2).

Таблица 1.9.2

Зависимость между окупаемостью затрат и сроком освоения производства приборов

Срок

Окупаемость затрат,

 

 

 

освоения,

 

ху

у х

продук-

тыс. ден. ед.

х 2

ции

лет

(y)

 

 

 

(x)

 

 

 

 

 

 

 

 

1

5

10,2

25

51

8,104

2

4

7,5

16

30

7,084

3

7

13,9

49

97,3

10,144

4

10

12,8

100

128

13,204

5

1

0,6

1

0,6

4,024

6

2

2,8

4

5,6

5,044

7

8

13,2

64

105,6

11,164

8

12

10,1

144

121,2

15,244

9

3

5,4

9

16,2

6,064

10

6

12,7

36

76,2

9,124

Итого

58

89,2

448

631,7

89,2

Предположим наличие линейной зависимости между рассматриваемыми признаками. Тогда, система нормальных уравнений для данного примера будет иметь следующий вид:

ì 10a0 +58a1 =89,2 íî58a0 +448a1 = 631,7

Отсюда: a 0 = 3,004; a 1 = 1,02. Следовательно, у х =3,004 +

1,02x.

На практике исследования часто проводятся по большому числу наблюдений. В этом случае исходные данные удобнее представлять в

176 сводной групповой таблице. При этом анализу подвергаются

сгруппированные данные и по факторному (x) и по результативному (y) признакам, то есть уравнения парной регрессии целесообразно строить на основе сгруппированных данных.

1.9.3 Множественная (многофакторная) регрессия

Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной)

регрессии:

у1,2,...,k = f (x1 , x2 , , xk ) (1.9.6)

Построение моделей множественной регрессии включает несколько этапов:

1.Выбор формы связи (уравнения регрессии);

2.Отбор факторных признаков;

3.Обеспечение достаточного объема совокупности.

Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.

Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков.

С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерностью 100 и более факторных признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации. В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.

Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе интуитивно-логических или многомерных статистических методов анализа.

Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в последовательном включении

177 факторов в уравнение регрессии и последующей проверке их значимости.

Факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется на сколько уменьшается сумма квадратов остатков и увеличивается величина

множественного коэффициента корреляции (R 2 ). Одновременно

используется и обратный метод, то есть исключение факторов, ставших незначимыми. Фактор является незначимым, если его включение в уравнение регрессии только изменяет значения коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициента регрессии не изменяется (или меняется несущественно), то данный признак существенен и его включение в уравнение регрессии необходимо. В противном случае, фактор нецелесообразно включать в модель регрессии.

При построении модели регрессии возможна проблема мультиколлинеарности, под которой понимается тесная зависимость

между факторными признаками, включенными в модель ( rxij > 0,8).

Наличие мультиколлинеарности между признаками приводит к:

искажению величины параметров модели, которые имеют тенденцию

кзавышению, чем осложняется процесс определения наиболее существенных факторных признаков;

изменению смысла экономической интерпретации коэффициентов регрессии.

Вкачестве причин возникновения мультиколлинеарности между признаками, можно выделить следующие:

изучаемые факторные признаки являются характеристикой одной и той же стороны явления или процесса. Например: показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;

факторные признаки являются составляющими элементами друг друга;

факторные признаки по экономическому смыслу дублируют друг друга.

Устранение мультиколлинеарности может реализовываться через исключение из корреляционной модели одного или нескольких линейносвязанных факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы.

178 Вопрос о том, какой из факторов следует отбросить, решается на

основании качественного и логического анализа изучаемого явления. Качество уравнения регрессии зависит от степени достоверности и

надежности исходных данных и объема совокупности. Исследователь должен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей.

Аналитическая форма связи результативного признака от ряда факторных выражается и называется многофакторным (множественным) уравнением регрессии или моделью связи.

Линейное уравнение множественной регрессии имеет вид:

y1,2, ,k = a0 +a1 x1 +a2 x2 + +ak xk (1.9.7)

где y1, 2,3,..., k - теоретические значения результативного признака,

полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;

х1 , х2 ,..., хk - факторные признаки;

а1 , а2 ,..., аk - параметры модели (коэффициенты регрессии).

Параметры уравнения могут быть определены графическим методом, методом наименьших квадратов и так далее.

1.9.4Собственно-корреляционные параметрические методы

изучения связи

Измерение тесноты и направления связи является важной задачей изучения и количественного измерения взаимосвязи социальноэкономических явлений. Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (множественных) факторных.

Линейный коэффициент корреляции характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости.

179 В теории разработаны и на практике применяются различные

модификации формулы расчета данного коэффициента:

r xy -x × y

xy = σx ´σy (1.9.8)

Производя расчет по итоговым значениям исходных переменных, линейный коэффициент корреляции можно вычислить по формуле:

rxy =

n × å xy - å x × å y

 

[nå x 2 - (å x)2

]×[nå y 2 - (å y)2

] (1.9.9)

 

Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость, выражаемая формулой:

 

r = ai

σ x

 

 

i

(1.9.10)

 

σ y

 

 

 

где a i

- коэффициент регрессии в уравнении связи;

σ xi

- среднеквадратическое отклонение соответствующего,

 

статистически существенного, факторного признака.

Линейный коэффициент корреляции изменяется в пределах от -1 до 1: −1 ≤ r ≤ 1. Знаки коэффициентов регрессии и корреляции совпадают.

При этом интерпретацию выходных значений коэффициента корреляции можно представить в следующей таблице 1.9.3:

Таблица 1.9.3

Оценка линейного коэффициента корреляции

Значение

 

 

линейного

Характер

Интерпретация связи

коэффициента

связи

 

связи

 

 

r = 0

отсутствует

-

0<r<1

прямая

с увеличением x увеличивается y

-1<r<0

обратная

с увеличением x уменьшается y и

наоборот

r=1

 

функциональная

каждому значению факторного

 

 

признака строго соответствует одно

 

 

значение результативного признака

180 Пример. По исходным данным, представленным в таблице 1.9.2,

оценим тесноту связи с помощью коэффициента корреляции (см. табл. 1.9.4).

Расчетная таблица для определения

Таблица 1.9.4

 

 

коэффициента корреляции

 

№ п/п

x

y

ху

х 2

у 2

1

5

10,2

51

25

104,04

2

4

7,5

30

16

56,25

3

7

13,9

97,3

49

193,21

4

10

12,8

128

100

163,84

5

1

0,6

0,6

1

0,36

6

2

2,8

5,6

4

7,84

7

8

13,2

105,6

64

174,24

8

12

10,1

121,2

144

102,01

9

3

5,4

16,2

9

29,16

10

6

12,7

76,2

36

161,29

Сумма

58

89,2

631,7

448

992,24

Средняя

5,8

8,92

63,17

44,8

99,224

1. Используя формулу (1.9.8) получаем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σx =

 

 

 

 

 

 

 

 

 

= 44,8 -(5,8)2 =

 

 

 

 

 

 

 

 

»3,34;

 

 

 

 

 

 

х2 -(x) 2

 

44,8 -33,64

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σy = у 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

y

) 2

 

= 99,224 (8,92) 2 =

99,224 79,5664

=

19,6576

4,43

 

 

rxy =

63,17 -5,8×8,92

=

63,17 -51,736

 

=

11,434

»0,77.

 

 

 

 

 

 

 

 

 

 

 

 

3,34×4,43

14,8

 

 

 

14,8

 

 

 

 

 

 

2. По формуле (1.9.9) значение коэффициента корреляции

составило:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

rxy

=

 

 

 

 

 

 

 

10 ×631,7 -58 ×89,2

 

 

 

=

6317 -5173,6

 

» 0,77

 

 

 

[10 ×448 -(58)2 ]×[10 ×992,24 -(89,2)2 ]

 

 

 

 

 

 

1116 ×1965,76

 

Таким образом, результат по всем формулам одинаков и свидетельствует о сильной прямой зависимости между изучаемыми признаками.

В случае наличия нелинейной зависимости между двумя признаками для измерения тесноты связи применяют теоретическое корреляционное отношение:

 

 

σост2

 

ηТ =

δ2

(1.9.11)

 

= 1

 

σ2

σ2

 

 

 

где δ2 - дисперсия выравненных значений результативного признака, то есть рассчитанных по уравнению регрессии;

181 σ2 - дисперсия эмпирических (фактических) значений

результативного признака.

Для оценки тесноты связи также рассчитывается коэффициент детерминации:

η2 = δ 2

(1.9.12)

σ 2

 

Коэффициент детерминации показывает, какая доля вариации результативного признака объясняется вариацией изучаемого фактора х.

Корреляционное отношение (η) изменяется в пределах от 0 до 1 ( 0 ≤η ≤1 ) и анализ степени тесноты связи полностью соответствует

линейному коэффициенту корреляции (таблица 1.9.1).

Для измерения тесноты связи при множественной корреляционной зависимости, то есть при исследовании трех и более признаков одновременно, вычисляется множественный и частные коэффициенты корреляции.

Множественный коэффициент корреляции вычисляется при наличии линейной связи между результативным и несколькими факторными признаками, а также между каждой парой факторных признаков. Множественный коэффициент корреляции для двух факторных признаков вычисляется по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ryx2

+ ryx2

- 2r

yx

× r

yx

 

× r

 

 

 

 

 

 

Ry x x

 

 

 

1

2

 

 

2

x

 

x

 

 

 

 

 

=

 

 

 

 

1

 

 

1

2

(1.9.13)

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

1- r

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1 x 2

 

 

 

 

 

 

 

 

где ryx

i

- парные коэффициенты корреляции между признаками.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: 0 ≤ R ≤1 .

Приближение R к единице свидетельствует о сильной зависимости

между признаками.

Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками x 1 и x 2 при фиксированном значении других (k − 2) факторных признаков, то есть когда влияние x 3 исключается, то есть оценивается связь между x 1 и x 2 в «чистом виде».

182

В случае зависимости y от двух факторных признаков x 1 и x 2 коэффициенты частной корреляции имеют вид:

ryx

 

 

 

=

 

ryx1

 

-rx1 x 2

×ryx 2

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ö æ

 

 

ö

 

1

 

2

æ

-r

2

-r

2

 

 

 

 

ç1

 

÷×ç1

 

÷

 

 

 

 

è

 

x 2 y ø è

x1 x 2

ø

 

 

 

 

 

 

ryx

 

 

-rx1 y ×rx1 x 2

(1.9.14)

ryx

 

 

 

=

 

2

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ö æ

 

 

ö

 

 

2

 

1

æ

-r

2

-r

2

 

 

 

 

 

ç1

 

÷×ç1

 

÷

 

 

 

 

 

è

 

 

x1 y ø è

x1 x 2

ø

 

где r - парные коэффициенты корреляции между указанными в индексе переменными.

В первом случае исключено влияние факторного признака x 2 , во

втором - x 1 . Эти показатели могут быть и отрицательными, так как они

показывают, какая существует связь между признаками: прямая или обратная.

1.9.5 Принятие решений на основе уравнений регрессии Интерпретация моделей регрессии осуществляется методами той

отрасли знаний, к которой относится исследуемое явление. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки значимости входящих в модель факторных признаков.

Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый.

Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак плюс, то с увеличением данного фактора результативный признак возрастает; если факторный признак имеет знак минус, то с его увеличением результативный признак уменьшается.

Если экономическая теория подсказывает, что факторный признак должен иметь положительное значение, а он имеет знак минус, то необходимо проверить расчеты параметров уравнения регрессии. Такое явление чаще всего бывает в силу допущенных ошибок при решении. Однако следует иметь в виду, что когда рассматривается совокупное влияние факторов, то в силу наличия взаимосвязей между ними характер их влияния может меняться.

С целью расширения возможностей экономического анализа, используются частные коэффициенты эластичности, определяемые по формуле:

183

Эx

= a1

×

xi

(1.9.15)

y

i

 

 

 

 

 

 

где xi - среднее значение соответствующего факторного признака; y - среднее значение результативного признака;

a1 - коэффициент регрессии при соответствующем факторном признаке.

Коэффициент эластичности показывает на сколько процентов в среднем изменится значение результативного признака при изменении соответствующего факторного признака на 1%, при исключении влияния других факторов, учтенных в модели.

Частный коэффициент детерминации:

d xi = ryxi × βxi (1.9.16)

где ryxi - парный коэффициент корреляции между результативным и i- ым факторным признаком;

βxi - соответствующий стандартизованный коэффициент уравнения

множественной регрессии:

σ

βxi = а1 × σх i (1.9.17)

y

Частный коэффициент детерминации показывает на сколько процентов вариация результативного признака объясняется вариацией i-го признака, входящего в множественное уравнение регрессии.

Наиболее полная экономическая интерпретация моделей регрессии позволяет выявить резервы развития и повышения деловой активности субъектов экономики.

1.9.6Методы изучения связи качественных признаков

При наличии соотношения между вариацией качественных признаков говорят об их ассоциации, взаимосвязанности. Для оценки связи в этом случае используют ряд показателей.

Коэффициент ассоциации и контингенции. Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции.

Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть

184 альтернативным, то есть состоящим из двух качественно отличных друг

от друга значений признака (например, хороший, плохой).

Таблица 1.9.5

Таблица для вычисления коэффициентов ассоциации и контингенции

х

 

 

у

0

1

Итого

 

 

 

0

 

 

a

b

a+b

 

 

 

 

1

 

 

c

d

c+d

 

Итого

 

a+c

b+d

N

Коэффициенты вычисляются по формулам:

ассоциации: Ka

= ad bc

(1.9.18)

 

 

 

 

 

 

ad + bc

 

 

 

 

 

Kk

=

 

 

ad bc

 

 

 

 

 

 

 

 

 

 

контингенции:

 

(a + b) × (b + d ) × (a + c) × (c + d ) (1.9.19)

 

 

 

Причем, всегда коэффициент контингенции меньше коэффициента ассоциации ( К а > К к ).

Связь считается подтвержденной, если К а ³ 0,5 или К к ³

0,3.

Пример. В результате обследования студентов факультета экономики и менеджмента БГТУ им. В.Г. Шухова получены данные, представленные в таблице 1.9.6. Определим коэффициент контингенции между успеваемостью и посещаемостью спортивных секций студентами.

Таблица 1.9.6

Зависимость успеваемости студентов от посещаемости спортивных секций

 

 

 

Количество студентов

 

Успеваемость

посещающих

не посещающих

 

спортивные

спортивные

Итого

 

 

 

 

секции

секции

 

Удовлетворительная

 

374

 

102

476

Неудовлетворительная

17

 

51

68

К а = 374

×51

-102 ×17

= 19074 -1734

= 17340

= 0,833;

374

×51

+102 ×17

19074 +1734

20808

 

185

К к =

374 ×51-102 ×17

 

=

17340

= 0,394

 

 

 

44003,987

476 ×68×391×153

 

 

 

 

Таким образом, связь между успеваемостью и посещаемостью спортивных секций студентами факультета экономики и менеджмента имеет место, но не столь существенна.

Когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение

коэффициентов взаимной сопряженности Пирсона и Чупрова. Эти коэффициенты вычисляются по следующим формулам:

коэффициент Пирсона: K П

=

 

ϕ 2

 

 

 

 

(1.9.20);

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

коэффициент Чупрова: KЧ

=

 

 

 

 

ϕ2

 

 

 

(1.9.21)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(K1

1)(K 2 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где ϕ2

- показатель взаимной сопряженности;

 

 

 

 

 

ϕ - определяется

как

 

сумма

 

отношений

квадратов частот

каждой

 

клетки

таблицы

 

к

 

произведению

итоговых

частот,

 

соответствующего столбца и строки. Вычитая из этой суммы «1»,

 

получим величину ϕ2 : ϕ 2

 

= å

nxy2

 

 

 

1;

 

 

 

nx n y

 

 

 

 

 

 

 

 

 

 

 

 

K 1 - число значений (групп) первого признака;

 

 

K 2

- число значений (групп) второго признака.

 

 

Чем ближе величина коэффициента Пирсона и коэффициента

Чупрова к 1, тем теснее связь.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 1.9.7

Вспомогательная таблица для расчета коэффициента

 

 

 

взаимной сопряженности

 

 

 

 

 

 

х

у

I

 

 

II

 

III

 

Итого

 

 

 

 

 

 

 

 

 

I

 

 

 

 

 

nxy

 

 

 

nx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

II

 

 

 

 

 

 

 

 

 

 

 

nx

 

 

 

III

 

 

 

 

 

 

 

 

 

 

 

 

186

 

 

 

 

 

 

 

 

 

 

 

 

nx

Итого

 

n y

 

n y

n y

 

n

 

 

 

 

 

 

å

nxy2

 

 

 

å

nxy2

 

 

 

 

 

 

 

 

n y

 

 

 

2

nx

 

 

 

(1.9.22)

1+ϕ

 

= å

 

 

 

 

= å

 

 

 

 

 

 

n y

 

nx

 

 

 

 

 

 

 

 

 

 

 

Пример. С помощью коэффициентов взаимной сопряженности исследуем связь между квалификацией рабочих предприятия и уровнем их образования (см. табл. 1.9.8).

Таблица 1.9.8

Зависимость квалификации рабочих от их уровня образования

Квалификация

 

 

 

 

 

 

 

 

 

Образование

 

 

 

Итого

 

незаконченное

среднее

незаконченное

 

 

 

 

 

 

 

 

 

 

 

 

среднее

 

 

 

высшее

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Низкая

 

 

 

 

 

15

 

 

 

 

5

 

 

 

-

20

 

Средняя

 

 

 

 

 

10

 

 

 

 

20

 

 

 

5

35

 

Высокая

 

 

 

 

 

-

 

 

 

 

 

15

 

 

 

20

35

 

 

Итого

 

 

 

 

 

25

 

 

 

 

40

 

 

 

25

90

 

 

 

 

 

 

 

 

 

152

+

52 102

+

202

+ 52

 

152

+

202

 

 

 

 

 

 

1+ϕ 2 =

25

 

40

+

25

 

40

25

+

40

 

20

=1,642

 

 

 

 

 

 

20

 

 

 

 

 

35

 

 

35

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1+ϕ2

=1,642; ϕ2

= 0,642

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K П =

0,642

 

=

 

 

 

 

 

= 0,63 ;

 

 

 

 

 

 

 

 

 

0,39

 

 

 

 

 

 

 

 

 

1,642

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

KЧ

=

 

0,642

 

 

=

 

= 0,57.

 

 

 

 

 

 

 

 

 

 

 

 

0,321

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 ×2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Связь умеренная.

187

1.9.7Ранговые коэффициенты связи

Исследуя экономику, необходимо считаться с взаимосвязью наблюдаемых показателей и величин. При этом полнота описания, так или иначе, определяется количественными характеристиками причинноследственных связей между ними. Оценка наиболее существенной из них, а также воздействия одних факторов на другие является одной из основных задач статистики. Формы проявления взаимосвязей разнообразны. Одна из основных форм корреляционная (неполная, статистическая) связь.

Задачи корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак.

Ранжирование - упорядочение единиц совокупности по значению признака.

При ранжировании каждой единице совокупности присваивается

ранг.

Ранг - это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Если значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической из соответствующих номеров мест, которые определяют. Данные ранги называются связными.

Среди непараметрических методов оценки тесноты связи наибольшее значение имеют ранговые коэффициенты Спирмена ( p x y ) и

Кендалла (τ). Эти коэффициенты могут быть использованы для определения тесноты связи как между количественными, так и между качественными признаками.

Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается по формуле:

ρ x y

= 1-

6å di2

 

(1.9.23)

n(n2 -1)

d – разность рангов признаков Х и Y; n – число наблюдаемых единиц.

 

 

 

188

p x

 

 

 

 

В случае

отсутствия связи

y

=0.

При

прямой связи

 

p x

 

 

 

 

 

 

коэффициент

y

- положительная

 

дробь,

при

обратной –

 

 

 

 

 

 

 

 

отрицательная.

 

 

 

 

 

 

 

 

Коэффициент Спирмена принимает любые значения в интервале [−1; 1] .

Пример. По данным пятнадцати заводов, представленных в табл. 1.9.9, рассчитать коэффициент ранговой корреляции Спирмена, характеризующий степень тесноты связи между стоимостью основных фондов и выработкой цемента.

Сущность метода Спирмена состоит в следующем:

1)располагают варианты факторного признака по возрастанию - ранжируют единицы по значению признака y;

2)для каждой единицы совокупности указывают ранг с точки зрения результативного признака y .

Если связь между признаками прямая, то с увеличением ранга признака x ранг признака y также будет возрастать; при тесной связи ранги признаков x и y в основном совпадут. При обратной связи возрастанию рангов признака x будет, как правило, соответствовать убывание рангов признака y. В случае отсутствия связи последовательность рангов признака y не будет обнаруживать никакого порядка возрастания или убывания.

Таблица 1.9. 9

Исходные данные

Среднегодовая

Выпуск

п/п

стоимость промышленно-

цемента,

 

производственных фондов,

тыс. т

 

млн. руб.

 

 

(х)

(у)

1

11,1

8,8

2

8,4

22,3

3

8,0

19,8

4

7,9

20,8

5

5,3

11,5

6

10,3

25,8

7

8,0

22,8

8

8,7

15,7

9

12,8

21,7

10

5,4

10,7

11

5,8

12,2

 

 

189

12

3,6

8,5

13

5,5

13,9

14

4,5

14,5

15

2,9

7,6

Возьмем данные по условию, занесем их в графы 1-3 табл. 1.9.10 и проведем ранжирование (распределение по рангам).

Результаты ранжирования отражены в графах 4 и 5 табл. 1.9.10.

Для определения рангового коэффициента Спирмена ( p x

y

)

 

 

заполним графы 6 и 7 таблицы 1.9.10.

Подставим в формулу (1.9.23) данные графы 7 табл. 1.9.10, n = 15 и получим:

ρ x

=1-

 

6 ×209

=1-

1254

= 0,63.

15(152 -1)

3360

 

y

 

 

В итоге получили положительную дробь, причем значение ее больше, чем 0,5, что свидетельствует о существенной прямой связи между стоимостью основных производственных фондов и количеством выпущенного цемента.

,

Таблица 1.9.10

Расчетные данные для определения рангового коэффициента Спирмена

Среднегодовая

Выпуск

Ранги

Раз-

Квадрат

п/п

стоимость

цемента,

 

 

ность

раз-

 

промышленно-

тыс. т

 

 

ран-

ности

 

производственных

 

Rx

R

гов

рангов

 

фондов, млн. руб.

 

у

d 2

 

у

 

 

d

 

х

 

 

 

1

2

3

4

5

6

7

1

11,1

8,8

14

3

11

121

2

8,4

22,3

11

13

-2

4

3

8,0

19,8

9

10

-1

1

4

7,9

20,8

8

11

-3

9

5

5,3

11,5

4

5

-1

1

6

10,3

25,8

13

15

-2

4

7

8,0

22,8

10

14

-4

16

190

8

8,7

15,7

12

9

3

9

9

12,8

21,7

15

12

3

9

10

5,4

10,7

5

4

1

1

11

5,8

12,2

7

6

1

1

12

3,6

8,5

2

2

0

0

13

5,5

13,9

6

7

-1

1

14

4,5

14,5

3

8

-5

25

15

2,9

7,6

1

1

0

0

å

-

-

-

-

-

209

Ранговый коэффициент корреляции Кендалла (τ) также может использоваться для измерения взаимосвязи между качественными и количественными признаками, характеризующими однородные объекты и ранжированные по одному принципу. Расчет рангового коэффициента Кендалла осуществляется по формуле:

2S

 

τ = n(n −1)

(1.9.24)

где n - число наблюдений;

S - сумма разностей между числом последовательностей и числом инверсий по второму признаку.

Расчет данного коэффициента выполняется в следующей последовательности:

1.Значения x ранжируются в порядке возрастания или убывания;

2.Значения y располагаются в порядке, соответствующем значениям x;

3.Для каждого ранга y определяется число следующих за ним значений рангов, превышающих его величину. Суммируя, таким образом, числа определяется величина P, как мера соответствия последовательностей рангов по x и y и учитывается со знаком (+);

4.Для каждого ранга y определяется число следующих за ним значений рангов, меньших его величины. Суммарная величина обозначается через Q и фиксируется со знаком (-);

5.Определяется сумма баллов по всем членам ряда.

В приведенном примере (таблица 1.9.10):

P = 14+13+7+9+9+7+7+4+4+1+1+2+0+1+0 = 79; Q = 0+0+5+2+1+2+1+3+2+4+3+1+1+0+0 = 25;

Таким образом:

191

τ = 2 ×(79( - 25) ) = 0,51 , что свидетельствует об умеренной связи между

15 15 -1

рассматриваемыми признаками.

Как правило, коэффициент Кендалла меньше коэффициента Спирмена. При достаточно большом объеме совокупности значения данных коэффициентов имеют следующую зависимость:

τ = 23 p x y

Связь между признаками признается статистически значимой, если значения коэффициентов ранговой корреляции Спирмена и Кендалла больше 0,5.

Тренировочные задания

1. Имеются данные от Fortune о связи между оборотом и прибылью крупнейших компаний мира в 2004 г.:

 

 

192

 

 

Компания

Оборот,

Прибыль,

 

 

млрд. долл.

млрд. долл.

 

 

(x)

(y)

1.

Wal Mart Stores

288,0

10,3

2.

BP

285,1

15,4

3.

Exxon Mobil

270,8

25,3

4.

Royal Dutch/Shell

268,7

18,2

5.

General Motors

193,5

2,8

6.

Daimler Chrysler

176,7

3,1

7.

Toyota Motor

172,6

10,9

8.

Ford Motor

172,2

3,5

9.

General Electric

152,9

16,8

10. Total

152,6

12,0

 

Итого:

2133,1

118,3

// «Эксперт» №28 (475), 2005

Составьте линейное уравнение регрессии. Вычислите параметры методом наименьших квадратов и сформулируйте выводы.

Решение:

Расчетные показатели представим в следующей таблице:

Расчетная таблица для определения параметров уравнения регрессии в зависимости от оборота и прибыли компаний

х 2

ху

у 2

у х

82944,00

2966,40

106,09

16,5

81282,01

4390,54

237,16

16,3

73332,64

6851,24

640,09

15,4

72199,69

4890,34

331,24

15,3

37442,25

541,80

7,84

10,6

31222,89

547,77

9,61

9,5

29790,76

1881,34

118,81

9,3

29652,84

602,70

12,25

9,3

23378,41

2568,72

282,24

8,1

23286,76

1831,20

144,00

8,0

484532,25

27072,05

1889,33

118,3

193 Система нормальных уравнений для нахождения параметров

линейной парной регрессии методом наименьших квадратов имеет следующий вид:

ì a0n +a1 å x = å y; íîa0 å x + a1 å x2 = å xy.

где n - объем исследуемой совокупности;

а0 - показывает усредненное влияние на результативный признак неучтенных факторов; а1 - коэффициент регрессии, показывает, на сколько

изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения.

 

 

Решим систему:

 

 

 

 

 

 

 

 

 

 

 

 

ì

 

10a 0

+

 

2133,1a1 =118,3;

 

 

 

 

 

í

 

 

 

+ 484532,25а1 = 27072,05

 

 

 

 

 

î2133,1a 0

 

=

 

10

 

2133,1

 

= 484532,25 ×10 -2133,12 = 295206,89;

 

 

 

 

 

2133,1

484532,25

 

 

 

 

 

 

a 0

=

 

118,3

 

2133,1

 

= -427224,68;

 

 

 

 

 

 

 

27072,05

484532,25

 

 

a1

=

 

10

 

118,3

 

=18374,77;

 

 

 

 

 

 

 

2133,1

27072,05

 

 

 

 

a0 = a 0 ;

a1 = a1 ;

a0 =295206,89427224,68 =−1,4472; a1 =295206,8918374,77 =0,0622,

Отсюда: у x = −1,4472 + 0,0622x.

С увеличением оборота на 1 млрд. долл., прибыль компаний возрастает в среднем на 62,2 млн. долл.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]