Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЭКОНОМЕТРИКА и математическая экономика / Бородич С.А. Вводный курс эконометрики (БГУ).pdf
Скачиваний:
1024
Добавлен:
20.04.2015
Размер:
10.32 Mб
Скачать

2. БАЗОВЫЕ ПОНЯТИЯ СТАТИСТИКИ

При исследовании реальных экономических процессов приходится обрабатывать большие объемы статистических данных по самым разнообразным показателям, которые по своей сути являются случайными величинами. По ходу проводимого анализа часто возникает необходимость оценивания числовых значений различных параметров, неоднократно приходится выдвигать и проверять различные предположения, устанавливать наличие и силу зависимости между разнообразными факторами. На практике мы сталкиваемся с конкретными реализациями рассматриваемых СВ. Количество таких реализаций носит ограниченный характер, что не позволяет применять напрямую теоретические методы анализа. Поэтому здесь в первую очередь используются методы и модели математической статистики (в частности, выборочный метод), позволяющие получить необходимые знания об исследуемом объекте, осуществить направленный анализ и сделать обоснованные выводы.

Одной из центральных задач математической статистики является выявление закономерностей в статистических данных, на базе чего можно будет строить соответствующие модели для принятия обдуманных решений. Под статистическими данными подразумеваются данные наблюдений за значениями некоторой случайной величины или совокупности случайных величин, характеризующих изучаемый процесс.

Первая задача математической статистики – указать способы сбора и группировки статистических данных, полученных в результате наблюдений или испытаний.

Вторая задача математической статистики – разработать методы анализа статистических данных в зависимости от целей исследования. Сюда относятся:

а) оценки неизвестной вероятности события; неизвестной функции распределения; неизвестных параметров известного распределения; зависимости двух или нескольких случайных величин и т. п.;

б) проверка статистических гипотез о виде неизвестного распределения; о величинах параметров известного распределения; о виде и силе зависимости между рассматриваемыми случайными величинами.

Таким образом, основная задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

45

Знание методов математической статистики и умение ими оперировать являются необходимой предпосылкой для успешного эконометрического анализа. В данной главе приводятся подходы к анализу статистических данных, описываются основные характеристики, которые активно используются при статистической обработке экономических данных.

2.1. Генеральная совокупность и выборка

Пусть изучается совокупность однородных объектов относительно некоторого количественного признака, характеризующего эти объекты. Например, доход населения, количество покупателей в магазине в течение дня, количество качественных товаров в исследуемой партии и т. д.

Генеральной совокупностью называется множество всех возможных значений или реализаций исследуемой случайной величины X при данном реальном комплексе условий.

Выборкой (выборочной совокупностью) называют часть генеральной совокупности, отобранную для изучения.

Число элементов рассматриваемой совокупности называется ее

объемом.

Изучение всей генеральной совокупности во многих случаях либо невозможно, либо нецелесообразно в силу больших материальных затрат, либо в силу уничтожения или порчи исследуемых объектов. Например, анализ среднего дохода населения г. Минска формально предполагает наличие достоверной информации о каждом жителе города в конкретный момент времени. Получение такой информации просто невозможно. Проверка качества обуви связана с воздействием на нее различных экстремальных факторов: растяжения, сжатия, влажности, температуры, солнечных лучей, химического воздействия, что приведет к потере товарного вида исследуемой обуви. Поэтому на практике вся генеральная совокупность почти никогда не анализируется. Для осуществления выводов о генеральной совокупности в большинстве случаев используется выборка ограниченного объема. В силу этого задача математической статистики состоит в исследовании свойств выборки и обобщении этих свойств на генеральную совокупность. Полученный при этом вывод называется статистическим.

Информация о генеральной совокупности, полученная на основании выборочного наблюдения, практически всегда будет обладать некоторой погрешностью, так как она основывается на изучении только

46

части элементов. Вряд ли средний доход и разброс в доходах, полученных по выборке объема n = 1000, будет в точности таким же, что и во всем городе. Это определяет две проблемы, составляющие содержание математической теории выборки:

как организовать выборочное наблюдение, чтобы полученная информация достаточно полно отражала пропорции генеральной со-

вокупности (проблема репрезентативности выборки);

как использовать результаты выборки для суждения по ним с наибольшей надежностью о свойствах и параметрах генеральной сово-

купности (проблема оценки).

Всилу закона больших чисел можно утверждать, что выборка будет репрезентативной, если отбор будет носить случайный характер.

Различают повторную и бесповторную выборки. В первом случае отобранный объект перед отбором следующего возвращается в генеральную совокупность. Во втором – отобранный в выборку объект не возвращается в генеральную совокупность. Если выборка составляет незначительную часть генеральной совокупности, то различие между повторной и бесповторной выборками стирается.

Случайный отбор может проводиться с помощью датчика таблицы случайных чисел либо обычной жеребьевкой. Однако строгое соблюдение правил случайного отбора не всегда осуществимо, так как оно требует четко ограниченной базы статистического анализа, каковой является генеральная совокупность, перенумеровки всех ее элементов или непосредственного их извлечения при жеребьевке. Так, при проведении обследований дохода населения в масштабах города практически невозможно составить список всех его жителей или семей с последующей организацией выборки с помощью датчика случайных чисел. Аналогично невозможно организовать опросы по изучению покупательного спроса, потребностей населения и т.д. путем образования строго случайной выборки. Поэтому прибегают к различным приемам неслучайного отбора, стремясь, однако, приблизиться к условиям случайного. К этим приемам относится механический отбор, при котором элементы генеральной совокупности, предварительно упорядоченные, отбираются по заранее установленному правилу, не связанному с вариацией исследуемого признака. Например, можно фиксировать доход каждого сотого, входящего в метро. Серийным называют отбор, при котором объекты выбираются из генеральной совокупности не по одному, а “сериями”, которые подвергаются

47

сплошному обследованию. Например, о продукции предприятия можно судить по продукции, выпущенной в какой-то конкретный день. При типическом отборе объекты отбираются не из всей генеральной совокупности, а из каждой ее “типической” части. Например, население города можно предварительно классифицировать по социальному статусу (бизнесмены, чиновники, служащие, рабочие и т. д.). Нередко на практике применяется комбинированный отбор, при котором сочетаются описанные выше способы.

2.2. Способы представления и обработки статистических данных

Во многих случаях для анализа тех либо других экономических процессов важен порядок получения статистических данных. Но при рассмотрении так называемых перекрестных данных порядок их получения не играет существенной роли. Кроме того, результаты выборочных значений x1, х2, …, хn количественного признака Χ генеральной совокупности, записанные в порядке их регистрации, обычно труднообозримы и неудобны для дальнейшего анализа. Задачей статистического описания выборки является получение такого ее представления, которое позволит наглядно выявить ее вероятностные характеристики. Для этого применяются различные формы упорядочения данных в выборке – по возрастанию, по совпадающим значениям, по интервалам и т. п.

При анализе какого-то конкретного показателя Х за фиксированный момент времени (либо без учета фактора времени) наблюдаемые значения x1, x2,…, xn обычно упорядочивают по неубыванию: x1x2 ≤ ≤ xn . Разность между максимальным и минимальным значениями СВ Х называется размахом выборки. Пусть количество различных значений в выборке равно k ( k n ) . Для определенности положим

x1 < x2 < … < xk.

Значения xi, i = 1, 2, … ,k называются вариантами.

Пусть значение xi встретилось в выборке

ni раз, тогда число ni

называется частотой значения xi, а ϖ i =

ni

относительной час-

n

 

 

 

тотой значения xi. Тогда наблюдаемые значения можно сгруппировать в статистический ряд, показанный в табл. 2.1:

48

Таблица 2.1

X

 

 

 

 

x1

 

x2

xk

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

 

 

n1

 

n2

nk

ni = n ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

n

i

 

 

n

1

 

n

2

 

n

k

 

= 1.

ωi =

 

 

 

 

 

 

 

 

n

n

 

n

 

n

n

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По статистическому ряду можно построить эмпирическую функ-

цию распределения F (x):

F (x) =

nx

,

(2.1)

 

 

n

 

где nx – число значений случайной величины Χ меньших, чем x ; n – объем выборки. По определению F (x) обладает следующими свойствами:

1.0 F (x) ≤ 1;

2.для любых x1 < x2 1) F (x2);

3.F (x) = 0 при x x1; F (x) = 1 при x > xk.F (x

Эмпирическая функция распределения F (x) является оценкой функции распределения F(x) = P( X < x ), которая в этом случае называется теоретической функцией распределения.

Пример 2.1. Анализируется прибыль Х(%) предприятий отрасли. Обследованы n = 100 предприятий, данные по которым занесены в следующий статистический ряд.

 

X

5

10

15

20

25

 

ni

5

20

40

25

10

 

ni

 

0.05

0.2

0.4

0.25

0.1

 

n

 

 

 

 

 

 

Необходимо построить эмпирическую функцию распределения F (x) и ее график.

0,

x 5 ;

0.05,

5 < x 10 ;

F (x) = 0.25, 10 < x 15 ; 0.65, 15 < x 20 ;

0.90,

20 < x 25 ;

1,

x > 25.

49

– относительная частота попадания СВ Χ в i-й по-

F (x)

 

 

 

 

 

 

1

 

 

 

 

 

 

0.90

 

 

 

 

 

 

0.65

 

 

 

 

 

 

0.25

 

 

 

 

 

 

0.05

 

 

 

 

 

 

0

5

10

15

20

25

x

 

 

 

Рис. 2.1

 

 

Наглядно статистический ряд может быть представлен в виде полигона час-

тот (рис. 2.2, а) или полигона относительных частот (рис. 2.2, б):

ni

 

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

40

 

-

 

 

 

 

 

0.4

-

 

 

 

 

 

25

 

-

 

 

 

 

0.25

-

 

 

 

 

20

 

-

 

 

 

 

 

0.20

-

 

 

 

 

 

10

 

-

 

 

 

 

0.10

-

 

 

 

 

5

 

-

 

 

 

 

 

0.05

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

5

10

15

20

25

X

0

5

10

15

20

25

X

 

 

 

 

a

 

 

 

 

 

 

 

 

б

 

 

 

 

Рис. 2.2

При большом объеме выборки ее элементы могут быть сгруппи-

рованы в интервальный статистический ряд. Для этого все n наблю-

даемых значений выборки x1, x2 , ..., xn разбивают по k непересе-

кающимся подынтервалам равной длины h (h – шаг разбиения). Пусть ni – количество наблюдаемых значений СВ Χ, попадающий в i-й по-

дынтервал. ϖ i = nni

дынтервал. Тогда интервальный статистический ряд имеет вид:

50

 

 

 

 

 

 

 

 

 

 

Таблица 2.2

[ xi-1, xi)

[ x0, x1 )

[ x1, x2 )

[ xk-1, xk )

 

ni

 

n1

 

n2

 

nk

 

ni

 

 

n1

 

 

n2

 

 

nk

 

 

n

 

n

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

Интервальный статистический ряд наглядно может быть представлен в виде гистограммы графика, в котором по оси абсцисс откладываются подынтервалы, на i-м из которых строится прямоуголь-

ник высотой nhni . По виду гистограммы обычно выдвигают предпо-

ложение о виде закона распределения исследуемой величины, что позволяет придать определенную направленность исследованиям.

Пример 2.2. Анализируется доход населения, для чего извлечена выборка объема n = 300. По уровню дохода население подразделяется на k = 6 групп. Полученные по выборке данные сгруппированы в следующий интервальный статистический ряд:

[ xi-1, xi )

[ 0, 20 )

[ 20, 40)

[ 40, 60)

[ 60, 80)

[ 80, 100)

[100,120)

 

 

 

 

 

 

 

 

 

ni

10

50

80

100

40

20

 

ni

 

1/30

5/30

8/30

10/30

4/30

2/30

 

n

 

 

 

 

 

 

 

Необходимо построить гистограмму и выдвинуть предположение о виде закона распределения СВ Х дохода населения.

Отметим, что в последнюю группу могут быть включены все субъекты, чей доход превышает 100 у. е. Однако для получения теоретических выводов последний подынтервал полагается той же длины h = 20, что и все предыдущие.

Построим гистограмму: ni/(nh)

10/600 - 8/600 -

5/600 - 4/600 -

2/600 - 1/600 -

0

20

40

60

80

100

120

x

Рис. 2.3

51

Форма гистограммы (рис. 2.3) в наибольшей степени соответствует нормальному закону распределения. Поэтому естественным является предположение о нормальном распределении СВ Х дохода населения (Х N( m, σ)). Следующим этапом исследования является определение параметров m и σ, что будет обсуждаться далее.

2.3. Вычисление выборочных характеристик

Для любой СВ Χ кроме определения ее функции распределения желательно указать ее числовые характеристики, важнейшими из которых являются математическое ожидание, дисперсия, среднее квадратическое отклонение. Пусть объем генеральной совокупности равен N. Тогда математическим ожиданием СВ Χ является генеральное среднее:

 

 

1

N

 

xГ

=

 

xi .

(2.2)

 

 

 

N i=1

 

Дисперсией СВ Χ является генеральная дисперсия:

 

 

1

N

2

 

DГ

=

 

(xi xГ )

.

 

 

 

N i=1

 

 

Корень квадратный из генеральной дисперсии называется

ральным средним квадратическим отклонением:

уГ = DГ .

(2.3)

гене-

(2.4)

Таким образом, для нахождения генеральных числовых характеристик необходим анализ всей генеральной совокупности. В силу того, что в реальности практически всегда имеют дело с выборками, приходится находить оценки указанных выше генеральных характеристик - выборочные числовые характеристики: выборочное среднее, выборочную дисперсию, выборочное среднее квадратическое отклонение.

Выборочное среднее – это среднее арифметическое наблюдаемых значений выборки.

xB

=

1

n

(2.5)

 

xi .

 

 

n i=1

 

При задании выборки в виде статистического ряда

xB рассчи-

тывается по следующей формуле:

1

 

 

xB

 

k

(2.6)

=

 

nixi .

 

 

n i=1

 

Оценкой генеральной дисперсии является выборочная дисперсия:

52

DВ =

1

k

2

.

(2.7)

 

ni (xi xB )

 

 

n i=1

 

 

 

Зачастую для вычисления DВ применяется следующая формула:

 

1

n

2

 

2

 

 

 

 

2

 

 

DВ =

2xi xB + (xB )

) = x

2

x

.

(2.8)

 

(xi

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

 

 

При задании выборки в виде статистического ряда имеем:

 

DВ =

1 k

 

 

2

.

 

 

 

 

 

(2.9)

 

 

ni (xi xB )

 

 

 

 

 

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

 

 

Корень квадратный из выборочной дисперсии называется

выборочным средним квадратическим отклонением:

 

 

 

 

 

1

k

 

 

 

 

 

 

 

 

 

 

уВ =

DВ =

2

=

 

x

2

x

2

.

(2.10)

 

 

ni (xi xB )

 

 

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

 

 

При задании выборки в виде интервального статистического ряда в формулах (2.6), (2.9), (2.10) вместо xi рассматривается среднее значе-

ние i-го подынтервала: xi =

xi1

+ xi

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

Для примера 2.1 имеем:

 

 

 

 

 

 

 

 

 

 

1

 

 

5

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

xB =

 

 

 

nixi =

 

 

 

 

(5 5 + 20 10 + 40 15 + 25 20 + 10 25) = 15.75 ,

 

 

 

 

100

 

 

20 i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

5

 

 

 

 

xB )2 =

 

 

1

 

(5 10.752 + 20 5.752

+ 40 0.752

 

 

DВ =

 

 

ni (xi

 

 

 

+

 

 

 

 

 

100

 

 

 

 

 

100 i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+ 25 4.752 + 10 9.752 ) = 27.7625,

 

 

 

σB =

 

27.7625 = 5.269.

 

 

 

 

 

 

 

 

 

Для примера 2.2 имеем:

 

 

 

 

 

 

 

 

 

xB

 

 

 

1

6

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

=

 

 

 

nixi =

(10 10 + 50 30 + 80 50 + 100 70 +

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

300 i=1

 

 

 

 

300

 

 

 

 

 

 

 

 

 

 

+ 40 90 + 20 110) = 61.33,

 

 

 

 

 

 

 

 

 

DВ =

 

1

6

 

 

 

 

xB )2 =

 

 

1

(10 51.332 + 50 31.332 + 80 11.332

+

 

 

ni

(xi

 

 

 

 

 

 

 

300

 

 

 

 

 

100 i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

+ 100 8.672 + 40 28.672 + 20 48.672 ) = 578.22,

 

 

 

σB =

 

 

 

 

 

 

 

 

 

 

 

 

578.22 = 24.05.

 

 

 

 

 

 

 

 

 

53

В дальнейшем для упрощения выкладок xB будем обозначать через x .

По аналогичной схеме определяются статистические оценки других числовых характеристик СВ. Приведем формулы расчета числовых характеристик, упоминавшихся в главе 1.

Выборочный коэффициент вариации V определяется отношени-

ем выборочного среднего квадратического отклонения к выборочной средней, выраженным в процентах:

V =

 

уВ

100%.

(2.11)

 

 

 

 

x

 

Коэффициент вариации –

безразмерная величина,

удобная для

сравнения величин рассеивания двух выборок, имеющих различные размерности.

Как отмечалось в параграфе 1.6, наиболее употребляемыми характеристиками связи двух СВ являются меры их линейной связи – ковариация и коэффициент корреляции. Их оценками являются выбо-

рочная ковариация Sxy и выборочный коэффициент корреляции rxy:

rxy =

=

 

 

 

 

Sxy =

1

n

 

= xy x y ,

 

 

 

 

 

 

(xi x)(yi y)

 

 

 

 

 

 

n i=1

 

 

 

 

 

Sxy

=

 

 

 

 

 

уВ (X) уВ (Y)

 

 

 

 

 

 

 

 

1 n

 

 

 

 

 

 

 

 

 

 

 

(xi

x)(yi y)

 

xy x y

 

 

 

 

 

 

 

1

 

n i=1

 

 

1

 

=

.

n

 

 

n

x2 x2 y2 y2

 

 

 

 

(xi x)2

 

(yi

y)2

 

 

 

 

 

 

n i=1

 

 

n i=1

 

 

 

(2.12)

(2.13)

= 1 n

Здесь xy xiyi . Следовательно, для нахождения выборочной

n i=1

ковариации и коэффициента корреляции необходимо иметь выборку объема n из двумерной генеральной совокупности (X, Y): (xi, yi),

n = 1, 2, …, n.

Таблица 2.3

xi

x1

x2

xn

 

 

 

 

 

yi

y1

y2

yn

 

 

 

 

 

54

Выборочные ковариация и коэффициент корреляции обладают теми же свойствами, что и их теоретические прототипы. В частности, нетрудно показать, что справедливы следующие свойства:

1.Если между СВ Χ и Υ существует положительная (отрицательная) линейная зависимость, то rxy > 0 (rxy < 0).

2.Выборочный коэффициент корреляции rxy является безразмерной величиной.

3.1 rxy 1.

4.Если между СВ Χ и Υ отсутствует линейная связь, то rxy = 0.

5.Чем ближе rxy по модулю к 1, тем сильнее линейная связь между Χ и Υ.

Замечание. Близкая к нулю величина коэффициента корреляции говорит об отсутствии линейной связи переменных, но не об отсутствии связи между ними вообще (рис. 2.4, в).

y

 

 

rxy > 0

y

 

 

rxy < 0

 

y

 

 

rxy = 0

 

 

 

 

 

 

 

· · .

 

 

·

· : .

 

 

 

 

• •

 

 

 

: N

 

 

 

:N

 

 

 

 

 

.

· M ·

 

 

 

. · ·

 

 

 

 

 

: N .

 

 

 

. Q N

 

 

 

 

 

 

0

 

 

 

x 0

 

 

 

x

0

 

 

 

x

 

a

 

 

б

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 2.4

 

 

 

 

 

 

Вопросы для самопроверки

1.Что такое генеральная совокупность и выборка?

2.Назовите основные виды выборок и способы отбора элементов в них.

3.Что такое статистический ряд? Что такое интервальный статистический ряд?

4.Дайте определение эмпирической функции распределения, приведите ее аналитическое и графическое представление.

5.Что такое полигон частот и гистограмма? Для чего они используются?

6.Как вычисляются основные числовые характеристики по результатам выборки: выборочные среднее, дисперсия, среднее квадратическое отклонение?

7.Как вычисляется и где применяется выборочный коэффициент вариации?

8.Приведите формулы определения выборочных ковариации и коэффициента корреляции.

9.Приведите основные свойства выборочного коэффициента корреляции.

55

Упражнения и задачи

1.Анализируются объемы ежедневных продаж некоторого товара за 60 дней. Получены следующие данные:

5, 6, 3, 2, 7, 7, 6, 6, 10, 11, 6, 4, 5, 6, 3, 12, 9, 10, 7, 4, 6, 7, 8, 8, 10, 5, 5, 4, 3, 6, 6, 7, 7, 8, 8, 10, 6, 4, 5, 6, 12, 7, 7, 8, 11, 9, 10, 5, 6, 4, 2, 7, 11, 8, 7, 9, 5, 6, 9, 5.

Необходимо:

а) построить статистический ряд; б) определить размах выборки;

в) построить эмпирическую функцию распределения и ее график; г) построить полигон относительных частот;

д) определить выборочные среднюю, дисперсию, среднее квадратическое отклонение.

2.Анализируется продолжительность телефонных разговоров с клиентами на некоторой справочной телефонной службе. Случайным образом отобраны 55 телефонных разговоров и зафиксированы их длительности (в секундах):

39, 60, 40, 52, 32, 68, 77, 61, 68, 60, 47, 49, 70, 55, 66, 80, 35, 67, 70, 55, 42, 52, 60, 82, 70, 55, 47, 39, 50, 58, 45, 50, 53, 33, 49, 54, 55, 70, 62, 60, 60, 40, 59, 64, 70, 55, 54, 35, 48, 52, 57, 55, 82, 70, 51, 35, 49, 60, 55, 47.

Необходимо:

а) вычислить выборочную среднюю, выборочную дисперсию, выборочное среднее квадратическое отклонение рассматриваемой величины; б) построить интервальный статистический ряд, включающий 5 подынтервалов (какой шаг h вы при этом выбрали и почему?);

в) построить гистограмму и по ее виду выдвинуть предположение о законе распределения рассматриваемой СВ; г) вычислить выборочные числовые характеристики рассматриваемой вели-

чины на основании построенного интервального статистического ряда; д) построить интервальный статистический ряд, включающий 7 подынтер-

валов и вычислить на его основании выборочные числовые характеристики рассматриваемой величины; г) сравнить результаты вычислений в пунктах а), г) и д); каковы ваши выводы?

3.По имеющейся эмпирической функции распределения F (x) построить статистический ряд и полигон частот, если объем выборки n = 100.

 

0,

х 10;

 

0.2, 10 < x 20;

F (x) =

0.5, 20 < x 30;

0.65,

30 < x 40;

 

0.9, 40 < x 50;

 

0.95, 50 < x 60;

 

1,

x > 60.

56

4.Анализируется размер дивидендов по акциям некоторой компании. Для этого отобраны данные за последние 20 лет:

5, 10, 7, -5, 3, 10, 15, 10, 5, -3, -5, 3, 7, 15, 10, 10, 0, -2, 5, 10.

а) Каков ожидаемый размер дивидендов?

б) Как можно оценить риск от вложений в данную компанию?

5. Анализируется прибыль (X) фирм в некоторой отрасли. Имеющиеся статистические данные по 100 фирмам представлены следующим интервальным статистическим рядом:

X %

[0, 5)

[5, 10)

[10, 15)

[15, 20)

[20, 25)

[25, 30)

 

 

 

 

 

 

 

ni

8

15

35

30

10

2

 

 

 

 

 

 

 

Необходимо:

а) оценить величину ожидаемой (средней) прибыли в отрасли; б) построить гистограмму и выдвинуть предположение о виде закона распределения СВ Х;

в) оценить величину относительного разброса прибылей в данной отрасли.

6.Цена некоторого товара в 20 магазинах была следующей:

50, 48, 47, 55, 50, 45, 50, 52, 48, 50, 52, 48, 50, 47, 50, 48, 52, 50, 50, 48.

На базе этих данных

а) построить статистический ряд; б) построить полигон относительных частот;

в) выдвинуть предположение о виде закона распределения СВ цены товара; г) оценить параметры предполагаемого закона распределения.

7.Данные наблюдений за СВ X и Y представлены следующими таблицами:

а)

Х

1 2 3 4

5

б)

Х

1 3 5 7 9

в)

Х

0 1

2

3

4

5

6

 

Y

0 2 3 5

6

 

Y

10 7 8 5 3

 

Y

9 4

1

0

1

4

9

Необходимо нанести точки наблюдений на декартову систему координат; вычислить ковариацию и коэффициент корреляции; сделать выводы о линейной зависимости между переменными (о силе и направлении).

8.В следующей таблице приведены данные за 10 лет (19811990) по количеству вновь регистрируемых фирм (Х) и по количеству банкротств (Y) в некотором государстве:

57

Год

Х

Y

Год

Х

Y

1981

72500

1020

1986

82500

3000

1982

72900

1290

1987

87000

4000

1983

74150

1830

1988

86500

4200

1984

73500

2250

1989

90000

4500

1985

78350

2500

1990

89000

4000

 

 

 

 

 

 

а) Каково ожидаемое количество вновь регистрируемых фирм в течение года для данного временного интервала; какова выборочная дисперсия и среднее квадратическое отклонение для этого показателя?

б) Каково ожидаемое количество банкротств в течение года для данного временного интервала; какова выборочная дисперсия и среднее квадратическое отклонение для этого показателя?

в) Вычислите ковариацию и коэффициент корреляции между Х и Y. Являются ли эти переменные независимыми?

г) Если Х и Y коррелированы, то можно ли утверждать, что один из этих показателей является “следствием” другого, т. е. изменение одного влечет изменение другого?

58