- •2. Базовые понятия статистики
- •2.1. Генеральная совокупность и выборка
- •2.2. Способы представления и обработки статистических данных
- •2.3. Вычисление выборочных характеристик
- •Вопросы для самопроверки
- •Упражнения и задачи
- •3. Статистические выводы: оценки и проверка гипотез
- •3.1. Точечные оценки и их свойства
- •3.2. Свойства выборочных оценок
- •3.3. Интервальные оценки
- •3.3.1. Доверительный интервал для математического ожидания нормальной св при известной дисперсии
- •3.3.2. Доверительный интервал для математического ожидания нормальной св при неизвестной дисперсии
- •3.3.3. Доверительный интервал для дисперсии нормальной св
- •3.4. Статистическая проверка гипотез
- •3.4.1. Основные понятия
- •3.4.2. Критерии проверки. Критическая область
- •3.5. Примеры проверки гипотез
- •3.5.1. Проверка гипотезы о математическом ожидании нормальной св при известной дисперсии
- •3.5.2.Проверка гипотезы о математическом ожидании нормальной св при неизвестной дисперсии.
- •3.5.3. Проверка гипотезы о величине дисперсии нормальной св
- •3.5.4Проверка гипотезы о равенстве математических ожиданий двух нормальных св при известных дисперсиях
- •3.5.5.Проверка гипотезы о равенстве математических ожиданий двух нормальных св при неизвестных дисперсиях
- •3.5.6. Проверка гипотезы о равенстве дисперсий двух нормальных св
- •3.5.7. Проверка гипотезы о значимости коэффициента корреляции
- •Вопросы для самопроверки
- •Упражнения и задачи
- •4. Парная линейная регрессия
- •4.1. Взаимосвязи экономических переменных
- •4.2. Суть регрессионного анализа
- •4.3. Парная линейная регрессия
- •4.4. Метод наименьших квадратов
- •Вопросы для самопроверки
2.2. Способы представления и обработки статистических данных
Во многих случаях для анализа тех либо других экономических процессов важен порядок получения статистических данных. Но при рассмотрении так называемых перекрестных данных порядок их получения не играет существенной роли. Кроме того, результаты выборочных значений x1, х2, хп количественного признака X генеральной совокупности, записанные в порядке их регистрации, обычно труднообозримы и неудобны для дальнейшего анализа. Задачей статистического описания выборки является получение такого ее представления, которое позволит наглядно выявить ее вероятностные характеристики. Для этого применяются различные формы упорядо-
чения данных в выборке - по возрастанию, по совпадающим значениям, по интервалам и т. п.
При анализе какого-то конкретного показателя Х в фиксированный момент времени (либо без учета фактора времени) наблюдаемые значения x1, x2,..., xn обычно упорядочивают по неубыванию: x1< x2 < < ... < xn . Разность между максимальным и минимальным значениями СВ Х называется размахом выборки..
Пусть количество различных значений в выборке равно k ( k < n ). Для определенности положим x < x < ... < x.. Значения xi, i = 1, 2, ... ,k называются вариантами.
Если значение xi встретилось в выборке ni раз, тогда число ni
называется частотой значения xi, а величина ωi = - относительной час-
тотой значения xi. Тогда наблюдаемые значения можно сгруппировать в статистический ряд (табл. 2.1):
Таблица 2.1
X |
… |
|
|
… |
|
|
… |
По статистическому ряду можно построить эмпирическую функцию распределения (x):
где – число значений случайной величины X, меньших, чем x; n – объем выборки.
По определению (x) обладает следующими свойствами :
0 ≤ (x) ≤ 1.
Для любых < ( ) ≤ ( ).
(x) = 0 при x ≤ ; (x) = 1 при x > ,
Эмпирическая функция распределения (x) является оценкой функции распределения F(x) = P (X < x), которая в этом случае называется теоретической функцией распределения.
Пример 2.1. Анализируется прибыль X(%) предприятий отрасли.
Обследованы n = 100 предприятий, данные по которым занесены в следующий статистический ряд.:
-
X
5 10 15 20 25
5 20 40 25 10
0,05 0,2 0,4 0,25 0,1
Необходимо построить эмпирическую функцию распределения
F (x)
(x) и ее график (рис. 2.1).
1
0, x≤5;0
0,90
,05, 5 < x ≤10;0
(x)
0,65
,25, 10 < x ≤ 10;0,65, 15 < x ≤ 20;
0
0,05
0,25
,90, 20 < x ≤ 25;1
0
x
5
10
15
20
25
x > 25.Рис. 2.1
Наглядно статистический ряд может быть представлен в виде полигона частот (рис. 2.2,а) или полигона относительных частот (рис. 2.1,б):
Таблица 2.2
[ , ) |
[ , ) |
[ , ) |
… |
[ , ) |
|
|
|
… |
|
|
|
|
… |
|
Интервальный статистический ряд наглядно может быть представлен в виде гистограммы – графика, в котором по оси абсцисс откладываются подынтервалы, на i-м из которых строится прямоугольник высотой . На основании гистограммы обычно выдвигают предположение о виде закона распределения исследуемой величины, что позволяет придать определенную направленность исследованиям.
Пример 2.2. Анализируется доход населения, для чего извлечена выборка объема n = 300. По уровню дохода население подразделяется на k = 6 групп. Полученные по выборке данные сгруппированный в следующий интервальный статистический ряд :
[ , ) |
[0,20) |
[20,40) |
[40,60) |
[60,80) |
[80,100) |
[100,120) |
|
10 |
50 |
80 |
100 |
40 |
20 |
|
1/30 |
5/30 |
8/30 |
10/30 |
4/30 |
2/30 |
Необходимо построить гистограмму и выдвинуть предположение о виде закона распределения СВ Х – дохода населения.
Отметим, что последнюю группу могут быть включены все субъекты, чей доход превышает 100. Однако для получения теоретических выводов последний подынтервал полагается той же длины h = 20, что и все предыдущие.
П
/(nh)
остроим гистограмму:
10/600
8/600
5/600
4/600
1/600
2/600
20
40
60
80
100
120
x
0
Рис. 2.3
Форма гистограммы (рис. 2.3) в наибольшей степени соответствует нормальному закону распределения. Поэтому естественным является предположение о нормальном распределении СВ Х : X ~ N (m,σ)). Следующим этапом исследования является определение параметров m и σ.