- •В.В. Нешитой
- •Методы статистического анализа
- •На базе
- •Обобщенных распределений
- •Предисловие
- •Введение
- •I. Случайные события и их вероятности
- •1.1. Случайные события. Испытания. Относительная частота и вероятность
- •1.2. Виды случайных событий
- •1.3. Определения вероятности
- •1.4. Основные формулы комбинаторики
- •II. Основные теоремы теории вероятностей
- •2.1. Теорема сложения вероятностей (несовместных событий)
- •2.2. Теорема умножения вероятностей (независимых событий)
- •2.3. Формула полной вероятности
- •2.4. Теорема гипотез (формула Бейеса)
- •III. Дискретные случайные величины
- •3.1. Закон распределения вероятностей дискретной случайной величины
- •3.2. Числовые характеристики дискретной случайной величины
- •3.2.1. Математическое ожидание
- •3.2.2. Свойства математического ожидания
- •3.2.3. Дисперсия дискретной случайной величины
- •3.2.4. Свойства дисперсии
- •3.2.5. Среднее квадратическое отклонение
- •3.2.6. Одинаково распределенные взаимно независимые случайные величины
- •3.2.7. Моменты (начальные, центральные) дискретной случайной величины
- •4.2. Плотность распределения
- •4.3. Числовые характеристики непрерывных случайных величин
- •4.4. Примеры непрерывных распределений
- •4.4.1. Нормальный закон
- •5.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения
- •5.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)
- •5.4. Метод моментов для точечной оценки параметров распределения
- •5.5. Метод наибольшего правдоподобия
- •VI. Обобщенные распределения. Системы непрерывных распределений
- •6.1. Методы построения обобщенных распределений
- •6.2. Построение системы непрерывных распределений методом обобщения
- •6.3. Классификация обобщенных распределений
- •Распределения группы а
- •Распределения группы б
- •Группа симметричных распределений
- •6.4. Распределения функций случайного аргумента
- •6.5. Три основные и три дополнительные системы непрерывных распределений в. Нешитого
- •VII. Оценивание параметров обобщенных распределений. Критерии для классификации кривых. Центральная предельная теорема
- •7.1. Метод наименьших квадратов
- •Значение функции распределения f(tc)
- •7.2. Метод наибольшего правдоподобия
- •7.3. Классический метод моментов
- •7.3.3. Симметричные распределения Ic-iiIc типов
- •7.3.4. Критерии для классификации кривых по методу моментов
- •7.4. Универсальный метод моментов
- •7.4.1. Законы распределения суммы независимых случайных величин
- •7.4.2. Центральная предельная теорема для трех систем непрерывных распределений
- •7.4.3. Законы распределения среднего выборочного
- •7.5. Общий устойчивый метод
- •VIII. Выравнивание и прогнозирование статистических распределений
- •8.1. Выбор системы непрерывных распределений для выравнивания статистических распределений
- •8.2. Построение выравнивающей кривой распределения по статистическим данным
- •8.2.1. Выравнивание по классическому методу моментов
- •8.2.2. Выравнивание по универсальному методу моментов
- •8.2.3. Выравнивание по общему устойчивому методу
- •8.2.4. Выравнивающее распределение суммы независимых случайных величин
- •8.2.5. Выравнивающее распределение среднего выборочного
- •8.3. Прогнозирование распределений
- •8.3.1. Первая система непрерывных распределений
- •8.3.2. Вторая система непрерывных распределений
- •Распределение населения страны по среднедушевому совокупному доходу, в % к итогу
- •8.3.3. Показатели стабильности и качества выборки
- •Iх. Статистический анализ точности и стабильности технологических процессов на базе обобщенных распределений
- •9.1. Показатели состояния технологического процесса
- •9.2. Пример статистической обработки результатов замера контролируемого параметра по программе
- •Контрольный листок Деталь №_____(название) ø50 мм ±0,012 Точность си 0,002 Дата________ Время_______
- •Отклонения от номинального размера детали «nn» ø50 ±0,012
- •Показатели статистического распределения ( )
- •9.3. Экономическая эффективность применения обобщенных распределений
- •9.4. Особенности применения статистических методов в области строительства
- •Х. Надежность как особый критерий качества
- •10.1. Некоторые показатели надежности для невосстанавливаемых объектов
- •Плотность распределения отказов
- •Интенсивность отказов
- •Гамма-процентный ресурс
- •10.2. Вычисление показателей надежности по обобщенным распределениям
- •Результаты наблюдений о наработке до отказа двигателей панелевозов (ti – пробег до отказа в тыс. Км.; mi – число панелевозов, имеющих наработку ti)
- •Показатели статистического распределения (snr2v97)
- •Логарифмическое распределение типа 1.1 с параметрами
- •XI. Временные (динамические) ряды
- •11.1. Методы выделения тренда
- •11.2. Построение кривых роста для выравнивания временных рядов
- •11.2.1. Построение кривых роста с заданными свойствами
- •11.2.2. Метод обобщения
- •11.2.3. Кривые роста на базе обобщенных распределений
- •11.3. Оценивание параметров кривых роста
- •11.3.1. Уравнение прямой
- •11.3.2. Экспонента
- •11.3.3. Обобщенная кривая роста
- •11.4. Прогнозирование временных рядов
- •11.4.1. Параметрический метод прогнозирования
- •11.4.2. Непараметрический метод прогнозирования
- •Заключение
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по методу моментов
- •Номограмма для установления типа выравнивающего распределения и нахождения оценок параметров k, u по общему устойчивому методу
- •Значения квантили в зависимости от уровня вероятности и числа степеней свободы r
- •Приложение 5
- •Литература
- •Содержание
8.3.2. Вторая система непрерывных распределений
Пусть распределение случайной величины Т задано обобщенной плотностью
с известными оценками параметров. Пусть далее известно, что все значения ti (i = 1,2,…, n) увеличатся в С раз.
Требуется найти распределение случайной величины Т*=ТС.
Поскольку t=t*/C, dt/dt*=1/C, то
(8.3.11)
или
. (8.3.12)
Введя обозначения
, (8.3.13) последнюю плотность перепишем в виде
. (8.3.14)
Увеличение случайной величины Т в С раз приводит к уменьшению параметра α и нормирующего множителя N. При этом плотность распределения р(t) уменьшается в С раз, а произведение tp(t), а также среднее значение остаются без изменения. Это значит, что форма кривой распределения а также характеризующие ее показатели не изменяются, при этом остается справедливой формула (8.3.7), т.е.
F(t*)=F(t).
Таким же путем найдем, что при увеличении в С раз случайной величины Y вторая и третья плотности второй системы непрерывных распределений примут вид
,(8.3.15) где
; (8.3.16)
, (8.3.17)
где
. (8.3.18)
Рассмотрим характерный пример. В табл. 8.3.1. приведены статистические данные о распределении населения СССР по среднедушевому совокупному доходу [1] за 1980, 1985 и 1988 г.
Таблица 8.3.1.
Распределение населения страны по среднедушевому совокупному доходу, в % к итогу
(Расчет по данным обследования 90 тыс. семейных бюджетов)
-
Интервал в руб.
Год
1980
1985
1988
До 50
50-75
75-100
100-125
125-150
150-175
175-200
200-250
>250
7,3
18,5
23,2
19,5
13,2
8,2
4,7
4,1
1,3
4,3
13,6
19,8
19,3
15,0
10,4
6,7
6,9
4,0
2,9
9,7
15,7
17,6
15,7
12,2
9,0
10,1
7,1
Итого
100%
100%
100%
Найдем выравнивающее распределение по статистическому интервальному ряду за 1980 г. По программе SNR2V97 имеем:
.
Выравнивающее распределение задается обобщенной плотностью
(8.3.19)
и относится к III типу. Оценки параметров и нормирующего множителя равны:
Рассчитаем по формуле (8.3.19) при известных оценках параметров значения плотности р(t) в серединах интервалов. Для того, чтобы сравнить выравнивающее и статистическое распределения, умножим значения плотности p(t) на ширину интервала (h = 25). Получим относительные частоты интервалов.
Результаты расчетов сведены в табл. 8.3.2, графы 1,2.
Таблица 8.3.2
Расчетные относительные частоты интервалов
Интервал в руб. |
Год |
||
1980 (выравнивание) |
1985 (прогноз) |
1988 (прогноз) |
|
0- 25 25- 50 50- 75 |
0,0019 0,0688 0,1871 |
0,0010 0,0418 0,1340 |
0,0006 0,0264 0,0959 |
75-100 100-125 125-150 |
0,2306 0,1948 0,1339 |
0,1952 0,1936 0,1544 |
0,1590 0,1789 0,1608 |
150-175 175-200 200-225 |
0,0816 0,0464 0,0254 |
0,1079 0,0695 0,0425 |
0,1257 0,0897 0,0602 |
225-250 250-275 275-300 300-325 |
0,0136 0,0072 0,0039 0,0021 |
0,0252 0,0146 0,0084 0,0049 |
0,0389 0,0245 0,0152 0,0093 |
Найдем далее по данным таблицы 8.3.1 средние значения логарифмов среднедушевого дохода за 1985 и 1988 гг. Они оказались равными соответственно 4,732163 и 4,850433, откуда находим, что среднедушевой доход в 1985 г. вырос в среднем в 1,145358 раза, а в 1988 г. – в 1,289216 раза по сравнению с 1980 годом.
Чтобы спрогнозировать распределение среднедушевого дохода населения на 1985 и 1988 г. по его распределению за 1980 г., достаточно вычислить новые значения нормирующего множителя N и произведения αu (см. формулы (8.3.13), где kβ = γ):
.
При С = 1,145358 они равны:
.
При С = 1,289216 они равны:
.
Оценки параметров β, γ, u – те же, что и в выравнивающем распределении дохода за 1980 г.
В табл. 8.3.2 приведены расчетные значения относительных частот интервалов (прогноз) на 1985 и 1988 г. (графы 3,4).
Ожидаемые распределения на 1985 и 1988 г. можно также получить с помощью Программы по статистическому распределению за 1980 г., если середину и ширину каждого интервала увеличить в С раз, оставив без изменения частоту (долю) интервала, что вытекает из формулы (8.3.11).
Из нее же следует, что на базе статистического интервального ряда распределения населения по среднедушевому совокупному доходу за 1980 г. (см. табл. 8.3.1) можно построить новый (ожидаемый) интервальный ряд распределения с учетом коэффициента роста С. Для этого достаточно увеличить в С раз границы, середину и ширину всех интервалов, оставив без изменения долю интервалов. Тогда значения эмпирической плотности в связи с ростом ширины интервалов уменьшатся в С раз.
Полученное распределение и будет ожидаемым на некоторый период упреждения r, когда среднедушевой совокупный доход вырастет в С раз по сравнению с 1980-м годом.
На рис. 8.3.1 (а, б, в) представлены гистограммы, построенные по статистическим данным, и непрерывные кривые при h=25 (на рис. а – выравнивающая кривая, полученная непосредственно по статистическому интервальному ряду за 1980 г.; на рис. б, в – прогнозируемые непрерывные кривые). Расчетные и статистические данные находятся в хорошем согласии между собой.
Чтобы оценить уровень жизни населения, необходимо сопоставить приведенные интервальные ряды распределения (эмпирические или расчетные) с минимальным потребительским бюджетом в одни и те же моменты времени.
Р ис. 8.3.1. Статистические (представлены гистограммами) и теоретические распределения среднедушевого дохода населения (на рис. а изображено выравнивающее непрерывное распределение; на рис. б, в – прогнозируемые распределения)
Знание закона распределения совокупного дохода позволяет также осуществлять различные расчеты, в том числе давать прогноз.
Выше отмечалось, что с ростом величины t в С раз ( ) функция распределения не изменяется, т.е. F(t*) = F(t).
Это дает возможность прогнозировать долю населения с заданным совокупным доходом, например, до одного минимального потребительского бюджета (МПБ), двух МПБ, S МПБ.
Пусть совокупный доход населения (СД) растет по показательному закону с темпом роста QСД в единицу времени r (год, месяц), а МПБ – с темпом роста QМПБ.
Пусть далее доля населения с совокупным доходом СД0 на момент времени τ0 равна F(τ0) = α.
Минимальный потребительский бюджет на тот же момент времени равен МПБ0.
Найдем период времени r, через который будет выполняться равенство
. (8.3.20)
Через r единиц времени S-кратный МПБ будет равен
, (8.3.21)
а совокупный доход равен
. (8.3.22)
Приравнивая два последних равенства, найдем
. (8.3.23)
Проанализируем полученную формулу.
Пусть темп роста совокупного дохода превышает темп роста минимального потребительского бюджета. Тогда знаменатель в формуле (8.3.23) будет больше нуля, а величина r будет равна периоду времени, через который доля населения α будет иметь совокупный доход, равный S-кратному минимальному потребительскому бюджету. При этом структура совокупности изменяется в лучшую сторону, т.е. уменьшается доля населения с низким совокупным доходом.
При равенстве темпов роста совокупного дохода и минимального потребительского бюджета величина r = ∞, т.е. структура совокупности не улучшается (не уменьшается доля населения с низким совокупным доходом).
Для стабильного улучшения распределения совокупного дохода необходимо, чтобы темп роста совокупного дохода (или темп прироста, т.е. темп роста, уменьшенный на единицу) постоянно опережал темп роста (или прироста) минимального потребительского бюджета.
Закон распределения совокупного дохода, а также заработной платы – это зеркало экономики.
В совокупности с законами роста минимального потребительского бюджета и среднемесячной заработной платы он представляет собой весьма чувствительный инструмент, позволяющий оценивать состояние на данный момент времени и прогнозировать различные экономические явления и процессы.