- •Введение
- •Глава 1. Случайная величина. Законы распределения случайных величин
- •1.1. Понятие случайной величины
- •1.1.1. Виды измерений
- •1.1.2. Единицы измерений, используемые в маркшейдерском деле
- •1.1.3. Случайная величина
- •1.1.4. Вероятность события
- •1.2. Вариационные ряды
- •1.3. Характеристики вариационных рядов
- •1.3.1. Средние значения признака
- •1.3.2. Дисперсия и среднее квадратическое отклонение
- •1.3.3. Показатели вариации
- •1.3.4. Медиана и мода
- •1.3.5. Асимметрия и эксцесс
- •1.3.6. Условные моменты q-го порядка
- •1.4. Графическое изображение вариационных рядов
- •1.4.1. Гистограмма распределения
- •1.4.2. Полигон распределения
- •1.4.3. Кумулята
- •1.4.4. Огива
- •1.5. Сглаживание эмпирических данных
- •1.5.1. Графическое сглаживание
- •1.5.2. Аналитическое сглаживание
- •1.5.2.1. Сглаживание линейной функцией
- •1.5.2.2. Сглаживание показательной функцией
- •1.5.2.3. Сглаживание степенной функцией
- •1.5.2.4. Сглаживание параболической функцией
- •1.5.2.5. Сопоставление результатов сглаживания
- •1.5.2.6. Краткие рекомендации к подбору сглаживающих функций
- •1.6. Законы распределения случайных величин
- •1.6.1. Задание закона распределения
- •1.6.2. Равномерное распределение
- •1.6.3. Нормальное распределение
- •1.6.4. Распределение Стьюдента
- •1.6.5. Распределение Шарлье
- •1.6.6. Биномиальный закон распределения
- •1.6.7. Распределение Пуассона
- •1.6.8. Распределение
- •1.6.9. Показательное распределение
- •1.7. Проверка согласования эмпирического распределения с теоретическим
- •1.7.1. Критерии согласия
- •1.7.2. Критерий согласия к.Пирсона
- •1.7.3. Критерий согласия в.И.Романовского
- •1.7.4. Критерий согласия а.Н.Колмогорова
- •1.7.5. Сопоставление эмпирических распределений с нормальным распределением упрощенными способами
- •1.7.5.1. Использование показателей асимметрии и эксцесса
- •1.7.5.2. Критерий Шарлье
- •1.7.5.3. Критерий Шовенэ
- •1.7.5.4. Способ Линдеберга
- •1.7.5.5. Критерий знаков
- •1.7.6. Сопоставление эффективности критериев
- •Глава 2. Статистический анализ выборочных совокупностей случайной величины
- •2.1. Понятие генеральной и выборочной совокупностей
- •2.2. Оценивание параметров распределения
- •2.2.1. Понятие оценки параметра распределения
- •2.2.2. Интервальная оценка математического ожидания
- •2.2.3. Оценка эмпирического значения дисперсии
- •2.2.4. Сравнение средних двух или нескольких выборок
- •2.2.5. Определение необходимого объема выборок
- •2.3. Дисперсионный анализ
- •2.3.1. Однофакторный дисперсионный анализ
- •2.3.2. Двухфакторный дисперсионный анализ
- •2.4. Корреляционный анализ
- •2.5. Регрессионный анализ
- •2.5.1. Метод наименьших квадратов
- •2.5.2. Линейная регрессия
- •2.5.3. Нелинейная регрессия
- •2.5.4. Понятие о множественной регрессии
- •Глава 3. Обработка результатов многократных измерений одной величины
- •3.1. Общие замечания
- •3.1.1. Задачи обработки результатов многократных измерений
- •3.1.2. Классификация погрешностей измерений
- •3.1.3. Свойства случайных погрешностей
- •3.1.4. Среднее арифметическое
- •3.2. Оценка точности ряда равноточных однородных измерений
- •3.2.1. Средняя квадратическая погрешность
- •3.2.2. Средние квадратические погрешности функций измеренных величин
- •3.2.3. Порядок обработки ряда равноточных измерений
- •3.2.4. Порядок обработки ряда двойных равноточных измерений
- •С учетом (3.26) и (3.27) получим
- •3.3. Об учете систематических погрешностей в измерениях
- •3.4. Обработка ряда неравноточных однородных измерений
- •3.4.1. Понятие о весе результата измерения
- •3.4.2. Погрешность единицы веса
- •3.4.3. Порядок обработки ряда неравноточных измерений
- •3.4.4. Порядок обработки ряда двойных неравноточных измерений
- •3.5. Допуски результатов измерений и их функций
- •Глава 4. Уравнивание геодезических построений
- •4.1. Задачи уравнительных вычислений
- •4.2. Коррелатный способ уравнивания
- •4.3. Параметрический способ уравнивания
- •4.4. Приемы решения систем линейных уравнений
- •4.4.1. Способ последовательной подстановки
- •4.4.2. Способ матричных преобразований
- •4.4.3. Решение систем линейных уравнений по алгоритму Гаусса
- •4.4.4. Способ краковянов
- •4.5. Геометрические условия в геодезических построениях
- •4.5.1. Условие фигуры
- •4.5.2. Условие горизонта
- •4.5.3. Условие суммы углов
- •4.5.4. Условие дирекционных углов
- •4.5.5. Условие сторон
- •4.5.6. Условие полюса
- •4.5.7. Условие координат
- •4.6. Примеры коррелатного способа уравнивания
- •4.6.1. Уравнивание углов в полигоне
- •4.6.2. Уравнивание системы нивелирных ходов с несколькими узловыми точками
- •4.6.3. Уравнивание полигонометрического хода
- •4.6.4. Уравнивание системы полигонометрических ходов с одной узловой точкой
- •4.6.5. Уравнивание системы полигонометрических ходов с двумя узловыми точками
- •4.6.6. Уравнивание триангуляции
- •4.6.7.Уравнивание триангуляции по условию координат
- •4.6.8. Уравнивание линейно-угловой сети
- •4.7. Примеры уравнивания параметрическим способом
- •4.7.1. Уравнивание углов в полигоне
- •4.7.2. Система нивелирных ходов с несколькими узловыми точками
- •4.7.3. Уравнивание полигонометрического хода
- •4.7.4. Система полигонометрических ходов с двумя узловыми точками
- •4.7.5. Уравнивание направлений в триангуляции
- •4.8. Нестрогие способы уравнивания
- •4.8.1. Примеры раздельного уравнивания
- •4.8.1.1. Полигонометрический ход
- •4.8.2. Способ эквивалентной замены
- •4.8.3. Способ полигонов в.В.Попова
- •4.8.4. Способ последовательных приближений
- •4.9. Оценка точности уравненных элементов и их функций
- •4.9.1. Общие положения
- •4.9.2. Оценка точности при уравнивании коррелатным способом
- •4.9.3. Оценка точности при уравнивании параметрическим способом
- •Списоклитературы
- •Предметный указатель
2.2.3. Оценка эмпирического значения дисперсии
Из теории математической статистики известно, что стандарт дисперсии, если случайная величина распределена по нормальному закону, определяется по приближенной формуле:
, (2.9)
где D = σ2 вычисляется с использованием формул (2.5) или (2.6) в зависимости от объема выборки.
При n < 20 используют случайную величину
, (2.10)
которая имеет χ2-распределение.
Преобразуем выражение (2.10) для D':
. (2.11)
В этом случае для построения доверительного интервала пользуются таблицей приложения 4.
Последовательность действий при построении доверительного интервала для дисперсии при n < 20:
- вычисляют значение уровня значимости α = (1 – β), где β – доверительная вероятность;
- из таблицы приложения --- выбирают значения χ12 и χ22, соответствующие вероятностям Р1 = α/2 и Р2 = 1 - α/2 и числу степеней свободы ν = (n – 1);
- вычисляют доверительные границы
и . (2.12)
Пример 2.3. Для доверительной вероятности 0,95 найти доверительный интервал для дисперсии D = 0,32 и стандарта σ = 0,57, полученных при обработке данных выборки объемом n = 14.
Для сопоставления использовать: а) нормальный закон распределения; б) χ2-распределение.
Решение.
Для нормального закона распределения для доверительной вероятности 0,95 (уровня значимости 0,05) и числа степеней свободы ν = 13 по таблице приложения 10 находим t = 2,16.
Значение стандарта дисперсии .
Отсюда следует, что доверительные границы для дисперсии , доверительные границы для стандарта .
Для χ2-распределения вычисляем вероятности Р1 = 0,05:2 = 0,025 и Р2 = 1 – 0,025 = =0,975.
По таблице приложения 4 для числа степеней свободы ν = 13 и полученных значений вероятностей 0,025 и 0,975 интерполированием находим: χ12 = 24,98 и χ22 = 4,95.
По формуле (2.12) вычисляем:
, ;
, .
Какие можно сделать выводы?
Во-первых, получены довольно существенные различия при использовании нормального закона распределения и при использовании χ2-распределения.
Во-вторых, доверительные интервалы во втором случае получились несимметричными в силу несимметричности χ2-распределения:
;
2.2.4. Сравнение средних двух или нескольких выборок
Часто приходится решать задачу сравнения средних нескольких, в частности, двух выборочных совокупностей. При этом решается вопрос о том, значимо или незначимо расхождение между полученными средними значениями (точечными оценками) при заданном уровне доверительной вероятности. Если расхождения значимы, то это говорит о неслучайных влияниях или условия проведения эксперимента либо о том, что исследуемые выборки могут принадлежать разням генеральным совокупностям. Если расхождения случайные, то принимают гипотезу о равенстве средних.
Указанная задача может быть решена как в случае известной дисперсии генеральной совокупности, так и в случае, когда дисперсия неизвестна или определено только приближенное ее значение.
Предположим, что у нас имеется несколько выборок большого объема Ni с известным математическим ожиданием Xi и стандартом Σi . Каждая из больших выборок подчиняется нормальному закону распределения. Из каждой из указанных больших выборок отобраны выборки объемами ni << Ni . Для каждой из полученных выборок определнны средние хoi и дисперсии Di (стандарты σi).
Предположим, что дисперсии генеральных совокупностей известны.
В этом случае для двух, например, любых выборок разности подчиняются нормальному закону распределения с математическим ожиданием
M(d) = k (2.13)
и дисперсией
. (2.14)
Нормированная разность
(2.15)
также подчиняется нормальному закону распределения с математическим ожиданием, равным нулю и дисперсией D(z) = 1.
Задаваясь вероятностью (где β – доверительная вероятность) по таблице приложения 11 находят статистику Z, а также значение z , для которых выполняется условие
, (2.16)
соответствующее принятию гипотезы о равенстве средних.
Пример 2.4. Выполнить попарное сравнение средних трех выборок (первую со второй и первую с третьей), представленных в табл. 2.2, по уровню доверительной вероятности 0,95.
Дисперсии генеральных совокупностей, из которых были отобраны выборки, соответственно равны σ12 = 21, σ22 = 15, σ32 = 19.
Таблица 2.2
К примеру 2.4 (исходные данные)
№№ |
ni |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
хoi |
1 |
17 |
131 |
127 |
125 |
120 |
133 |
130 |
128 |
127 |
136 |
132 |
129 |
132 |
119 |
121 |
136 |
125 |
133 |
128,5 |
2 |
14 |
132 |
126 |
134 |
128 |
129 |
135 |
124 |
122 |
129 |
125 |
127 |
124 |
122 |
122 |
|
|
|
127,1 |
3 |
12 |
131 |
136 |
129 |
123 |
135 |
130 |
132 |
131 |
134 |
129 |
128 |
137 |
|
|
|
|
|
131,3 |
Решение.
Результаты расчетов приведены в табл. 2.3.
Таблица 2.3
К примеру 2.4 (результаты расчетов)
z-тест для двух выборок |
Выборка 1 |
Выборка 2 |
Выборка 3 |
Средние (xoi) |
128,5 |
127,1 |
131,3 |
Дисперсия (σi2) |
21 |
15 |
19 |
Дисперсия разностей (D(d)) |
|
2,31 |
2,82 |
Объем выборки (ni) |
17 |
14 |
12 |
Гипотетическая разность средних |
|
k1-2 = 0 |
k1-3 = 0 |
Значение параметра z |
|
0,92 |
1,67 |
Вероятность условия (2.16) |
|
0,179 |
0,048 |
Критическое значение параметра z (zкр) |
|
1,65 |
1,65 |
Вычисляем по формуле (2.14) дисперсии разностей:
; .
Вычисляем значение параметра z:
; .
По таблице приложения 11 интерполированием для z1-2 = 0,92 и z1-3 = 1,67 находим соответствующие вероятности Р1-2 = 0,179 и Р1-3 = 0,048.
Критическое значение zкр = 1,65 находим по той же таблице по уровню значимости 0,05.
Выводы.
1. Поскольку z1-2 < zкр, то можно принять гипотезу о равенстве средних 1-й и 2-й выборок.
2. Для второй пары выборок (1-й и 3-й) значение z1-3 получилось немного больше критического значения. В этом случае с некоторым допущением и может быть принята гипотеза о равенстве средних 1-й и 3-й выборок, но целесообразно предварительно отвергнуть данную гипотезу и провести исследование данных выборок на их подобие другими способами.
В том случае, когда дисперсии генеральных совокупностей неизвестны, то в качестве выборочной оценки принимают оценку (2.14), т.е.
, (2.17)
значение статистики t (статистики Стьюдента) определяют по формуле (2.15)
(2.18)
с вычислением числа степеней свободы по формуле
. (2.19)
Число степеней свободы округляют до ближайшего целого числа.
Значения дисперсий в формуле (2.17) вычисляют по фактическим данным выборочных совокупностей.
Для вычислений используется таблица приложения 10.
Пример 2.5. Для выборок, приведенных в табл. 2.2 (пример 2.4), выполнить сравнение средних для доверительной вероятности 0,95, если дисперсии генеральных совокупностей неизвестны. Выполнить сравнение средних попарно выборок 1 и 2 и выборок 1 и 3, используя t-тест.
Решение.
Результаты вычислений представлены в табл. 2.4.
Таблица 2.4
К примеру 2.5
t-тест для двух выборок |
Выборка 1 |
Выборка 2 |
Выборка 3 |
Средние (xoi) |
128,5 |
127,1 |
131,3 |
Объем выборки (ni) |
17 |
14 |
12 |
Дисперсия (σi2) |
27,1 |
18,8 |
15,3 |
Дисперсия разностей (D(d)) |
|
2,94 |
2,87 |
Стандарты разностей σ(d) |
|
1,71 |
1,69 |
Гипотетическая разность средних |
|
k1-2 = 0 |
k1-3 = 0 |
Значение параметра t |
|
0,82 |
1,66 |
Число степеней свободы ν |
|
29 |
27 |
Критическое значение параметра t (tкр) |
|
2,054 |
2,052 |
По формуле (2.5) находим приближенные значения стандартов и соответствующих дисперсий: σ12 = 27,1 ; σ22 = 18,8 ; σ32 = 15,3 .
По формуле (2.17) находим значения дисперсий разностей для сравниваемых пар:
, ; , .
Вычисляем число степеней свободы для каждой из пар выборок по формуле (2.19):
; .
По таблице приложения 10 для уровня значимости 0,05 и полученным значениям степеней свободы интерполированием получаем критические значения параметра t: t1-2 = 2,054; t1-3 = 2,052.
Вывод. Поскольку значение параметра t для обеих пар выборок не превышают критического значения, то принимаем гипотезу о равенстве средних выборок 1 и 2 и выборок 1 и 3.