- •Введение
- •Лабораторная работа № 1 Первичная обработка статистических данных
- •Основные теоретические сведения
- •1 Выборочный метод
- •2 Сгруппированный и интервальный статистические ряды
- •3 Эмпирическая функция распределения
- •4 Оценки числовых характеристик
- •Контрольные вопросы
- •2 Схема построения доверительных интервалов
- •3 Доверительные интервалы для математического ожидания и дисперсии случайной величины, имеющей нормальное распределение
- •Лабораторная работа № 3
- •2 Основные понятия статистической проверки гипотез
- •3 Применение критерия Пирсона 2 для проверки гипотезы о виде закона распределения случайной величины
- •4 Алгоритм применения критерия 2 для проверки гипотезы о виде закона распределения исследуемой случайной величины
- •2 Проверка гипотез о математическом ожидании случайной величины, имеющей нормальное распределение
- •3 Проверка гипотез равенства двух случайных величин, имеющих нормальное распределение
- •Лабораторная работа № 5 Построение регрессионной модели системы двух случайных величин
- •1 Введение
- •2 Регрессионный анализ
- •3 Метод наименьших квадратов
- •4 Пошаговый регрессионный анализ
- •5 Корреляционный анализ
- •6 Проверка значимости оценок коэффициентов корреляции и детерминации
- •Приложение а (справочное) Работа с пакетом statgraphics Plus for Windows
- •1 Запуск пакета statgraphics Plus
- •2 Создание файла выборок значений исследуемых величин
- •3 Использование существующего файла данных
- •4 Вычисление оценок числовых характеристик и построение гистограммы (столбцовой диаграммы) исследуемой случайной величины
- •5 Печать результатов статистического анализа
- •6 Определение доверительного интервала для математического ожидания и среднеквадратического отклонения случайной величины
- •7 Проверка гипотезы о значении математического ожидания случайной величины
- •8 Проверка гипотезы о значении математического ожидания случайной величины
- •9 Проверка непараметрической гипотезы о виде закона распределения исследуемой случайной величины
- •10 Построение диаграммы рассеяния
- •11 Регрессионный и корреляционный анализ
- •Приложение б (справочное) Критические точки распределения Стьюдента
- •Приложение в (справочное) Критические точки распределения 2
- •Приложение г (справочное) Таблица значений функции Лапласа
- •Приложение д (справочное) Критические точки распределения Фишера
- •Приложение ж (справочное) Критические точки стандартного нормального распределения
- •Приложение и (информационное) Рабочая программа по дисциплине «Теория вероятностей и математическая статистика»
- •1 Цели и задачи дисциплины, её место в учебном процессе
- •1.1 Цель преподавания дисциплины
- •1.2 Задачи изучения дисциплины
- •2.1.2 Одномерные случайные величины
- •2.1.3 Многомерные случайные величины
- •2.1.4 Основные понятия математической статистики
- •3 Учебно-методические материалы
- •Список принятых условных обозначений
- •Список литературы
- •Содержание
2 Сгруппированный и интервальный статистические ряды
Итак, пусть для исследования свойств случайной величины (с.в.) X получена выборка объема n {x1, x2,…, xn}.
Последовательность выборочных значений х1, х2,…, хn, записанных в порядке их появления, представляет собой исходный статистический материал и называется простым статистическим рядом.
Для компактного, удобного и наглядного представления имеющихся статистических данных необходимо произвести их первичную обработку.
Запишем все элементы выборки в порядке неубывания и обозначим члены такой последовательности , : , где
, .
Каждый элемент называется порядковой статистикой (вариантой), а последовательность
называется вариационным рядом, соответствующим имеющейся выборке.
Если изучается дискретная случайная величина, число возможных значений которой не велико (n < 10), то для каждого из отличающихся друг от друга наблюденных значений (обозначим их ) подсчитываются частоты mi и относительные частоты (частости) mi/n появления этих значений в выборке.
Результаты вычислений заносятся в таблицу 1, которая называется сгруппированным статистическим рядом.
Таблица 1 – Сгруппированный статистический ряд
Наблюденные значения |
|
|
… |
|
k n |
|
Частоты |
|
|
… |
|
|
|
Относительные частоты |
|
|
… |
|
|
Если изучается непрерывная случайная величина либо дискретная случайная величина, число возможных значений которой достаточно велико (n > 10), то диапазон [xmin(n); xmax(n)] всех наблюденных значений разбивается на k разрядов длины h, и подсчитываются числа выборочных данных, попавших в каждый из разрядов. Результаты расчетов заносятся в таблицу 2, которая называется интервальным статистическим рядом.
Таблица 2 – Интервальный статистический ряд
Границы интервалов |
|
|
… |
|
|
Среднее значение интервала |
|
|
… |
|
|
Частоты |
|
|
… |
|
|
Относительные частоты |
|
|
… |
|
|
Для определения границ интервалов можно воспользоваться следующей методикой:
1 Вычислить размах варьирования выборочных значений: R = xmax – xmin, где xmin и xmax соответственно минимальное и максимальное значения вариационного ряда.
2 Определить длину шага разбиения , где k – число разрядов разбиения. Для примерной ориентации в выборе значения k можно воспользоваться формулой Стерджесса: ( ), где n – объем выборки. Выбор количества разрядов существенно зависит от объема выборки n. При больших n величину R, полученную по формуле Стерджесса, следует воспринимать как оценку снизу для R (для упрощения последующих расчетов полученное значение h может быть округлено в бóльшую или меньшую сторону).
3 Определить границы интервалов разбиения: C1 = xmin – h/2, C2 = C1 + h, C3 = C2 + h, и т. д. Процесс разбиения продолжается до тех пор, пока максимальный элемент выборки не попадет в интервал. Среднее значение каждого частичного интервала можно определить как среднее арифметическое его границ.
Элементы выборки, попавшие на границы разрядов разбиения, могут быть приписаны к какому-то одному из этих интервалов (например, к правому, как это сделано в таблице 2), либо частоты этих значений могут быть разделены поровну между двумя соседними интервалами.
Для графического представления сгруппированного статистического ряда обычно используется столбцовая диаграмма (рисунок 1), которая представляет собой последовательность вертикальных отрезков длины mi / n, отложенных от оси абсцисс в точках с координатами .
Для графического изображения интервального статистического ряда чаще всего используется гистограмма относительных частот (рисунок 2). При построении гистограммы на оси абсцисс необходимо отложить границы интервалов выборочных значений [Ci,; Ci+1) ( ) и на каждом из этих интервалов, как на основании, построить прямоугольники, площади которых равны mi / n, тогда высоты прямоугольников равны mi/(nhi). Площадь всей гистограммы, очевидно, равна 1.
Рисунок 1 – Столбцовая диаграмма |
Рисунок 2 – Гистограмма относительных частот |