ТЕОРИЯ_СТАТИСТИКИ / Лекции / Лекция-3 и домашнее_задание / как делать_задание_домашка_по лекции3
.docСАМОСТОЯТЕЛЬНАЯ РАБОТА.
1.ПОСТРОЕНИЕ СТАТИСТИЧЕСКОГО РЯДА
В статистическом ряду весь диапазон изменения значений элементов выборки, называемый размахом варьирования, делится на несколько интервалов или классов. Всем элементам выборки, относящимся к конкретному классу, присваивается новое значение, равное середине этого класса. Статистический ряд представляет собой зависимость числа элементов выборки, попавших в тот или иной класс, от значения середины этого класса.
Порядок построения статистического ряда
1. Определяется размах варьирования случайной величины
,
где – левая граница размаха варьирования; – первый элемент вариационного ряда; – правая граница размаха варьирования; – старший (последний) элемент выборки.
2. Определяется число классов, на которое будет делиться размах варьирования
.
Здесь n – объем выборки. Полученное значение округляется до целого числа.
3. Определяется ширина одного класса: .
Значение ширины класса b должно быть удобным для построения графиков, то есть оно должно по возможности содержать минимальное количество значащих (отличных от нуля) разрядов. Это достигается путем подбора значений , и k.
4. Определяются левые и правые границы отдельных классов:
или
,
где - номер класса или группы .
5. Определяются значения случайной величины в середине каждого класса:
.
6. Определяется (абсолютная) частота попадания случайной величины в j-й класс. Для этого элементы вариационного ряда сравниваются с границами j-го класса. Если элемент вариационного ряда удовлетворяет условиям:
тогда его относят к j-му классу, то есть увеличивают на 1.1
7. Рассчитывается относительная частота попадания случайной величины в j-й класс.
Таблица 1. Табличное представление статистического ряда.
-
Номер
класса
j
1
2
k-1
k
Сумма:
8. Определяется величина накопленной относительной частоты попадания в j-й класс , равная сумме относительных частот попадания в классы, предшествующие j-му классу.
9. Статистический ряд представляется в табличной форме (см. табл. 1).
2.ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Иногда выборку достаточно описать числовыми характеристиками. Числовые характеристики, вычисляемые по вариационному ряду, называют простыми; те же характеристики, вычисляемые по статистическому ряду, называют взвешенными.
К числовым характеристикам относятся прежде всего начальные и центральные моменты.
Начальный момент l-го порядка дискретной случайной величины X представляет собой оценку математического ожидания значения .
Простой начальный момент l-го порядка:
.
Здесь n – объем выборки; – i-й элемент вариационного ряда .
Взвешенный начальный момент l-го порядка:
.
Здесь относительная частота попадания случайной величины в j-й класс или группу; k – количество классов статистического ряда.
Моменты , вычисленные по статистическому ряду, могут не совпадать с моментами, вычисленными по вариационному ряду той же выборки (почему?).
Одной из важнейших числовых характеристик является начальный момент первого порядка, который называют выборочным средним значением:
Простое выборочное среднее значение статистической величины:
.
Взвешенное выборочное среднее значение статистической величины:
.
Центральный момент l-го порядка дискретной случайной величины является оценкой математического ожидания значения .
Простой центральный момент l-го порядка:
.
Взвешенный центральный момент l-го порядка:
.
Другой важной числовой характеристикой выборки является выборочная дисперсия, представляющая собой второй центральный момент.
Простая выборочная дисперсия:
.
Взвешенная выборочная дисперсия:
.
Значение дает оценку генеральной дисперсии , умноженной на :
.
Другими словами, смещена относительно на величину.
Несмещенными оценками генеральной дисперсии являются простая и взвешенная несмещенные выборочные дисперсии:
и .
Здесь b ширина классов статистического ряда; поправка Шеппарда.
Квадратный корень из выборочной дисперсии называют выборочным средним квадратичным отклонением:
.
Задание на выполнение работы
Используя вариационный и статистический ряды, определить выборочные числовые характеристики: среднее значение, смещенную и несмещенную дисперсии, среднее квадратичное отклонение. Сравнить друг с другом значения числовых характеристик, вычисленные для вариационного и статистического рядов. Обратить внимание на разницу между смещенной и несмещенной дисперсией, между простыми и взвешенными характеристиками.
3. ГРАФИЧЕСКОЕ ИЗОБРАЖЕНИЕ СТАТИСТИЧЕСКОГО РЯДА
Графическое изображение дает наглядное представление о характере распределения статистического ряда. Графики позволяют довольно легко определять некоторые квантили статистической величины, например, моду и медиану.
Квантилем называют значение статистической величины, вероятность появления которой известна или задана. Мода - это наиболее вероятное значение статистической величины. Медиана - это значение статистической величины, делящее выборку на две равные части по количеству элементов.
Данное задание является продолжением задания № 2. Данные для построения графиков берутся из табл.1 (см. задание № 2).
Порядок выполнения задания
1. Статистический ряд представляется на графике (см. рис.1), на котором по оси абсцисс откладываются границы каждого класса и , а также середины классов . По оси ординат откладываются относительные частоты попадания в соответствующие классы . Горизонтальные линии, проходящие через в пределах данного класса, образуют ступенчатую фигуру, называемую гистограммой. Ломаная линия, соединяющая смежных классов, называется многоугольником или полигоном распределения.
2. По многоугольнику распределения оценивается наиболее вероятное значение - мода статистической величины. По гистограмме определяется наиболее вероятный интервал значений статистической величины - модальный интервал.
3. Строится кривая накопления или кумулята (см. рис. 2). Здесь ось абсцисс такая же, как и на предыдущем графике. По оси ординат откладывают значения накопленных относительных частот попадания .
Многоугольник Гистограмма
распределения
Модальный
интервал
х
0
Рис. 1. Гистограмма и многоугольник распределения
1
1/2
0 х
Рис. 2. Кривая накопления
4. Через середину оси ординат проводится горизонтальная линия до пересечения с кумулятой. Точка пересечения определяет медиану .
Прядок выполнения задания
1. Построить гистограмму и многоугольник распределения. Определить моду и модальный интервал.
2. Построить кумуляту. Определить медиану.
3. Сопоставить между собой значения медианы, моды и выборочных средних.
1 Начальные значения должны быть принятыми равными нулю.