Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методические указания по математической статист...doc
Скачиваний:
32
Добавлен:
05.05.2019
Размер:
1.45 Mб
Скачать

I. Выборочный метод. Вариационные ряды. Построение эмпирической функции распределения, гистограммы частот

Исходным материалом всякого статистического исследования является совокупность результатов наблюдения, представляющая собой первичный статистический материал.

Статистические данные – это сведения о том, какие значения принял интересующий исследователя признак в статистической совокупности.

Значения признака при переходе от одного элемента к другому изменяются (варьируют), поэтому в статистике различные значения признака называют вариантами, а совокупность значений признака, расположенных в порядке возрастания или убывания, - вариационным рядом.

Если значения признака выражаются числами, например, вес, масса, объем, заработная плата, производительность труда и др., то признак называется количественным.

Если же признак характеризует некоторое свойство или состояние элементов совокупности, например, профессия, квалификация и др., то признак называется качественным.

Если наблюдение организовано так, что исследованию подлежат все элементы совокупности (сплошное наблюдение), то в этом случае статистическую совокупность называют генеральной.

Если исследованию подлежит только часть элементов генеральной совокупности, то она называется выборочной совокупностью (выборкой).

Число объектов статистической совокупности называется ее объемом. Объем генеральной совокупности обозначается , а объем выборочной совокупности . По результатам изучения вариации признака в выборочной совокупности делают вывод об этом признаке во всей генеральной совокупности.

Пусть из генеральной совокупности извлечена выборка.

Обозначим изучаемый признак латинской буквой ,а его значения (варианты): , ,…, .

Числа, показывающие, сколько раз встречаются те или иные варианты в ряду, называются частотами и обозначаются , , …, , где - число различных вариантов в ряду.

Чаще для анализа удобнее пользоваться не абсолютными, а относительными значениями частот.

Относительной частотой или частостью называют отношение частоты того или иного варианта к объему выборки. Обозначаются относительные частоты ( - номер варианта).

(1)

Статистическим распределением выборки называют перечень вариантов и соответствующих им частот или относительных частот .

Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал). Такое распределение называется интервальным вариационным рядом.

Для построения интервального ряда необходимо определить величину частичных интервалов. Для более точного определения величины частичного интервала можно воспользоваться формулой Стерджеса:

, (2)

где - размах выборки, - объем выборки.

Размах выборки определяется по формуле

, (3)

- наименьшее значение случайной величины; - наибольшее.

За начало первого интервала рекомендуется брать величину

, (4)

конец последнего интервала должен удовлетворять условию:

(5)

Промежуточные интервалы получают, прибавляя к концу предыдущего интервала длину частичного интервала .

Для определения частоты для каждого интервала (сколько значений признака попало в каждый конкретный интервал) и построения гистограммы частот можно воспользоваться возможностями табличного процессора Excel (см. Пр.1).

Эмпирической функцией распределения (функцией распределения выборки) называют функцию , определяющую для каждого значения относительную частоту события .

Построение эмпирической функции распределения ( если имеется интервальный вариационный ряд) осуществляется следующим образом:

;

;

;

;

.

Соединяя точки , , получаем график эмпирической функции распределения .

При изучении вариационного ряда используются понятия накопленной частоты и накопленной относительной частоты.

Накопленная частота показывает, сколько наблюдалось вариантов со значением признака, меньшим (или равным) определенного данного значения . Накопленная частота для некоторого интервала находится суммированием частот всех предшествующих интервалов, включая данный. Аналогично находятся накопленные относительные частоты (см. Пр.1).

Пример 1. Имеется выборка объемом значений случайной величины (Таблица №1).

Таблица №1

0,243

0,281

0,331

0,267

0,245

0,287

0,344

0,281

0,247

0,302

0,304

0,310

0,244

0,316

0,321

0,322

0,260

0,327

0,332

0,337

0,239

0,225

0,352

0,362

0,245

0,228

0,375

0,384

0,256

0,231

0,260

0,307

0,288

0,299

0,272

0,318

0,304

0,313

0,287

0,331

0,313

0,382

0,308

0,368

0,325

0,398

0,321

0,383

0,343

0,417

0,348

0,322

0,377

0,267

0,262

0,333

0,390

0,275

0,370

0,346

0,340

0,390

0,361

0,278

0,362

0,405

0,376

0,288

0,382

0,424

0,333

0,351

0,385

0,269

0,242

0,364

0,400

0,281

0,350

0,380

0,340

0,289

0,316

0,356

0,360

0,296

0,322

0,239

0,373

0,305

0,283

0,324

0,254

0,343

0,297

0,340

0,365

0,360

0,306

0,353

Построить интервальный (вариационный) ряд распределения, гистограмму частот, эмпирическую функцию распределения.

Решение.

  1. Внесём данные таблицы в один столбец.

  2. Произведем сортировку имеющихся данных по возрастанию с помощью пункта меню Данные \ Сортировка. В открывшемся окне Сортировка диапазона выбрать Сортировать по возрастанию. В результате получим вариационный ряд.

  3. Запишем в отдельные ячейки (наименьшее значение случайной величины) и (наибольшее).

  4. Рассчитаем размах выборки (формула (3)) и длину интервала по формуле Стерджеса (формула (2)).

  1. За начало первого интервала примем величину: ; конец последнего интервала должен удовлетворять условию:

;

  1. Промежуточные интервалы рассчитаем, прибавляя к концу предыдущего интервала длину частичного интервала .

  2. Определим частоту для каждого интервала (сколько значений признака попало в каждый конкретный интервал). Для этого:

  1. запишем границы полученной последовательности интервалов в столбец;

  2. выберем в строке меню Сервис \ Анализ данных \ Гистограмма;

  3. в открывшемся окне зададим входные данные: входной интервал (вариационный ряд), интервал карманов (интервальный вариационный ряд). В группе Параметры вывода установим переключатель - выходной интервал (выделим свободный массив той же размерности что и интервальный вариационный ряд), установим флажок - вывод графика;

  4. нажмем кнопку ОK.

В результате на листе Excel рядом с интервальным вариационным рядом появятся два новых столбика: Карман и Частота, а также гистограмма частот.

  1. Для каждого интервала рассчитаем относительные частоты и накопленные относительные частоты.

  2. Построим эмпирическую функцию распределения. Для этого:

    1. выделим столбик накопленных относительных частот и выберем на панели инструментов Мастер диаграмм или Вставка \ Диаграмма.

    2. в открывшемся окне на вкладке Стандартные выберем - График и нажмем кнопку Далее.

    3. на вкладке Диапазон данных проверим, правильно ли указан диапазон (столбец накопленных относительных частот), и установим ряды – в столбцах.

    4. на вкладке Ряд введем:

      • Имя: Fэмп.;

      • Значения: диапазон данных;

      • Подписи по оси x: интервальный вариационный ряд.

      • Нажмем кнопку Далее.

        1. в открывшемся окне на вкладке Заголовки введем название диаграммы: Эмпирическая функция распределения.

Этапы решения задачи оформим в виде расчетных таблиц:

Таблица№2

100

0,22500

0,42400

(размах выборки)

0,19900

0,02603

0,01302

Таблица№3

Интервалы

Карман

Частота

Относительная частота

Накопленная относительная частота

0,21198

0,21198

0

0

0

0,23802

0,23802

3

0,03

0,03

0,26405

0,26405

13

0,13

0,16

0,29008

0,29008

15

0,15

0,31

0,31612

0,31612

15

0,15

0,46

0,34215

0,34215

18

0,18

0,64

0,36818

0,36818

18

0,18

0,82

0,39422

0,39422

13

0,13

0,95

0,42025

0,42025

4

0,04

0,99

0,44628

0,44628

1

0,01

1

 

 

=

100

 

 

Задача 1. При измерении диаметра валиков после шлифовки получены следующие результаты:

Таблица №4

6,75

6,77

6,77

6,73

6,76

6,74

6,70

6,75

6,70

6,72

6,72

6,70

6,72

6,77

6,75

6,73

6,71

6,70

6,79

6,76

6,77

6,68

6,74

6,70

6,70

6,74

6,77

6,83

6,76

6,76

6,77

6,75

6,73

6,75

6,77

6,72

6,75

6,79

6,75

6,80

6,78

6,78

6,76

6,77

6,75

6,74

6,77

6,73

6,74

6,74

6,76

6,75

6,74

6,75

6,74

6,76

6,74

6,72

6,80

6,76

6,76

6,77

6,75

6,78

6,72

6,76

6,78

6,68

6,75

6,72

6,71

6,82

6,77

6,80

6,80

6,70

6,70

6,82

6,72

6,69

6,72

6,76

6,78

6,78

6,72

6,76

6,80

6,76

6,72

6,76

6,77

6,75

6,70

6,81

6,74

6,73

6,74

6,74

6,78

6,69

Построить интервальный (вариационный) ряд распределения, гистограмму частот, эмпирическую функцию распределения.