Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
тиун. рук-во.DOC
Скачиваний:
55
Добавлен:
11.04.2015
Размер:
2.02 Mб
Скачать

На практике для вычисления дисперсии применяется формула

ДВ = , (9.7)

где (среднее квадратов значений признака), а(средняя выборочная).

При вычислении и ДВ в случае интервальной выборки за хi в формулах (9.3) - (9.7) принимают значения хi * - середины интервалов.

Выборочным средним квадратическим отклонением (стандартом) В называется квадратный корень из выборочной дисперсии:

В = . (9.8)

Начальный эмпирический момент порядка k определяется по формуле

. (9.9)

Отсюда мы видим, что начальный эмпирический момент первого порядка (k=1) равен выборочной средней .

Центральный эмпирический момент mk порядка k определяется равенством

mk= . (9.10)

Отсюда видно, что m2В, т.е. центральный эмпирический момент второго порядка совпадает с выборочной дисперсией.

Равноотстоящими называют варианты, которые образуют арифметическую прогрессию с разностью h. Варианты Ui, определяемые равенством

Ui = ,

называются условными. Здесь хi – первоначальные равноотстоящие варианты, h – разность прогрессии (шаг), С – ложный нуль (новое начало отсчета). В качестве ложного нуля можно принять любую варианту. Обычно в качестве ложного нуля выбирают варианту с наибольшей частотой или варианту, стоящую в середине вариационного ряда. Условные варианты являются целыми числами. При этом варианте, которая принята в качестве ложного нуля, соответствует условная варианта, равная нулю.

Условные эмпирические моменты порядка k определяются по формуле

. (9.11)

Легко установить, что

= h + c, (9.12)

ДВ = []h2. (9.13)

Метод произведений есть некоторый удобный способ вычисления условных моментов различных порядков в случае равноотстоящих вариант. По условным моментам можно найти начальные и центральные эмпирические моменты. Вычислять условные моменты легко, так как условные вариантыUi есть целые числа. В частности, по формулам (9.12) и (9.13) можно вычислитьи ДВ. Максимальная простота вычислений достигается, если в качестве ложного нуля С выбрать варианту, которая расположена примерно в середине вариационного ряда.

Размахом варьирования Rназывают разность между наибольшей и наименьшей вариантами:

R=хmaxxmin. (9.14)

Размах есть самая простая характеристика рассеяния вариационного ряда. Еще одной характеристикой рассеяния служит среднее абсолютное отклонение , которое определяется равенством

= . (9.15)

Коэффициент вариации Vопределяется по формуле

V=. (9.16)

Он служит для сравнения величин рассеяния двух вариационных рядов. Большее рассеяние имеет тот ряд, у которого коэффициент вариации больше.

Важными числовыми характеристиками являются мода и медиана.

Для дискретного статистического ряда мода есть значение признака, имеющего наибольшую частоту.

Определим теперь моду интервального ряда в случае постоянной длины hвсех интервалов. Пусть (хk,хk+1) – модальный интервал, т.е. интервал, которому соответствует наибольшая частотаnk. Пустьnk-1 – частота интервала, предшествующего модальному, аnk+1 – частота интервала, следующего за модальным. Тогда мода М0вычисляется по формуле

М0=хk+h. (9.17)

Медианой Меназывается такое значение признака, относительно которого статистический ряд делится на две части, причем в одной из них содержатся члены, у которых значения не больше Ме, а в другой – члены со значениями не меньше чем Ме.

Пусть выборка дискретна и значения признака различны. Если число вариант четное (n=2k), то

Ме=. (9.18)

Если число вариант нечетное (n=2k+1), то

Ме=хk+1 . (9.19)

Пусть выборка дискретна и значения признака повторяются. Если объем статистической совокупности является нечетным числом, то в качестве медианы берут такое значение признака Х, для которого накопленная частота SH (сумма частот вариант, не превосходящих данного значения) равна SH = , где квадратные скобки показывают, что от числанужно взять только целую часть.

Если объем выборки является четным числом, то Меопределяется равенством

Ме=, (9.20)

где - первое значение признака, для которого накопленная частотане менееи- первое значение признака, для которого накопленная частотане менее.

Если статистический ряд задан интервалами, то медиану находят следующим образом. Выявляют первый интервал, для которого накопленная частота равна или больше половины объема статистической совокупности . Этот интервал называется медианным. Величину медианы определяют по формуле

Ме=, (9.21)

где хk- левая граница медианного интервала;Sk-1 – накопленная частота интервала, предшествующего медианному;nk– частота медианного интервала.

Асимметрия и эксцессэмпирического распределения определяются равенствами:

, (9.22)

, (9.23)

где m3,m4 – центральные эмпирические моменты, соответственно, третьего и четвертого порядка. Эти характеристики используют для оценки отклонения эмпирического распределения от нормального.

Р е ш е н и е т и п о в ы х з а д а ч

Задача 1. Выборка шарикоподшипников, изготовленных станком-автоматом, дала после измерения на весах следующие результаты в граммах: 39, 41, 40, 40, 43, 41, 44, 42, 41, 41, 43, 42, 39, 40, 42, 43, 41, 42, 41, 39, 42, 42, 41, 42, 40, 41, 43, 41, 39, 40. Составить статистическое распределение выборки. Построить полигоны частот и относительных частот.

Решение. Значения хi вариант выборки (вес шарикоподшипников) расположим в порядке возрастания в первой строке таблицы, а во второй строке – количество шарикоподшипников этого веса (частоты):

хi

39

40

41

42

43

44

ni

4

5

9

7

4

1

Получили дискретное статистическое распределение выборки объема n=ni = 4+5+9+7+4+1=30. Мода М0=41.

Построим полигон частот. Для этого откладываем по оси Ох значения хi вариант выборки, а по оси ординат – частоты ni. Полученные точки соединяем отрезками прямых. Это и будет полигон частот (см.рис. ниже).

ni

9

7

5

4

1

0 39 40 41 42 43 44 х

Полигон относительных частот строится аналогично полигону частот. На оси ординат вместо частот ni откладываем относительные частоты Wi. Полигон относительных частот изображен ниже на рисунке.

Wi

0 х

Задача 2. Составить статистическое распределение выборки – рабочих по процентам выполнения норм выработки, если произведена случайная выборка объема 20 человек и получены такие данные относительно выполнения ими норм выработки в процентах: 127, 121, 112, 114, 131, 117, 109, 107, 155, 135, 103, 145, 99, 100, 97, 102, 122, 115, 132, 105. Построить гистограммы частот и относительных частот.

Решение. Находим наибольшее и наименьшее значения варианты Х: хнаиб=155, хнаим=95. Разобьем здесь объем выборки на 7 промежутков длиной h=10. Частичные промежутки расположим в первой строке таблицы, а во второй – количество рабочих, чья выработка заключена в данном частичном промежутке. Получим следующее интервальное распределение:

Процент нормы выработки рабочих

90-100

100-110

110-120

120-130

130-140

140-150

150-160

Частоты (ni)

2

6

4

3

3

1

1

Построим гистограмму частот распределения. Для этого по оси Oх отложим промежутки распределения выборки и на них как на основаниях строим прямоугольники, высоты которых равны соответственно . Гистограмма частот изображена на рисунке ниже.

0 90 100 110 120 130 140 150 160 х

Нетрудно убедиться, что площадь построенных прямоугольников равна объему выборки:

Гистограмму относительных частот строим аналогично гистограмме частот. Только на оси ординат вместо откладываем значения, гдеWi – относительные частоты соответствующих частичных промежутков. Изображение гистограммы относительных частот см. на рисунке.

0 90 100 110 120 130 140 150 160 х

Сумма площадей построенных прямоугольников равна единице.

Задача 3. Данные о продаже женской обуви в магазине за день заданы таблицей

Размер обуви

35

36

37

38

39

40

Количество проданных пар

4

5

9

7

4

1

Найти эмпирическую функцию распределения выборки и построить ее график.

Решение. Эмпирическую функцию распределения выборки находим по формуле (9.1). Объем выборки равен 4+5+9+7+4+1=30. Наименьшая варианта равна 35. Значит, F*(х)=0 при х35. Значения Х<36, т.е. х1=35 наблюдались 4 раза. Следовательно, F*(х)=при 35< х  36. Значения Х<37 (х1=35, х2=36) наблюдались 4+5=9 раз. Следовательно, F*(х)=при 36< х  37. Аналогично находим: F*(х) = при 37< x  38; F*(х) = при 38< х  39; F*(х) = при 39< х  40. Так как х=40 – наибольшая варианта, то F*(х)=1 при х>40. Запишем эмпирическую функцию:

F*(х) =

График этой функции изображен на рисунке.

y

  1. х

Задача 4. Распределение урожайности сои на площади в 1000 га дано в таблице

Урожай с га в центнерах

9

9,6

10

10,5

11,4

12

Число га

80

100

120

160

200

340

Определить выборочную среднюю, выборочную дисперсию и выборочное среднее квадратическое отклонение урожайности сои.

Решение. Выборочная средняя урожайности с га вычисляется по формуле (9.4):

= (ц).

Для определения выборочной дисперсии воспользуемся формулой (9.6). Получим

ДВ =

+

Выборочное среднее квадратическое отклонение В находим по формуле (9.8): В =  1,02.

Задача 5. Вычислить выборочную среднюю, выборочную дисперсию, выборочное среднее квадратическое отклонение и коэффициент вариации для распределения заработной платы водителей автобазы (в руб. за месяц):

Зарплата (руб./месяц)

200-250

250-300

300-350

350-400

400-450

450-500

Количество водителей

10

30

20

20

10

10

Решение. Превратим данный интервальный ряд в дискретный, взяв в качестве вариант середины интервалов:

Зарплата (руб./месяц)

225

275

325

375

425

475

Количество водителей

10

30

20

20

10

10

По формуле (9.4) выборочной средней найдем, что

=

Вычислим выборочную дисперсию по формуле (9.7):

ДВ =

Извлекая корень квадратный из дисперсии, получим выборочное среднее квадратическое отклонение В = 73,5.

Коэффициент вариации заработной платы водителей автобазы вычислим по формуле (9.16):

V = .

Задача 6. Дано следующее статистическое распределение выборки:

хi

3

5

6

8

ni

2

4

3

5

Вычислить начальные и центральные моменты первого, второго и третьего порядка, размах варьирования и среднее абсолютное отклонение.

Решение. Используя формулу (9.9), находим начальные моменты:

Центральные моменты вычисляем по формуле (9.10):

m1=0, m2В=m3=

Используя формулы (9.14) и (9.15), получим

R=8-3=5, =

Задача 7. Магазин в течение месяца реализовал 100 мужских костюмов. Распределение их по размерам дано таблицей

Размер костюма

44

46

48

50

52

54

56

58

Количество костюмов

3

9

16

24

29

15

3

1

Найти модальное значение размера проданного костюма.

Решение. Из таблицы видно, что частота 52-го размера проданного костюма равна 29 и она является наибольшей. Следовательно, мода М0=52.

Задача 8. Товарооборот магазина по месяцам составил (в тыс. руб.): 50; 53; 60; 52; 54; 48; 44,5; 62; 55; 53,5; 58, 64. Определить медиану и размах товарооборота.

Решение. Расположив месячные товарообороты в порядке их возрастания, получим ряд: 44,5; 48; 50; 52; 53; 53,5; 54; 55; 58; 60; 62; 64. В этом вариационном ряде четное число данных и значения признака различны, поэтому по формуле (9.18)

Ме =