Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

лекции(II курс)

.pdf
Скачиваний:
23
Добавлен:
16.03.2016
Размер:
742.74 Кб
Скачать

Поток Пальма еще называют потоком с ограниченным последствием.

Если промежутки времени T1, T2, . . . распределены по показательному закону, то поток

Пальма становится простейшим потоком.

Примером потока Пальма может служить движение колонны автомобилей. Пусть движется колонна автомобилей, каждый из которых, двигаясь с одинаковой скоростью, стремится держаться на заданном расстоянии от впереди идущего автомобиля. Однако, вследствие воздействия множества факторов, это расстояние выдерживается не точно.

Потоки Эрланга также являются потоками с ограниченным последствием. Они образуются просеиванием простейшего потока. Суть этого просеивания состоит в следующем. Если изобразить на временной оси простейший поток, поставив в соответствие каждому событию некоторую точку, и выбросить из потока каждую вторую точку, то получим поток Эрланга первого порядка. Оставив каждую третью точку и выбросив две проме-

жуточные, получаем поток Эрланга второго порядка и т.д.

Определение. Потоком Эрланга k - порядка называется поток, получаемый из простейшего, если сохранить в простейшем потоке каждую (k + 1)ю точку, а остальные

выбросить.

Очевидно, что простейший поток может рассматриваться как поток Эрланга нулевого порядка. Математическое ожидание, дисперсия и среднее квадратическое отклонение для распределения Эрланга находятся по формулам:

 

 

 

 

 

 

 

 

 

k + 1

 

k + 1

 

k + 1

a =

 

 

; D =

 

 

; σ =

 

 

.

λ

λ2

 

λ

Плотность потока Эрланга равна

λ

Λk = k + 1

Контрольные вопросы

1)Определение случайного процесса и его характеристики.

2)Основные понятия теории обслуживания.

3)Понятие марковского процесса.

4)Потоки событий.

61

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА. Тема 1. Вариационные ряды и их характеристики.

Основные понятия и задачи математической статистики. Выборки. Способы и цели образования выборок. Вариационные ряды. Характеристики вариационного ряда и их свойства. Ошибки выборочных наблюдений.

1.1. Генеральная и выборочная совокупности.

Задача любой науки состоит в исследовании закономерностей, которым подчинены

реальные процессы.

Математическая статистика раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов испытаний (измерений) с целью выявления статистических закономерностей.

Математическая статистика опирается на теорию вероятностей, но если теория вероятностей изучает абстрактные явления, то математическая статистика выявляет закономерности, которым подчинены реальные испытания.

На практике существует два способа измерений (наблюдений)

1)сплошное (т.е. исследуются все объекты);

2)выборочное (т.е. исследуется часть).

Выборочной совокупностью или просто выборкой называют совокупность слу-

чайно отобранных объектов.

Генеральной совокупностью называют совокупность объектов, из которых производится выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.

Например, если из 1000 деталей для обследования отобрано 100 деталей, то объем генеральной совокупности N = 1000, а объем выборки n = 100.

Способы образования выборок.

1)Механическая выборка отбор элементов в выборку из генеральной совокупности производится через определенный интервал.

2)Типическая выборка отбор элементов в выборку из генеральной совокупности производится по определенным типам.

3)Собственно случайная выборка отбор элементов в выборку производится слу- чайно. Собственно случайная выборка делится на:

- повторную, т.е. такая выборка при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность (по схеме возвращения шара).

- бесповторную, т.е. такая выборка при которой отобранный объект в генеральную совокупность не возвращается (по схеме невозвращения шара).

На практике обычно пользуются бесповторным случайным отбором.

1.2.Вариационные ряды.

Встречающиеся в практической деятельности показатели обычно неодинаковы у различных членов совокупности (производительность труда, рост, все з/п и др.).

Различные значения признака, наблюдающиеся у членов совокупности, называются

вариантами.

62

Число, показывающее, сколько раз встречается вариант в совокупности, называется

åãî частотой, а отношение частоты варианта к числу членов совокупности его относительной частотой nni (частостью) или долей или весом.

Определение. Вариационным рядом называется ранжированный в порядке возрастания или убывания ряд вариант с соответствующими им частотами (весами).

Все вариационные ряды делятся на два вида: дискретные и непрерывные.

Определение. Вариационный ряд называется дискретным , если значения при-

знака отличаются друг от друга не менее чем на некоторую постоянную величину. Определение. Вариационный ряд называется непрерывным, если значения при-

знака могут отличаться на сколь угодно малую величину.

Общий вид дискретного вариационного ряда имеет вид:

 

Варианты

 

Âåñà

 

 

 

 

(частоты или частости)

 

 

 

 

 

 

 

x1

 

n1

 

x2

 

n2

 

. . .

 

 

. . .

 

 

 

 

 

 

 

 

xm

 

nm

 

Итого

 

 

n

Например,

 

 

 

 

 

 

 

 

 

 

 

Оценка

Число

 

 

 

 

 

 

 

2

4

 

 

 

3

10

 

 

 

4

1

 

 

 

 

 

 

 

5

5

 

 

 

 

 

 

 

Всего

20

 

 

 

 

 

 

 

Общий вид непрерывного вариационного ряда имеет вид:

 

Варианты

 

Частоты

 

îò α2 äî α1

n1

 

îò α3 äî α2

n2

 

. . .

 

. . .

 

 

 

 

 

 

 

 

îò αm äî αm+1

nm

 

Итого

 

n

Например,

 

 

 

 

 

 

 

 

 

 

 

Интервал

 

Число

 

 

 

 

 

 

 

 

äî 50

 

3

 

 

 

 

 

 

 

 

îò 50 äî 55

 

4

 

 

 

 

 

 

 

 

îò 55 äî 65

 

7

 

 

 

âûøå 65

 

6

 

 

 

Итого

 

20

 

 

 

 

 

 

 

Определение. Разности α2 −α1, α3 −α2, . . . , αm+1 −αm называются интервальными

разностями.

Вариационные ряды с одинаковыми интервальными разностями наиболее простые. В случае незамкнутого вариационного ряда производят его "замыкание"по правилу: -интервальную разность у первого значения берут как у второго, а у последнего, как

у предпоследнего.

63

Для графического изображения вариационных рядов наиболее часто используются по-

лигон, гистограмма, кумулятивная кривая.

Определение. Полигон, как правило служит для изображения дискретного вариационного ряда и представляет собой ломанную, в которой концы отрезка прямой имеют координаты (xi, ni), i = 1, 2, . . . , m.

Ni

M2

6

M1

4

M4

3

M3

2

Xi

2

4

6

8

Гистограмма служит только для изображения интервальных вариационных рядов и представляется собой ступенчатую фигуру из прямоугольников с основаниями, равными интервалам значений признака ki = xi+1 − xi, i = 1, 2, . . . , m, и высотами, равны-

ми частотам (частостям) ni(ωi) интервалов. Если соединить середины верхних оснований прямоугольников отрезками прямой, то можно получить полигон того же распределения.

Ni

7

6

4

3

1

 

 

 

 

 

Xi

 

 

 

 

 

 

45

50

55

60

65

70

75

Кумулятивная кривая (кумулята) кривая накопленных частот (частостей).

Для дискретного ряда кумулята представляет ломанную, соединяющую точки (xi, níàêi .)

èëè (xi, ωiíàê.), i = 1, 2, . . . , m.

Для интервального вариационного ряда ломанная начинается с точки, абсцисса которой равна началу первого интервала, а ордината накопленной частоте (частости), равной нулю. Другие точки этой ломанной соответствуют концам интервалов.

Построим кумуляту, для предыдущего непрерывного распределения, для этого составим вспомогательную таблицу накопленных частот:

интервалы

45 50

50 55

55 60

60 65

65 70

70 75

níàê.

1

1 + 3 = 4

1 + 3 + 4 = 8

8 + 7 = 15

15 + 6 = 21

21 + 4 = 25

i

 

 

 

 

 

 

64

25

Ni

 

 

 

 

 

 

 

 

 

 

 

 

 

21

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

1

 

 

 

 

 

 

Xi

 

 

 

 

 

 

 

 

45

50

55

60

65

70

75

Весьма важным является понятие эмпирической функции распределения.

Определение. Эмпирической функцией распределения Fn(x) называется относительная частота (частость ) того, что признак (случайная величина X) примет зна- чение, меньшее заданного x, ò.å.

Fn(x) = ω(X < x) = ωíàê.

x

Другими словами, эмпирическая функция представляет собой накопленную частость

 

níàê.

ωíàê. =

x

.

 

x

n

 

Пример. Построить полигон (гистограмму), кумуляту и эмпирическую функцию распределения используя данные таблиц:

Оценка

Число

xi

ni

2

4

3

10

 

 

4

1

 

 

5

5

 

 

Всего

20

Âåñ

Число

αi; αi+1

ni

äî 50

3

îò 50 äî 55

4

 

 

îò 55 äî 60

7

 

 

âûøå 60

6

 

 

Всего

20

Для первого (дискретного) распределения:

Построим полигон, составим эмпирическую функцию распределения и построим ее

 

 

x< 2;

3;

00, 2, , 2 < x

 

 

 

 

 

 

 

 

 

 

 

0, 7,

 

 

F (x) =

3 < x 4;

 

0, 75,

4 < x

 

5;

 

 

 

 

 

 

 

 

 

 

1,

x > 5.

 

 

 

65

Ni

10

!оли%он

5

4

1

 

 

 

2

3

4

5

 

 

 

 

к(м(ля2а

 

1

 

 

 

 

0,75

 

 

 

 

0,7

 

 

 

 

 

 

 

'(нк*ия ,а.!,/0/л/ния

Xi

0,2

 

 

Xi

 

 

 

 

2

3

4

5

Для второго (непрерывного) распределения: Замкнем ряд

Âåñ

Число

αi − αi+1

ni

45 - 50

3

50 - 55

4

 

 

55 - 60

7

 

 

60 - 65

6

 

 

Всего

20

и построим гистограмму, чтобы построить функцию распределения, составим вспомогательную таблицу

ni

 

 

3

4

7

6

Fn(x) = ωíàê. =

níàê.

 

 

 

 

i

 

 

 

 

 

n

0,15

0,35

0,7

1

i

Заметим, что для интервального вариационного ряда имеем лишь значения функции распределения Fn(x) на концах интервала (см. последнюю строку таблицы). Поэтому

для графического изображения этой функции целесообразно ее доопределить, соединив точки графика, соответствующие концам интервалов, отрезками прямой. В результате полученная ломанная совпадет с кумулятой.

Ni

1

2и.&о2-амма

7 0,7

6

 

 

 

 

 

 

 

 

 

К"м"ля&а,

4

 

 

 

 

 

 

0,35

("нк+ия -а./-010л0ния

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

0,15

 

Xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

45 50 55 60 65

Xi

 

 

45 50 55 60 65

 

66

1.3. Характеристики вариационного ряда.

К ним относятся: 1)Средняя арифмитическая; 2)Дисперсия;

3)Среднее квадратическое отклонение; 4)Мода;

5)Медиана.

Определение. Средней арифмитической вариационного ряда называется сумма произведений всех вариант на соответствующие частоты, деленная на сумму частот:

 

 

 

m

xini

 

 

 

=1

 

 

 

 

x =

i n

 

 

 

,

 

 

ãäå xiварианты дискретного ряда или середины

 

 

 

 

m

 

 

 

 

 

интервалов интервального вариацион-

Определение. Дисперсией вариационного ряда

 

 

 

íîãî ðÿäà; niсоответствующие им частоты; n =

 

i=1 ni.

 

 

 

 

 

 

называется сумма произведений квад-

ратов отклонений вариант от средней на соответствующие частоты, деленная на

сумму частот.

im=1(xni − x)2ni

D =

Напомним, что σ = D.

Определение. Модой Mo вариационного ряда называется варианта, которой соот-

 

 

f

 

e

 

 

ветствует наибольшая частота.

 

Определение. Медианой

M

 

вариационного ряда называется значение признака, при-

Для дискретного

 

 

f

 

 

ходящееся на середину ранжированного ряда наблюдений.

 

вариационного ряда медиана равна

 

{

 

xm=2+1

m нечетное

 

 

xm=2 + x(m+1)=2

m число интервалов, четное

т.е. с нечетным f серединному интервалу, с четным полусумме двух серединных ва-

Me =

 

 

2

 

m

 

 

 

 

 

m

риантов.

Замечание 1. При вычислении характеристик непрерывного вариационного ряда переходят к соответствующему дискретному ряду (за варианту принимают середину соот-

ветствующего интервала).

Замечание 2. Все свойства x, σ2 аналогичны свойствам M(X) è D(X) случайной

величины.

 

 

 

 

 

 

 

 

 

Вычисление x è σ2

 

 

 

 

 

В чаcности σ2

= x2

 

(

x

)2, ãäå x2 =

xi2ni/n.

вариационного ряда можно упростить, если использовать не пер-

воначальные варианты xi, i = 1, 2, . . . , m, (в случае, если они очень велики) а новые

варианты

ui = xi k− c,

ãäå k è c специально подобранные постоянные, такие, чтобы вычисления максимально упрощались. Обычно, в качестве c выбирают то значение варианты, которая имеет наибольшую частоту, в качестве k−длину интервала (или наибольший общий делитель

разностей xi − c).

Тогда получим упрощенные формулы для вычисления x è σ2 имеют вид:

x = mi=1 uini k + c, n

67

 

2

 

m=1 ui2ni

 

2

 

 

2

 

 

 

 

 

 

σ

 

=

i

n

k

 

(x − c)

.

Пример. Обследование по схеме собственно случайной бесповторной выборки каче- ства нити на крепость дало следующие результаты:

крепость нитей в гр. (xi)

число нитей ni

< 47,5

2

47,5

- 52,5

7

52,5

- 57,5

20

 

 

 

57,5

- 62,5

45

 

 

 

62,5

- 67,5

21

 

 

 

 

 

5

67,5

- 72,5

100

Найти характеристики данного вариационного ряда.

Решение. Сначала замкнем данный ряд, приняв крайний интервал равным 42, 547, 5.

Далее перейдем от непрерывного к дискретному вариационному ряду, для этого найдем середины интервалов. Для расчета характеристик, составим вспомогательную таблицу, предварительно определив c è k; c = 60,(варианта с наибольшей частотой), k = 5длина

интервала.

 

 

 

 

 

 

 

 

 

 

 

 

xi−c

 

xi−c

 

xi−c

 

2

 

 

 

 

 

 

 

 

xi

 

 

ni

 

 

) ni

 

 

 

 

 

 

 

 

 

 

k

( k )ni

 

(

k

 

 

 

 

 

 

 

45

 

 

2

 

-3

 

 

-6

 

 

18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

50

 

 

7

 

-2

 

 

-14

 

 

28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

55

 

 

20

 

-1

 

 

-20

 

 

20

 

 

 

 

 

 

 

 

 

60

 

 

45

 

0

 

 

0

 

 

0

 

 

 

 

 

 

 

 

 

 

65

 

 

21

 

1

 

 

21

 

 

21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

70

 

 

5

 

2

 

 

10

 

 

20

 

 

 

 

Посчитаем

 

 

 

 

 

100

-

 

 

-9

 

 

107

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

характеристики:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

9

· 5 + 60 = 59, 55,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

σ2

=

107

 

· 25 (59, 55 60)2 = 26, 5475,

 

σ ≈ 5, 15.

 

 

 

 

 

 

100

 

 

 

 

M0 = 60 варианта, с наибольшей частотой.

 

 

 

x

+

x

(m+1)=2 + 1

 

x3 + x4

 

55 + 60

 

 

 

Me =fm=2

 

=

=

= 57, 5.

 

 

 

 

2

 

 

 

 

 

 

2

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

68

Тема 2. Основы математической теории выборочного метода. 2.1. Ошибки выборочных наблюдений.

Делятся на два класса:

1)Ошибки регистрации;

2)Ошибки репрезентативности (представительства).

Определение. Ошибки регистрации расхождение между истинным и зарегистрированным значениями варианты.

Могут быть:

систематическим;

случайными.

Возможны и при сплошном и при выборочном методе исследования.

Использование выборочного метода приводит к уменьшению ошибок регистрации, т.к. число изучаемых объектов сокращается, следовательно им уделяется большее внимание.

Определение. Ошибки репрезентативности наибольшее отклонение выбороч-

ной средней (или доли) от генеральной средней (или доли), которое возможно с заданной доверительной вероятностью γ.

Она возникает только вследствие того, что исследуется не вся совокупность, а лишь

ååчасть (выборка), отобранная случайно.

Эту ошибку не следует путать с систематической ошибкой репрезентативности, появля-

ющейся в результате нарушения принципа случайности при отборе элементов в выборку. Одна из главных задач математической статистики состоит в определении средней величины случайных ошибок репрезентативности и их возможных границ при различных

способах образования выборки.

Таким образом, неизвестные постоянные величины генеральную среднюю и генеральную долю оценивают с помощью случайных величин выборочной средней и выборочной

äîëè.

Определение. Оценкой называется общее правило, формула для получения прибли-

женного числа значений какого либо параметра по данным выборки.

Θ

случайной

 

e

X,

 

 

 

 

 

 

Оценкой

Θn параметра Θ называют всякую функцию результатов наблюдений над

 

величиной

 

с помощью которой судят о значении параметра :

 

 

 

 

Θ

= Θ

(X , X

, . . . , X

n

).

 

 

 

 

 

en

en

1 2

 

 

 

e

Поскольку X1, X2, . . . , Xn случайные величины, то и оценка Θn является случайной величиной, зависящей от закона распределения случайной величины X и числа n.

Если в качестве оценки выступает число (точка на координатной оси), то оценка называется точечной.

2.2. Методы нахождения оценок.

Перечислим основные методы нахождения оценок:

-метод моментов;

-метод максимального правдоподобия;

-метод наименьших квадратов.

Метод наименьших квадратов одни из наиболее простых приемов построения оценок. Суть его заключается в том, что оценка определяется из условия минимизации суммы квадратов отклонений выборочных данных от определяемой оценки.

69

Пример. Найти оценку метода наименьших квадратов e

Θn из условия минимизации

суммы:

n

e

u = (xi Θn) min .

i=1

Используя необходимое условие экстремума, приравняем нулю производную

откуда

e

n

i

 

e

 

du

 

 

n

 

 

 

 

 

dΘn

= 2 (xi Θn) = 0,

 

 

i

=1

 

 

 

 

è

 

 

e

 

 

 

 

 

 

=1

xi Θnn = 0

 

 

 

 

 

 

 

 

 

 

e

 

n

xi

 

 

 

 

 

=1

 

 

 

 

 

Θn =

in

 

= x,

т.е. искомая оценка генеральной средней, есть выборочная средняя x.

Метод наименьших квадратов получил широкое распространение в практике статистических исследований, т.к. во-первых, не требует знания закона распределения выборочных данных; во-вторых, достаточно хорошо разработан в плане вычислительной организации. Применяется в задачах корреляционного и регрессионного анализа.

2.3.Точечные оценки важнейших характеристик генеральной совокупности.

1)Точечной оценкой вероятности p события является относительная частота (частость)

ω= m/n, ãäå n число объектов.

2)Оценкой математического ожидания случайной величины X является выборочная

средняя x.

3)Оценкой дисперсии является выборочная дисперсия σ2 или исправленная выбороч- ная дисперсия σe2 = n/(n − 1)σ2.

4)Оценкой среднего квадратического отклонения σ является среднее квадратическое отклонение выборки σ.

2.4.Понятие доверительного интервала и доверительной вероятности.

Пусть из данной генеральной совокупности образована выборка и вычислены ее эмпирические и опытные числовые характеристики, которые считаются оценками этих же характеристик всей генеральной совокупности. Поскольку оценками являются числла, то это точечные оценки. Т.к. точечная оценка есть функция выборки, то она является случайной величиной и, следовательно, имеет какое-то распределение. Действительно, образованная новая выборка того же объема из той же генеральной совокупности имеет

иные значения характеристик.

e

Вывод. Принимая истинные значения параметра Θ за случайные значения Θ по вы-

борке мы допускаем какую-то ошибку.

Определение. Интервальной оценкой параметра Θ зназывается числовой интервал

e

e Θ

Θn(1)

, Θn(2), который с заданной вероятностью γ накрывает неизвестное значение пара-

метра .

70