Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЧЕКАЛИН С.И. МЕТОДЫ ОБРАБОТКИ РЕЗУЛЬТАТОВ МАРКШ...doc
Скачиваний:
89
Добавлен:
20.08.2019
Размер:
14.29 Mб
Скачать

1.1.4. Вероятность события

Вероятность события характеризуется качественной мерой степени объективной возможности появления события при данном опыте. Для каждого из событий указанная качественная мера при многократных испытаниях проявляет устойчивость или ту или иную закономерность.

Предположим, что при n испытаниях какое-либо событие i появилось k раз. Относительная величина

(1.1)

характеризует относительную частоту (или частость) появления события i; при этом характеризует полную группу событий; k – частота появления события.

Параметр ri принимает значения от нуля до единицы:

. (1.2)

При неограниченном числе испытаний (на практике – понятие абстрактное) вероятность p определяется отношением числа Ki благоприятствующих элементарных исходов к общему числу N возможных элементарных исходов:

. (1.3)

Если вероятность какого-либо события близка к единице, то такое событие называют достоверным. Если же вероятность события близка к нулю, то такое событие называют невозможным. В пределе вероятность достоверного события

, (1.4)

а вероятность недостоверного (невозможного) события

. (1.5)

Вероятность, как и относительная частота, всегда положительное число:

0 < р < 1 , (1.6)

а вероятность любого события i удовлетворяет неравенству

, (1.7)

при этом сумма

. (1.8)

Далее условимся обозначать вероятность случайной величины прописными буквами Р(Х), Р(Y), Р(Z) и т.д., а вероятность отдельного измерения – строчными буквами: рi, p(x)i , p(y)i и т.п.

1.2. Вариационные ряды

Любой объект наблюдений характеризуется теми или иными качественными признаками. Например, месторождение полезного ископаемого характеризуется несколькими качественными признаками, в частности, распределением содержания по площади (объему), распределением мощности залежи, вертикального запаса и т.п. Количество полученных при измерениях показателей одного из признаков образует статистическую совокупность или статистический коллектив. Значения показателей х1 , х2 , … , хn называют вариантами, а все поле значений показателя – вариационным рядом. Число n всех элементов вариационного ряда называют объемом совокупности.

Поскольку каждый из элементов хi вариационного ряда имеет свою частоту ki появления (или относительную частоту ri), то расположив, например, значения хi в возрастающем порядке [xi ; ki] или [xi ; ri], получим т.н. упорядоченный вариационный ряд, характеризующий распределение признака.

Для исследования распределения признака упорядоченные вариационные ряды представляют в виде интервального ряда группировкой отдельных последовательных элементов в ограниченном интервале непрерывно по всему ряду. В этом случае элементом интервального вариационного ряда является среднее значение хОi признака в интервале с указанием частоты kOi (количества элементов в интервале) или с указанием относительной частоты (частости) rOi : [xOi ; kOi] или [xOi ; rOi]. Каждый из интервалов i называют классом.

Очевидно, что разбивка упорядоченного вариационного ряда на большое число классов (интервалов) может привести к потере информации о распределении признака, поскольку могут появиться «пустые» интервалы из-за ограниченного числа испытаний. При малом числе классов распределение признака может оказаться малоинформативным или недостаточным для установления вида распределения.

Оптимальное число классов, на которое разбивается тот или иной упорядоченный вариационный ряд, на практике определяется по нескольким соотношениям, в том числе и исходя из опыта исследователя. Часто число классов К определяется по формулам Стерджесса:

; , (1.9)

по формуле Хайнхольда и Гаеде

, (1.10)

по формуле Брукса и Каррузера

. (1.11)

На практике часто используют для оценки числа классов следующее выражение:

. (1.12)

После определения числа классов окончательное их число рекомендуют выбирать нечетным. Более это важно при небольших числах классов: 5 – 7.

Ширину классового интервала h вычисляют после оценки и назначения числа классов по формуле

, (1.13)

где хmax и хmin – соответственно максимальное и минимальное значения элементов упорядоченного вариационного ряда.

Часто, при весьма неравномерных распределениях, исследуют распределение вариационных рядов, составленных не фактическими значениями признака, а, например, логарифмами этих значений. В этом случае для определения ширины классового интервала также используется формула (1.13), но для максимального и минимального логарифмов значений признака. В таких случаях, в отличие от использования формулы (1.13), ширина классового интервала в фактических единицах получается различной в зависимости от величины признака: чем больше значение признака, тем шире классовый интервал в фактических его единицах измерения.

Рассмотрим пример разбивки вариационного ряда на классы с использованием приведенных формул.

Пример 1.1. На площади выполнена разведка месторождения полезного ископаемого буровым способом на содержание С(г/м3) полезного компонента по 80 разведочным скважинам (см. табл. 1.1). Максимальное значение содержания Сmax = 886 г/м3, минимальное значение содержания Сmin = 64 г/м3.

Определить и назначить число классов К и вычислить ширину h классового интервала.

Решение.

Найдем (оценим) число классов упорядоченного вариационного ряда:

- по формуле Стерджесса (1): К = 1 + 3,2 lg80 = 7,09;

- по формуле Стерджесса (2): К = 1 + log280 = 7,32;

- по формуле Хайнхольда и Гаеде: К = = 8,94;

- по формуле Брукса и Каррузера: К = 5lg80 = 9,52;

- по формуле (1.12): 0,55 · 800,4 = 3,17; 1,25 · 800,4 = 7,21; (от 4-х до 8-ми).

Как видим, в большинстве случаев получаются практически одинаковые рекомендации для данного объема совокупности (n = 80). Исключение, пожалуй, составляет использование формулы (1.12), по которой в среднем получается рекомендация по разбивке на 5 или 6 классов.

Построим упорядоченный вариационный ряд (табл. 1.2) и разобьем его на классы.

Для примера обработки вариационных рядов, с целью сопоставления различных вариантов разбивки, назначена разбивка приведенного вариационного ряда на 6, 7 и 8 классов, что отражено в табл. 1.2.

Таблица 1.1

Данные разведки на содержание

№№ разв.линий

№№ разв.свкажин

РЛ№1

РЛ№2

РЛ№3

РЛ№4

РЛ№5

РЛ№6

РЛ№7

РЛ№8

1

121

116

168

155

138

64

72

136

2

251

256

261

285

258

264

272

226

3

231

383

268

213

416

487

307

243

4

368

438

326

356

379

371

736

511

5

400

309

456

588

690

652

388

441

6

105

376

565

405

563

781

291

393

7

83

240

538

675

886

578

342

468

8

151

433

775

621

848

273

385

9

147

264

633

437

524

172

238

10

186

473

547

217

157

106

11

136

283

238

12

211

Число скважин

Всего n = 80

7

9

11

12

11

10

10

10

По формуле (1.13) найдем ширину классового интервала для каждой из разбивок с округлением до целой единицы:

h(6) = (886 – 64) : 6 = 137 г/м3;

h(7) = (886 – 64) : 6 = 117,43 = 117 г/м3;

h(8) = (886 – 64) : 6 = 102,75 = 103 г/м3.

Минимальную границу 1-го класса рекомендуют устанавливать по значению ( ) либо за минимальную границу 1-го класса принимать xmin.

Воспользуемся второй рекомендацией.

Для определения границ классовых интервалов необходимо выполнить вычисление в указанной последовательности:

;

; (1.14)

;

и т.д.

Средние значения для интервалов определяют по фомулам:

;

; (1.15)

и т.д.

Результаты вычислений представлены в табл. 1.2. Для каждого из классов указаны средние значения параметра в классе и частота, соотвествующая этому классу.

В табл. 1.3, 1.4 и 1.5 приведена выборка данных из табл. 1.2 с дополнительными данными по величинам относительных частот (частостей) r. В такой форме чаще всего и задают интервальные вариационные ряды.

В приведенных таблицах верхние границы интервалов определены последовательно с шагом h. Нижние границы интервалов на единицу меньше. В пределах значащей цифры в данном случае, при сравнительно больших значениях параметра, такое округление результатов допустимо.

Таблица 1.2

Разбивка на классы упорядоченного вариационного ряда

№№ п/п

Упорядоченный вариационный ряд, С (г/м3)

Разбивка на 6 классов

Упорядоченный вариационный ряд, С (г/м3)

Разбивка на 7 классов

Упорядоченный вариационный ряд, С (г/м3)

Разбивка на 8 классов

1

64

132

17

64

122

16

64

116

14

2

72

72

72

3

83

83

83

4

105

105

105

5

106

106

106

6

116

116

116

7

121

121

121

8

136

136

136

9

136

136

136

10

138

138

138

11

147

147

147

12

151

151

151

13

155

155

155

14

157

157

157

15

168

168

168

219

19

16

172

172

172

17

186

186

239

22

186

18

211

269

24

211

211

19

213

213

213

20

217

217

217

21

226

226

226

22

231

231

231

23

238

238

238

24

238

238

238

25

240

240

240

26

243

243

243

27

251

251

251

28

256

256

256

29

258

258

258

30

261

261

261

31

264

264

264

32

264

264

264

33

268

268

268

34

272

272

272

322

12

35

273

273

273

36

283

283

283

37

285

285

285

38

291

291

291

39

307

307

356

16

307

40

309

309

309

41

326

326

326

42

342

406

20

342

342

43

356

356

356

44

368

368

368

45

371

371

371

46

376

376

376

425

16

47

379

379

379

48

383

383

383

49

385

385

385

50

388

388

388

51

393

393

393

52

400

400

400

53

405

405

405

54

416

416

416

55

433

433

473

10

433

56

437

437

437

57

438

438

438

58

441

441

441

59

456

456

456

60

468

468

468

61

473

473

473

62

487

543

9

487

487

528

8

63

511

511

511

64

524

524

524

65

538

538

590

9

538

66

547

547

547

67

563

563

563

68

565

565

565

69

578

578

578

70

588

588

588

631

5

71

621

680

6

621

621

72

633

633

633

73

652

652

652

74

675

675

707

3

675

75

690

690

690

734

4

76

736

736

736

77

775

817

4

775

824

4

775

78

781

781

781

79

848

848

848

837

2

80

886

886

886

Примечание к табл. 1.2: в таблице для удобства выделены нечетные номера классов.

Таблица 1.3

Характеристика интервального ряда (К = 6 классов)

№№ интервалов

Интервал содержания в классе, С (г/м3)

Cреднее значение содержания в интервале, С (г/м3)

Количество элементов в интервале (частота), k

Относительная частота (частость), r

1

64 – 201

132

17

0,21

2

202 – 338

269

24

0,30

3

339 – 475

406

20

0,25

4

476 – 612

543

9

0,11

5

613 – 749

680

6

0,08

6

750 – 886

817

4

0,05

80

1,00

Таблица 1.4

Характеристика интервального ряда (К = 7 классов)

№№ интервалов

Интервал содержания в классе, С (г/м3)

Cреднее значение содержания в интервале, С (г/м3)

Количество элементов в интервале (частота), k

Относительная частота (частость), r

1

64 – 181

122

16

0,20

2

182 – 298

239

22

0,28

3

299 – 415

356

15

0,19

4

416 – 532

473

11

0,14

5

533 – 649

590

8

0,10

6

650 – 766

707

4

0,05

7

767 – 883

824

4

0,05

80

1,01

Примечание к табл. 1.4: в таблице сумма частостей не получилась равной единице из-за округлений.

Таблица 1.5

Характеристика интервального ряда (К = 8 классов)

№№ интервалов

Интервал содержания в классе, С (г/м3)

Cреднее значение содержания в интервале, С (г/м3)

Количество элементов в интервале (частота), k

Относительная частота (частость), r

1

64 – 167

116

14

0,18

2

168 – 270

219

19

0,24

3

271 – 373

322

12

0,15

4

374 – 476

425

16

0,20

5

477 – 579

528

8

0,10

6

580 – 682

631

5

0,06

7

683 – 785

734

4

0,05

8

786 - 888

837

2

0,02

80

1,00