§ 1. Основные понятия математической статистики

Глава 6. МАТЕМАТИЧЕСКАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ (введение в математическую статистику)

§ 1. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Численные методы, как правило, применяют при ма­­тематическом мо­де­ли­ровании процессов, которые име­ют место в самых различных областях зна­ний: фи­зи­ке, эко­но­ми­ке, психологии, геологии, медицине и др. Результаты мо­­де­ли­ро­вания при этом сравнивают с экс­пе­ри­мен­таль­ны­ми данными. По сте­пени их со­гла­со­ван­нос­ти делают за­клю­чение о соответствии или не­со­от­вет­­ствии выб­ранной ма­­тематической модели мо­де­ли­ру­е­мому процессу. Что­бы обо­с­но­ван­но делать это за­клю­че­ние, а также уметь из экс­пе­­ри­мен­таль­ных данных из­­­влечь необходимую ин­фор­ма­цию об объекте ис­сле­до­ва­­ния, экс­пе­ри­мен­та­тор должен вла­деть методами ста­ти­­стической, регрессионной и кор­ре­­ля­ци­он­­ной об­ра­бот­ки экспериментальных данных.

Статистические методы направлены в основном на установление зако­но­мер­ностей, которым подчиняются массовые случайные явления - некоторые реальные про­цессы, подвергающиеся случайным воздействиям. Слу­чайный эксперимент или опыт есть процесс, при ко­тором возможны различные исходы, так что заранее нель­зя пред­ска­зать, каков будет результат. Однако опыт ха­рак­те­ри­зу­ет­ся тем, что его можно повторить мно­го раз, меняя или нет условия эксперимента. Кроме то­го, полученные ре­зуль­таты можно обрабатывать раз­лич­ными способами, груп­пируя их так, как это не­об­хо­ди­мо для лучшего вы­яв­ле­ния закономерностей. Таким образом, в за­да­чи ма­те­ма­ти­чес­кой статистики входят:

1) указание способов сбора и группировки сведений, по­­лученных в ре­зуль­та­те наблюдений или как ре­зуль­тат не­которых экспериментов (измерений);

2) разработка методов анализа полученных экс­пе­ри­мен­таль­ных данных в за­ви­симости от целей ис­сле­до­ва­ний.

Напомним коротко некоторые понятия и опре­де­ле­ния.

Случайной величиной (элементом) назовем такую ве­ли­­чину, которая при­нимает в результате эксперимента од­­но и только одно возможное зна­че­ние из некоторой их со­­вокупности и неизвестно заранее, какое именно.

По результату отдельного эксперимента нельзя за­ра­нее ука­зать точное значение случайной ве­ли­чи­ны, но по со­во­куп­ности, полученной в эксперименте, можно изучать не­ко­то­рые за­ко­но­мер­ности ее поведения, т.е определять ве­ро­ят­ностные характеристики случайной ве­личины.

Под совокупностью будем понимать множество (ко­­нечное или бес­ко­неч­ное) элементов, рас­смат­ри­ва­е­мых как однотипные измерения, по­лу­чен­ные на объ­ек­тах за­дан­ного типа.

Под выборкой будем понимать подмножество эле­мен­тов, выбранных из не­которой совокупности.

Подмножество элементов, из которого про­из­во­дит­ся выборка, будем на­зывать генеральной совокупностью, а количество объектов (в генеральной со­во­куп­ности или в вы­бор­ке) - объемом совокупности.

Если из выборки заранее исключают элементы с за­­данными свой­ства­ми, то такую выборку будем на­зы­вать смещенной. Если отобранный из вы­бор­ки об­ъ­ект воз­вращается в генеральную совокупность перед вы­бо­ром оче­ред­ного объекта, то такую выборку будем на­зы­вать пов­торной, если же объект не возвращается, то бес­пов­тор­ной. Если по данной выборке можно уве­рен­но судит об изучаемом признаке генеральной со­во­куп­нос­ти, то та­кую вы­борку будем называть ре­пре­зен­та­тив­ной (пред­ста­вительной).

Параметрами будем называть статистические ха­рак­­теристики, оп­ре­деленные для совокупности, а если эти характеристики относятся к вы­бор­ке, то ста­тис­ти­ками. Заметим попутно, что статистики можно ис­поль­­­зовать для оценки параметров исходных со­во­куп­нос­тей, для проверки ги­потез и пр. Все эти признаки мож­но ус­ловно разделить на качественные и ко­ли­чес­твен­ные.

Случайные величины можно условно подразделить на дис­кретные и не­пре­рывные. В то время как первые при­нимают вполне определенные зна­че­ния х1, х2, ..., хк с вероятностями соответственно р1, р2, ..., рк, то вто­рые рас­пре­делены с некоторой плотностью по не­ко­то­ро­му отрезку прямой ОХ.

§ 2. МАТЕМАТИЧЕСКИЕ ОЦЕНКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ. ПРОВЕРКА ГИПОТЕЗЫ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

Пусть теперь из генеральной совокупности из­вле­че­на выборка, при­чем х1 на­блюдалось n1 раз, х2 - n2 раза, ..., хк - nк раз, тогда наблюдаемые зна­че­ния на­зо­вем вариантами, последовательность вариант, записанных в воз­рас­та­ю­щем порядке, вариационным рядом, ко­ли­чес­тво на­блюдений nк на­­зо­вем час­то­та­ми, а от­но­ше­ние час­тот к общему объ­е­му выборки ni/N = Wi - от­но­­си­тель­­ными частотами.

Если, например, задано распределение частот выборки объема N = 20:

хi

2

6

12

ni

3

10

7 ,

то тогда относительные частоты будут: W1 = 3/20 =0,15; W2 = 10/20 = 0,5; W3 = 7/20 = 0,35. Если эти числа сло­жить, то в результате получим единицу (0,15 + 0,5 + 0,35 = 1).

Наиболее используемая характеристика со­во­куп­нос­ти - это ее сред­нее зна­че­ние

, (6.1)

ко­то­рое оп­ре­деляется как сумма результатов на­блю­де­ний, деленная на их количество, т.е. это сред­­нее ариф­ме­ти­чес­кое, если экс­пе­ри­мен­таль­ные дан­ные счи­тать не­за­ви­си­мы­ми случайными собы­ти­я­ми. Если данные пред­ставлены за­ви­симыми событиями, то ма­те­ма­ти­чес­кое ожидание оп­ре­де­ляется из формулы

, (6.2)

где pi - вероятность появления i-го случайного со­бы­тия. Отметим, что при до­ста­точно большом чис­ле на­блю­дений N величина , вычисленная по формуле (6.1) или (6.2), стре­­­мится к истинному ма­те­­ма­­ти­­чес­ко­му ожиданию z, ко­то­рое так­же ха­рак­те­ри­зуется как слу­чай­ная ве­­ли­чи­на: , здесь рi - ве­роятность по­яв­ления слу­­чайного со­бытия xi . Чем боль­ше N, тем с боль­­шей на­­дежностью мож­но утверждать, что .

Очевидно, что ошибка равенства носит ве­ро­ят­нос­­тный ха­рак­тер и опи­сывается некоторым ин­тер­ва­лом

.

Этот интервал зависит от закона распределения слу­чай­ной ве­ли­чи­ны, ко­то­рый также является ее уни­вер­саль­ной характеристикой.

Функция распределения определяет для каждого зна­че­ния хi на чис­ло­вой оси вероятность того, что слу­чай­ная ве­личина X примет значение, мень­шее чем хi, т.е. F(хi) = =Р(X < хi ). Функция распределения F(хi) су­­щес­тву­ет для не­­пре­рыв­ных и дискретных величин. Она об­ла­да­ет сле­ду­ющими свой­ствами:

1) F(хi) - непрерывна; 2)

3) 4)Р(х1<Х<х2) = F(х1)- F(х2).

Можно также определить плотность рас­пре­де­ле­ния

,

ко­торая характеризует плотность распределения слу­чай­­­ной ве­ли­чи­ны в данной точке. Эта ха­рак­те­рис­ти­ка при­меняется в случае непрерывного распределения дан­ных.

Для наглядности строят различные фун­кции рас­пре­де­ления, в част­ности по­лигон и гистограмму. По­ли­го­ном час­тот назовем ломаную, от­резки ко­то­рой сое­ди­ня­ют точки (х1, n1), (х2, n2) ,..., (хк, nк), а если вме­с­то nк взяты Wк, то тог­да го­­­во­рят о по­ли­го­не от­но­си­­тель­ных час­тот. (рис. 6.1, дан­ные взя­ты из при­­­мера). В случае не­пре­­ры­в­­­но­го при­зна­ка стро­ят гис­­то­грам­му, для чего весь интервал на­блю­де­ний раз­­бивается на не­сколько час­­тич­ных под­ын­­тер­ва­лов ши­­ри­ной h и на­ходят для каж­­дого под­­­­ын­тер­ва­ла nк сум­му час­­тот ва­­ри­ант, по­пав­ших в дан­ный ин­тер­вал.

Гистограммой час­тот бу­дем назы­вать сту­пен­чатую фи­гу­ру, сос­то­я­щую из пря­мо­у­голь­ни­ков, ос­­но­ва­ни­я­ми ко­то­рых слу­жат час­тичные от­рез­ки дли­­­ной в h, а вы­­со­ты рав­ны от­но­шению nк/h, ко­то­­рое на­зы­вается плот­­­ностью час­­то­­ты.

На рис. 6.2 изо­бра­же­­на гисто­грам­ма час­­тот рас­пределения объ­ема 100 для при­ме­ра, при­ве­ден­ного в табл. 6.1. За­ме­тим попутно, что площадь гисто­граммы час­тот рав­на сумме всех час­тот, т.е. объему вы­бор­ки.

Таблица 6.1

Частичный интер­вал длиной h = 5

Сумма частот вариант

Плотность частоты

ni /h

5-10

4

0.8

10-15

6

1.2

15-20

16

3.2

20-25

36

7.2

25-30

24

4.8

30-35

10

2.0

35-40

4

0.8

Для построения гис­тог­рам­мы на оси 0x (абс­цисс) от­кладывают час­тич­­ные интервалы, а над ни­ми про­во­дят отрезки, па­раллельные оси 0x на рас­­сто­янии nк/h. Иными сло­вами строят пря­мо­у­голь­ники со сто­ро­на­ми xi, nк / h. Ес­ли по оси ординат от­кладывают от­но­си­тель­ные частоты, то тогда го­во­­рят о построении гис­то­грам­мы от­но­си­тель­ных частот.

Другой важной ха­рак­те­ристикой распределения яв­ля­ет­ся дисперсия - мера разброса отдельных значений от­но­си­тель­­но среднего значения. Квадратный корень из дис­пер­сии на­зывают стандартным отклонением. Эти величины обо­зна­ча­ют­­ся соответственно D и s.

Вычисляют эти характеристики по формулам:

.

112

Соседние файлы в папке GLAVA6_1