Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

task_74895

.pdf
Скачиваний:
452
Добавлен:
22.03.2016
Размер:
5.67 Mб
Скачать

В. И. Губин, В. Н. Осташков

Статистические методы обработки экспериментальных данных

Учебное пособие

Тюмень 2006

Тюмень 2007

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ НЕФТЕГАЗОВЫЙ УНИВЕРСИТЕТ»

В. И. Губин, В. Н. Осташков

Статистические методы обработки экспериментальных данных

Рекомендовано Министерством образования и науки

Российской Федерации в качестве учебного пособия для студентов высших учебных заведений, обучающихся по специальностям «Технология машиностроения»,

«Машины и аппараты химических производств»

Тюмень Издательство «ТюмГНГУ»

2007

УДК 519.22/23

В. И. Губин, В. Н. Осташков. Статистические методы обработки экспериментальных данных: Учеб. пособие для студентов технических вузов.— Тюмень: Изд-во «ТюмГНГУ», 2007.— 202 с.

Учебное пособие состоит из трех частей: теоретической, методиче- ской и практической. В первой части содержится теоретический материал справочного характера по разделу «Статистические методы обработки экспериментальных данных» курса математики. Во второй части приведе- ны образцы выполнения лабораторных работ по первичной обработке ре- зультатов экспериментальных данных из различных сфер производствен- ной деятельности, проверке статистических гипотез, построению однофак- торных и многофакторных моделей. Третья часть включает варианты зада- ний для выполнения шести лабораторных работ.

По содержанию данное пособие соответствует требованиям ГОС ВПО для специальностей технических вузов. Может быть использовано

преподавателями при организации и проведении лабораторных занятий по математической статистике во всех формах обучения.

Р е ц е н з е н т ы: В.Н. Кутрунов д.ф.-м.н., проф., зав. кафедрой ма- тематического моделирования Тюменского гос. ун-та; С.Г. Обухов д.ф.- м.н., проф., зав. кафедрой математики и информатики Тюменского гос. нефтегазового ун-та.

ISBN 978-5-88465-844-3

© В. И. Губин, 2007 © В. Н. Осташков, 2007

ПРЕДИСЛОВИЕ

Математическая статистика раздел математики, в котором изучаются математические методы сбора, обработки и использования ин- формации, полученной путем наблюдений массовых случайных явле- ний,— статистических данных для научных и практических выводов путем выявления существующих закономерностей.

Статистическими данными называется информация об объектах в какой-либо достаточно обширной совокупности, обладающий теми или иными признаками.

Считается, что математическая статистика это теория принятия решений в условиях неопределенности.

Математическая статистика, возникнув в XVIII веке, получила свое развитие в работах Б. Паскаля, П. Ферма, Я. Бернулли, П. Лапласа. В со- временном развитии определяющую роль сыграли труды К. Пирсона, К. Крамера, Р. Фишера, Ю. Неймана и др. Значимый вклад в математическую статистику внесли русские ученые П. Л. Чебышёв, A.M. Ляпунов, А. Н. Колмогоров, Б. В. Гнеденко и другие.

Для изучения случайных массовых явлений строятся математические модели в терминах и понятиях математической статистики, фундаментом которой является теория вероятностей, увенчанная п р е д е л ь н ы м и т е о р е м а м и . При этом теория вероятностей выводит из математической модели свойства, интерпретирующие реальный процесс, а математическая статистика устанавливает свойства математической модели, исходя из данных наблюдений (говорят: «из статистических данных»).

Предметом математической статистики является изучение сложных динамических систем путем объяснения (реальных наблюдений), управле- ния (заключающегося в выборе решения), предсказания (возможных аль- тернатив, катастроф). Математически это приводит к необходимости по- строения модели, позволяющей решить триединую задачу: упорядочить данные (полученные в результате наблюдения, сначала надо каким-либо образом обработать, представить в удобном для обозрения и анализа виде), оценить статистики (хотя бы приблизительно, интересующие нас характе- ристики наблюдаемой случайной величины; например, дать оценку неиз-

4

ПРЕДИСЛОВИЕ

вестной вероятности события, оценку неизвестной функции распределе- ния, оценку математического ожидания, оценку дисперсии, случайной ве- личины, оценку параметров распределения, вид которого неизвестен, и т. д.), проверить статистические гипотезы (т. е. решение вопроса согласова- ния результатов оценивания с опытными данными; например, выдвигается гипотеза, что наблюдаемая случайная величина подчиняется нормальному закону; математическое ожидание наблюдаемой случайной величины рав- но нулю; случайное событие обладает данной вероятностью и т.д.).

Настоящее учебное пособие возникло на основе чтения авторами раздела «Вероятность и статистика», предусмотренного ГОСом, и написа-

но в соответствии с государственным образовательным стандартом для студентов, обучающихся по специальностям 151001 — «Технология ма- шиностроения» и 240801 — «Машины и аппараты химических произ- водств».

Предлагаемое учебное пособие является руководством к лаборатор- ному практикуму по следующим разделам математической статистики:

построение вариационных рядов статистических распределений и расчет числовых характеристик;

построение эмпирических, теоретических кривых распределений и проверка согласованности эмпирического распределения с нор- мальным теоретическим в соответствии с критериями согласия;

построение математических моделей парных линейной и нели- нейной корреляций;

построение множественных линейных корреляционных моделей. Пособие составлялось с учетом реализации в учебном процессе меж-

предметных связей математики с инженерными дисциплинами; примене- ния математического моделирования для анализа производственных про- цессов и их прогнозирования; формирования знаний основных сведений

математической статистики и умение использовать статистические методы реальных процессов для решения инженерных задач различной степени сложности. Кроме того, в этом пособии учтены рекомендации, изложен- ные в документе «Стандарты и Процедуры аккредитации инженерных программ, разработанные в рамках проекта EUR — ACE», которые преду- сматривают двухуровневую подготовку специалистов, формирование у студентов знаний инженерных дисциплин, математики, навыков анализа производственных процессов, принятия оптимальных решений и способ- ности применения их в практической деятельности. Целью проекта EUR

— ACE является содействие созданию Европейской Зоны Высшего обра- зования (Болонский процесс), в котором участвует и Россия.

Указанное пособие может быть полезно студентам инженерно- технических и экономических специальностей высших учебных заведений, преподавателям, начинающим свою профессиональную деятельность, всем интересующимся рассматриваемыми вопросами математической статисти- ки.

ГЛАВА 1

ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ

§ 1. Первичная обработка результатов наблюдений

Информация о работе любой отрасли производственной сферы (до- быча нефти и газа, ремонт скважин, нефтехимическое производство, ма- шиностроение и т.д.) ставит перед ее руководством и наукой задачу: как, сведя к минимуму расходы по использованию природных, материальных и людских ресурсов, эффективно анализировать работу отрасли, управлять ею, прогнозировать развитие возможных сценариев поведения отрасли как сложной системы. Это означает, что математическому моделированию подлежит (дискретный, непрерывный, фрактальный) информационный по-

6 ГЛАВА 1. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ

ток статистическая совокупность в виде случайных событий и слу- чайных величин. Изучение подобного рода массовых явлений, выявление

их статических и динамических закономерностей становится предметом математической статистики. Среди полезной информации о статистиче-

ской совокупности особый интерес представляют статистические дан- ные, которые можно записать в виде ряда {x(1), x(2), …, x(n)} числовых зна-

чений интересующего нас признака (случайной величины Х). Обработку этого ряда производят посредством методов математической статистики; при этом точность статистических методов повышается с ростом n.

Пусть A некоторое множество (например, множество всех жите- лей данного города), B Ì A случайно выбранное подмножество (напри- мер, множество случайно выбранных жителей, при этом некий наблюда- тель измерил у них рост, скажем, в сантиметрах). Выборочным методом

называется метод исследования общих свойств множества А на основе изучения так называемых статистических свойств лишь множества В. Множество А называется генеральной совокупностью, а множество В выборочной совокупностью или выборкой. Число N = | A | элементов мно- жества А называется объемом генеральной совокупности, а число n = | B |

объемом выборки. При изучении некоторого признака Х (в нашем при- мере роста) выборки производят испытания или наблюдения (измере- ние роста).

Пусть в результате независимых испытаний, проведенных в одина- ковых условиях, получены числовые значения {x(1), x(2), …, x(n)}, где n

объем выборки.

При обработке статистических данных строятся статистики. Стати-

стикой называется функция

 

f

Rn ¾¾®R

 

 

(x(1), x(2), …, x(n)) = х

a f (x),

которая набору значений (x(1) , x(2) , ..., x(n) ) случайной величины ставит в

соответствие по некоторому правилу f действительное число. Статистика является числовой функцией на множестве реализаций случайной величи- ны.

Значения х(i) располагают в порядке возрастания:

x1, x2 , . . ., xn ( x1 < x2 < . . . < xn ).

Может оказаться, что некоторые варианты хi в выборке встречаются не- сколько раз.

Число ni, показывающее, сколько раз встречается варианта хi в выбо- рочной совокупности, называется ее частотой (эмпирической частотой).

§ 1. Первичная обработка результатов наблюдений

7

Частоты вариант называются их весами. Отношение wi = ni / n частоты ni к

объему n выборки называют относительной частотой (частостью) вари-

анты хi.

Вариационным рядом (или статистическим распределением) назы-

вается ранжированный в порядке возрастания или убывания ряд вариант с соответствующими им весами.

Различают дискретные и непрерывные вариационные ряды. Дис- кретный вариационный ряд записывают в виде табл. 1.

 

 

 

 

Т а б л и ц а 1

Варианты, xi

x1

x2

. . .

xk

Частоты, ni

n1

n2

. . .

nk

k

Здесь ni частота появления значения xi, причем åni = n .

i=1

Если объем n выборки большой (n > 30 ), то результаты наблюдений сводят в интервальный вариационный ряд, который формируется следую- щим образом.

Вычисляют размах R варьирования признака Х, как разность между наибольшим xmax и наименьшим xmin значениями признака:

R = xmax − xmin .

Размах R варьирования признака Х делится на k равных частей и таким об- разом определяется число столбцов (интервалов) в таблице. Число k час- тичных интервалов выбирают, пользуясь одним из следующих правил:

1) 6 ≤ k ≤ 20, 2) k ≈

n

,

3) k »1 + log2 n »1 + 3,221× lg n .

При небольшом объеме n выборки число k интервалов принимают равным от 6 до 10. Длина h каждого частичного интервала определяется по формуле: h = R / k.

Величину h обычно округляют до некоторого значения d. Например, если результаты xi признака Х целые числа, то h округляют до целого

значения, если xi содержат десятичные знаки, то h округляют до значения

d, содержащего такое же число десятичных знаков. Затем подсчитывается частота ni, с которой попадают значения xi признака Х в i-й интервал.

Значение xi , которое попадает на границу интервала, относят к какому- либо определенному концу, например, к левому. За начало x0 первого ин- тервала рекомендуется брать величину x0 = xmin - 0,5h . Конец xk послед- него интервала находят по формуле xk = xmax + 0,5h . Сформированный интервальный вариационный ряд записывают в виде табл. 2.

8 ГЛАВА 1. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ

 

 

 

 

 

 

Таблица 2

 

Варианты-интервалы,

( x0 ; x1 )

( x1 ; x2 )

. . .

 

( xk 1; xk )

 

 

( xi1 ; xi )

 

 

 

частоты, ni

n1

n2

. . .

 

nk

 

 

Интервальный вариационный ряд изображают в виде гистограммы

частот ni или гистограммы относительных частот wi = ni

/ n.

Гистограммой называется ступенчатая фигура, для построения ко- торой по оси абсцисс откладывают отрезки, изображающие частичные ин- тервалы ( xi1 ; xi ) варьирования признака Х, и на этих отрезках, как на ос-

нованиях, строят прямоугольники с высотами, равными частотам или час- тостям соответствующих интервалов.

Для расчета статистик (выборочной средней, выборочной диспер- сии, асимметрии и эксцесса) переходят от интервального вариационного ряда к дискретному. В качестве вариант xi этого ряда берут середины ин-

тервалов ( xi ; xi+1). Дискретный вариационный ряд записывается в виде табл. 3 или табл. 4.

 

 

 

 

 

 

 

 

Т а б л и ц а 3

 

Варианты, хi

х1

х2

. . .

 

 

хk

 

 

частоты, ni

n1

n2

. . .

 

 

nk

 

Здесь åni = n , где n объем выборки.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 4

Варианты, xi

 

x1

 

x2

 

. . .

 

 

xk

относительные час-

 

w1

 

w2

 

. . .

 

 

wk

тоты, wi = ni / n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

Здесь åwi =1.

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

Графически дискретный вариационный ряд изображают в виде поли- гона частот (соответственно в виде полигона относительных частот) сле- дующим образом. Сначала на числовой плоскости строят точки ( xi ; ni)

(точки ( xi ; wi)), где xi i-я варианта, число ni (число wi) называют час-

тотой (частостью). Затем строят ломаную, соединяющую построенные точки, которую и называют полигоном.

Вариационные ряды графически можно изобразить в виде кумуля-

тивной кривой (кривой сумм кумуляты). При построении кумуляты

дискретного вариационного ряда на оси абсцисс откладывают варианты xi , а по оси ординат соответствующие им накопленные частоты Wi . Со-

§ 1. Первичная обработка результатов наблюдений

9

единяя точки ( xi ; Wi ) отрезками, получаем ломаную, которую называют

кумулятой. Для получения накопленных частот и дальнейшего построения точек ( xi ; Wi ) составляется расчетная табл. 5.

 

 

 

 

 

Т а б л и ц а 5

Варианты, xi

 

x1

x2

. . .

xk

Относительные частоты,

w1

= n1 / n

w2 = n2 / n

. . .

wk = nk / n

wi = ni / n

 

 

 

 

 

Накопленные относительные

W1 = w1

W2 = W1 + w2

. . .

Wk = Wk – 1 + wk

частоты, Wi = Wi – 1 + wi

 

 

 

 

 

При построении кумуляты интервального вариационного ряда лево- му концу первого интервала сопоставляется частота, равная нулю, а пра- вому частота этого интервала. Правому концу второго интервала соот- ветствует накопленная частота первых двух интервалов, то есть сумма час- тот этих интервалов и т. д. Правая граница последнего интервала равна сумме всех частот, то есть объему n выборки.

Для характеристики свойств статистического распределения в мате- матической статистике вводится понятие эмпирической функции распре- деления.

Эмпирической функцией распределения или функцией распределения

называется функция Fв (x), определяемая равенством:

Fв (x) =

nx

,

(1)

 

 

n

 

где n объем выборки, nx число вариант xi , меньших х.

 

Эмпирическая функция Fв (x) служит для оценки

теоретической

функции распределения генеральной совокупности. Различие между ними состоит в том, что теоретическая функция F(x) определяет вероятность со- бытия X < x, а эмпирическая функция Fв (x) определяет относительную частоту этого события. Из теоремы Бернулли следует, что при больших n числа Fв (x) и F(x) мало отличаются одно от другого в том смысле, что

lim P [ | F(x) – Fв (x) | < ε] = 1 (ε > 0).

n→∞

Другими словами, при больших объемах выборки n, согласно закону больших чисел, функция Fв (x) сходится по вероятности к теоретической функции Fв (x) признака Х.

Аналогом этой функции в теории вероятностей является интеграль- ная функция распределения F (x). Функция Fв (x) отличается от функции F (x) тем, что вместо вероятности P( X < x ) берется накопленная частота

Wi = nnx . Значение функции Fв (x) равно числу nx принятых признаком Х вариант, меньших х, деленному на объем n выборки.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]