Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие по ТВ и МС

.pdf
Скачиваний:
58
Добавлен:
08.03.2016
Размер:
3.21 Mб
Скачать

Уральский социально-экономический институт Академии труда и социальных отношений

Кафедра высшей математики и информатики

А.Н. Тырсин Теория вероятностей и математическая

статистика

Учебное пособие

Рекомендовано Научно-методическим советом по математике Министерства образования РФ (Челябинское отделение) в качестве учебного пособия для студентов, обучающихся по специальности (направлению) Прикладная информатика (в экономике)

Челябинск

2004

ББК 22.17я73 Т 33

Тырсин А.Н. Теория вероятностей и математическая статистика:

Учебное пособие. – УрСЭИ АТиСО. – Челябинск, 2004. – 204 с.

В учебном пособии раскрыты основные разделы курса «Теория вероятностей и математическая статистика». Пособие предназначено для студентов дневного отделения специальности 351400 «Прикладная информатика (в экономике)».

ISBN 5-93441-058-X

Рецензенты

Ухоботов

В.И., доктор физ.-мат. наук,

 

профессор,

зав.

кафедрой

теории

 

управления и оптимизации ЧелГУ

 

 

Заляпин В.И., канд. физ.-мат. наук,

 

профессор

кафедры

математического

 

анализа ЮУрГУ

 

 

Геренштейн А.В., канд. физ.-мат. наук, доцент кафедры прикладной математики ЮУрГУ

Рекомендовано Научно-методическим советом по математике Министерства образования РФ (Челябинское отделение) в качестве учебного пособия для студентов, обучающихся по специальности (направлению) «Прикладная информатика (в экономике)» (протокол № 5 от 23.04.04.)

©Уральский социально-экономический институт Академии труда и социальных отношений, 2003

©Тырсин А.Н., 2003

2

Содержание

ПРЕДИСЛОВИЕ..........................................................................................................

7

РАЗДЕЛ 1. ТЕОРИЯ ВЕРОЯТНОСТЕЙ..................................................................

8

ГЛАВА 1. СОБЫТИЯ И ИХ ВЕРОЯТНОСТИ....................................................................

9

1.1. Определение понятия «вероятность»..........................................................

9

1.2. Конечное вероятностное пространство ......................................................

9

1.3. Понятие события.........................................................................................

11

1.4. Операции над событиями...........................................................................

12

1.5. Простейшие свойства вероятностей..........................................................

13

1.6. Классическое определение вероятностей.................................................

15

1.7. Геометрическая вероятность......................................................................

15

1.8. Условные вероятности................................................................................

19

1.9. Формула полной вероятности и формула Байеса....................................

21

1.10. Независимость событий............................................................................

22

1.11. Статистическая независимость................................................................

23

ГЛАВА 2. ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ РАСПРЕДЕЛЕНИЯ ................

25

2.1. Счетное вероятностное пространство.......................................................

25

2.2. Дискретные случайные величины.............................................................

25

2.3. Схема Бернулли...........................................................................................

26

2.3.1. Распределение числа успехов в n испытаниях ..................................

26

2.3.2. Наиболее вероятное число успехов....................................................

27

2.3.3. Номер первого успешного испытания................................................

29

2.4. Математическое ожидание.........................................................................

30

2.5. Общие свойства математического ожидания...........................................

31

2.6. Дисперсия случайной величины................................................................

32

2.7. Общие свойства дисперсии........................................................................

33

2.8. Индикаторы событий..................................................................................

33

2.9. Независимость случайных величин ..........................................................

35

2.10. Некоррелированность случайных величин ............................................

36

2.11. Предельные теоремы для схемы Бернулли............................................

38

2.11.1. Пуассоновское приближение.............................................................

39

2.11.2. Нормальное приближение .................................................................

40

2.11.3. О применимости предельных теорем в схеме Бернулли................

42

2.12. Неравенства Чебышева.............................................................................

43

2.13. Теорема Чебышева....................................................................................

44

ГЛАВА 3. ОБЩИЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ..............................................................

46

3.1. Общее определение вероятностного пространства.................................

46

3.2. Случайные величины (общий случай) ......................................................

47

3.3. Функция распределения случайной величины ........................................

48

3.4. Непрерывные случайные величины..........................................................

49

3.4.1. Понятие непрерывной случайной величины.....................................

49

3.4.2. Примеры абсолютно непрерывных распределений..........................

51

3

3.5. Числовые характеристики абсолютно непрерывной случайной

 

величины .............................................................................................................

54

3.6. Нормальное распределение........................................................................

58

ГЛАВА 4. СОВМЕСТНОЕ РАСПРЕДЕЛЕНИЕ ОБЩИХ СЛУЧАЙНЫХ ВЕЛИЧИН..............

60

4.1. Совместная функция распределения, плотность.....................................

60

4.2. Математическое ожидание функции от случайных величин.................

62

4.3. Независимость случайных величин ..........................................................

63

4.4. О некоррелированных зависимых случайных величинах ......................

64

4.5. Преобразования случайных величин ........................................................

65

4.5.1. Преобразования одной случайной величины ....................................

65

4.5.2. Формула свертки. Композиция законов распределений ..................

67

4.6. Многомерное нормальное распределение................................................

72

ГЛАВА 5. ПРЕДЕЛЬНЫЕ ЗАКОНЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ.......................................

75

5.1. Закон больших чисел..................................................................................

75

5.2. Центральная предельная теорема..............................................................

76

РАЗДЕЛ 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА.............................................

78

ГЛАВА 6. ВАРИАЦИОННЫЕ РЯДЫ И ИХ ХАРАКТЕРИСТИКИ ......................................

80

6.1. Вариационные ряды и их графическое изображение..............................

80

6.2. Средние величины.......................................................................................

83

6.3. Показатели вариации..................................................................................

85

6.4. Начальные и центральные моменты вариационного ряда......................

87

ГЛАВА 7. ОСНОВЫ ВЫБОРОЧНОГО МЕТОДА.............................................................

89

7.1. Общие сведения о выборочном методе....................................................

89

7.2. Понятие оценки параметров.......................................................................

90

7.2.1. Среднее арифметическое выборочных значений как оценка

 

математического ожидания............................................................................

92

7.2.2. Свойства оценки дисперсии ................................................................

94

7.2.3. Сравнение оценок.................................................................................

96

7.3. Оценка функций распределения и плотности..........................................

96

ГЛАВА 8. ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ...

99

8.1. Методы построения точечных оценок......................................................

99

8.1.1. Метод моментов....................................................................................

99

8.1.2. Метод максимального правдоподобия.............................................

102

8.1.3. Метод наименьших квадратов...........................................................

106

8.2. Определение эффективных оценок с помощью неравенства Рао-

 

Крамера-Фреше ................................................................................................

108

8.3.Интервальные оценки числовых характеристик случайных величин. 110

8.3.1.Доверительный интервал для математического ожидания

нормального распределения при известной дисперсии............................

111

8.3.2. Доверительный интервал для математического ожидания

 

нормального распределения при неизвестной дисперсии........................

113

8.3.3. Доверительный интервал для дисперсии нормального

 

распределения ...............................................................................................

114

ГЛАВА 9. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ .................................................

116

4

9.1. Статистическая гипотеза и общая схема ее проверки...........................

116

9.2. Критерии согласия ....................................................................................

120

9.2.1. Критерий согласия χ2Пирсона ........................................................

120

9.2.2. Критерий согласия КолмогороваСмирнова...................................

124

9.3. Критерии однородности...........................................................................

126

9.3.1. Критерий однородности Смирнова...................................................

127

9.3.2. Критерий ВилкоксонаМаннаУитни..............................................

129

9.4. Гипотезы о числовых характеристиках случайных величин................

132

9.4.1. Проверка гипотез о равенстве дисперсий случайной величины при

известных математических ожиданиях......................................................

132

9.4.2. Проверка гипотез о равенстве дисперсий случайной величины при

неизвестных математических ожиданиях..................................................

134

9.4.3. Проверка гипотез о равенстве математических ожиданий

 

случайных величин при известных дисперсиях........................................

135

9.4.4. Проверка гипотез о равенстве математических ожиданий

 

случайных величин при неизвестных дисперсиях....................................

136

9.5. Проверка гипотез о стохастической независимости элементов выборки

............................................................................................................................

138

9.5.1. Критерий «восходящих» и «нисходящих» серий............................

138

9.5.2. Критерий стохастической независимости Аббе..............................

140

РАЗДЕЛ 3. ОСНОВНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОГО АНАЛИЗА.......

142

ГЛАВА 10. ДИСПЕРСИОННЫЙ АНАЛИЗ...................................................................

144

10.1. Основные понятия дисперсионного анализа........................................

144

10.2. Однофакторный дисперсионный анализ ..............................................

145

10.2.1. Аддитивная модель однофакторного дисперсионного анализа ..

145

10.2.2. F-отношение. Базовая таблица однофакторного дисперсионного

анализа............................................................................................................

146

10.3. Понятие о многофакторном дисперсионном анализе.........................

150

10.3.1. Модель данных при независимом действии двух факторов........

151

10.3.2. F–отношение. Базовая таблица двухфакторного дисперсионного

анализа при независимом действии факторов...........................................

152

10.3.3. Модель данных при взаимодействии факторов.............................

153

10.4. Модели дисперсионного анализа со случайными факторами............

154

ГЛАВА 11. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ.................................................................

157

11.1. Типы признаков и их классификация....................................................

157

11.2. Виды зависимостей между количественными переменными ............

158

11.2.1. Функциональные и статистические зависимости .........................

158

11.2.2. Типы корреляционных зависимостей.............................................

159

11.3. Анализ парных статистических связей между количественными

 

переменными ....................................................................................................

161

11.3.1. Диаграмма рассеяния. Эмпирическая линия регрессии...............

161

11.3.2. Измерение тесноты парной связи. Коэффициент корреляции.....

163

11.3.3. Проверка наличия корреляции. Интервальная оценка rxy ............

166

11.3.4. Оценка тесноты нелинейной связи.................................................

168

5

11.4. Анализ множественных количественных связей.................................

173

11.4.1. Множественный коэффициент корреляции...................................

174

11.4.2. Частный коэффициент корреляции.................................................

175

11.5. Ранговая корреляция...............................................................................

176

11.5.1. Коэффициент ранговой корреляции Спирмена.............................

177

11.5.2. Коэффициент ранговой корреляции Кендалла..............................

179

11.5.3. Анализ множественных ранговых связей......................................

181

ГЛАВА 12. РЕГРЕССИОННЫЙ АНАЛИЗ....................................................................

183

12.1. Основные положения регрессионного анализа....................................

183

12.1.1. Задачи регрессионного анализа.......................................................

184

12.1.2. Многомерная нормальная регрессионная модель.........................

184

12.1.3. Выбор общего вида функции регрессии ........................................

185

12.1.4. Оценивание параметров функции регрессии. Метод наименьших

квадратов........................................................................................................

186

12.2. Парная регрессионная модель................................................................

187

12.2.1. Стратегия регрессионного анализа.................................................

187

12.2.2. Линейная одномерная модель регрессии.......................................

188

12.2.3. Оценка точности регрессионной модели.......................................

191

12.2.4. Оценка значимости уравнения регрессии......................................

195

12.3. Общий случай регрессии........................................................................

198

12.3.1. Множественный линейный регрессионный анализ......................

199

12.3.2. Нелинейные модели регрессии .......................................................

202

БИБЛИОГРАФИЧЕСКИЙ СПИСОК .............................................................................

202

6

Предисловие

Сядем на это бревно у дороги, – говорю я, – и забудем о бесчеловечности и развращенности поэтов. В длинных столбцах удостоверенных фактов и общепринятых мер и весов – вот где надо искать красоту. Вот мы сидим на бревне, и в нем, миссис Сэмпсон,

говорю я, заключена статистика более изумительная, чем любая поэма. Кольца на срезе показывают, что дерево прожило шестьдесят лет. На глубине двух тысяч футов, через три тысячи лет оно превратилось бы в уголь. Самая глубокая угольная шахта в мире находится в Киллингворте, близ Ньюкастля. Ящик в четыре фута длиной, три фута шириной и два фута восемь дюймов вышиной вмещает тонну угля. Если порезана артерия, стяните ее выше раны. В ноге человека тридцать костей. Лондонский Тауэр сгорел в тысяча восемьсот сорок первом году.

Продолжайте, мистер Пратт, продолжайте, – говорит миссис Сэмптон, – ваши идеи так оригинальны и успокоительны. По-моему, ничего нет прекраснее статистики.

О. Генри «Справочник Гименея», перевод М. Урнова

Основу настоящего пособия составляет содержание лекций по курсу «Теория вероятностей и математическая статистика», читаемых автором для студентов специальности «Прикладная информатика (в экономике)».

Предполагается, что читатель знает основы математического анализа, линейной алгебры и дискретной математики. Значение данной дисциплины очевидно. Во-первых, это составная часть современного высшего образования. Во-вторых, в ходе своей профессиональной деятельности информатикэкономист часто сталкивается с необходимостью статистической обработки и анализа массивов данных в различных областях экономики.

Основная цель пособия – научить студентов-информатиков анализировать исследуемую прикладную задачу, выбирать соответствующие методы ее решения, решать задачу, интерпретировать результаты и прогнозировать поведение исследуемого процесса при изменении влияющих факторов. Отсюда автор считает необходимым изложение материала в виде сочетания формальнологической основы с доказательством основных утверждений и многочисленных примеров, иллюстрирующих рассматриваемые утверждения.

Пособие призвано сформировать теоретическую базу и практические навыки, которые могут быть использованы студентами как в будущей профессиональной деятельности, так и при последующем изучении таких дисциплин, как «Статистика», «Системный анализ», «Эконометрика» и др.

Автор выражает благодарность доценту кафедры теории вероятностей МГУ А.Д. Манита за разрешение пользоваться его учебником при написании данного учебного пособия. Автор также признателен профессору кафедры математического анализа ЮУрГУ В.И. Заляпину, прочитавшему рукопись, и сделавшему ряд ценных замечаний, которые были учтены в окончательном варианте пособия.

7

Раздел 1. ТЕОРИЯ ВЕРОЯТНОСТЕЙ

Теория вероятностей – математическая наука, изучающая закономерности случайных явлений. Случайным называют эксперимент, результат которого нельзя предсказать заранее. Невозможность предсказать заранее – основное, что отличает случайное явление от детерминированного.

Очевидно, что в экономике, как и в природе и технике, нет явлений, в которых отсутствовали бы элементы случайности. Знание закономерностей, которым подчиняются массовые случайные явления, позволяет предвидеть, как эти явления будут протекать. Причем результат, развитие явления определяется как основными факторами, так и множеством второстепенных, приводящих к случайным возмущениям и искажениям результата, т.е. вносящих в него элемент неопределенности. Данный элемент неопределенности, свойственный случайным явлениям, требует специальных методов их изучения. Разработкой таких методов, изучением специфических закономерностей, наблюдаемых в случайных явлениях, и занимается теория вероятностей.

Не все случайные явления (эксперименты) можно изучать методами теории вероятностей, а лишь те, которые могут быть воспроизведены в одних и тех же условиях и обладают (непонятно как проверяемым заранее) свойством «статистической устойчивости»: если A – некоторое событие, могущее произойти или не произойти в результате эксперимента, то доля n(А)/n числа экспериментов, в которых данное событие произошло, имеет тенденцию стабилизироваться с ростом общего числа экспериментов n, приближаясь к некоторому числу P(А). Это число служит объективной характеристикой «степени возможности» событию A произойти.

В дальнейшем мы будем говорить лишь о случайных явлениях, обладающих данными свойствами.

Главы этого раздела:

1. События и их вероятности

2. Дискретные случайные величины и их распределения

3. Общие случайные величины

4. Совместное распределение общих случайных величин

5. Предельные законы теории вероятностей

8

Глава 1. События и их вероятности

1.1. Определение понятия «вероятность»

Наибольшую трудность при изучении теории вероятностей представляет принятие удовлетворительного определения вероятности. Существует не менее пяти различных определений, используемых с разной степенью успеха. Каждому из них присущи недостатки, связанные либо с принятой концепцией, либо с возможными приложениями. Как это ни удивительно, в самом удачном варианте вероятность никак не определяют.

Наибольшее распространение в настоящее время получили два подхода к определению вероятности – относительно-частотный и аксиоматический.

Первый из них основан на придании понятию «вероятность» некоторого физического смысла. Решения в этом случае выполняются путем обращения к концепции относительной частоты события. Ограничение данного подхода заключается в сложности его использования для получения соответствующего математического описания в случаях, слишком трудных для анализа с точки зрения их физического или экономического обоснования.

В аксиоматическом подходе вероятность события трактуется как некая численная величина, удовлетворяющая определенным постулатам, но более никак не определяется. Вопрос о том, соотносится ли она с явлениями реального мира или нет, не является поводом для размышлений при развитии математических построений, отправной точкой которых служат принятые постулаты. Независимо от того, какие экономические величины обозначаются абстрактными математическими символами, возникает та же математическая модель. Задача экономиста состоит в выборе такого способа соотнесения математической модели и явлений реального мира, чтобы получить хотя и приближенные, но полезные решения практических задач.

Из приведенных рассуждений следует, что наиболее подходящим для экономических приложений подходом к определению вероятности должен быть двунаправленный подход, при котором понятие относительной частоты некоторого случайного события используется для соотнесения простых результатов с физической реальностью, а аксиоматический подход – для получения математических описаний, соответствующих более сложным ситуациям.

1.2. Конечное вероятностное пространство

Рассмотрим произвольное конечное множество Ω = {ω1 ,K,ωK } , которое впредь будем называть множеством элементарных исходов, а его элементы ωi

– элементарными исходами.

Пусть задана функция P : Ω → [0,1] . То есть, каждому элементарному исходу ω поставлено в соответствие число P(ω) из отрезка [0,1] .

Будем предполагать, что

9

 

K

 

P(ω) = P(ωi ) =1.

(1.1)

ω

i=1

 

Функцию P, удовлетворяющую этим свойствам, назовем вероятностью на

.

Определение 1.1. Пару (, P) , составленную из множества и функции P, удовлетворяющих перечисленным выше требованиям, называют конечным вероятностным пространством.

Пример 1.1. Производится бросание двух игральных костей, изготовленных из однородного материала и имеющих правильную форму.

Элементарным исходом служит упорядоченная пара чисел ω = (i, j) , где i

число очков на первой кости,

j – число очков на второй кости. Множество

элементарных исходов можно задать перечислением:

 

 

= {(1, 1), (1, 2), , (1, 6), (2, 1), , (2, 6), , (6, 1), , (6, 6)}.

 

Очевидно, что множество имеет мощность

 

 

= 36

. Вероятность можно

 

 

задать следующим образом: ω

P(ω) =

1

.

 

 

 

 

 

 

36

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выше

рассмотрен

пример

вероятностного

пространства

с

равновероятными элементарными исходами.

Пример 1.2. Схема испытаний Бернулли. В качестве пространства элементарных исходов возьмем множество

Ω ={ω = (θ1 ,K,θn ) : θi {0,1}}.

(1.2)

Число элементов в этом множестве: Ω = 2n . Зададим теперь вероятность на . Зафиксируем некоторое 0 ≤ p ≤ 1. Положим

 

n

n

 

n

θi

nθi

 

P(ω) = P(θ1 ,K,θn ) = pθi (1p)1θi = p i=1

(1p) i=1 .

(1.3)

i=1

 

 

 

Заметим, что при p 1/ 2 ,

элементарные исходы в последовательности

испытаний Бернулли не являются равновероятными.

Схема испытаний Бернулли является важной в теоретическом и прикладном плане вероятностной моделью. Эта модель интерпретируется следующим образом: последовательно проводится серия из n однородных

10