Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лек_Стат3.doc
Скачиваний:
11
Добавлен:
18.04.2015
Размер:
174.59 Кб
Скачать

14

Санкт-Петербургский юридический институт

(филиал) Академии Генеральной прокуратуры Российской Федерации

Предмет: «Информационные технологии в юридической деятельности»

Раздел: «Статистический анализ»

Конспект лекций

Составитель: доцент Сибаров К.Д.

Лекция 7

Тема 7. Случайность, статистика, вероятность (окончание)

Вопросы

7.17. Разброс значений случайной величины.

7.18. Дисперсия дискретной случайной величины.

7.19. Дисперсия непрерывной случайной величины.

7.20. Симметричные интервалы нормального распределения.

Тема 8. ВЫБОРОЧНЫЙ МЕТОД (начало)

Вопросы

8.1. Единица наблюдения. Генеральная совокупность. Выборка.

8.2. Понятие оценивания.

8.3. Выборочное среднее.

8.4. Выборочная дисперсия.

Санкт-Петербург

2012

Тема 7. СЛУЧАЙНОСТЬ, СТАТИСТИКА, ВЕРОЯТНОСТЬ (окончание)

7.17. РАЗБРОС ЗНАЧЕНИЙ случайной величины

Знание степени разброса значений случайной величины в ряде случаев также важно, как и знание её среднего значения.

Например, известна пословица: «Река – в среднем по колено, а корова утонула».

Или другой случай. В больничной палате лежат пятеро тяжело больных. У четверых температура – 40, лихорадка; а у одного – 20, комнатная, т.е. он умер. Какова будет средняя температура по палате?

Вычисляем среднее арифметическое

(40 + 40 + 40 + 40 + 20) / 5 = 180 / 5 = 36 град.

Средняя по палате температура – нормальная… Но значит ли это, что все здоровы?

Поэтому кроме среднего значения случайной величины важно знать что-то о разбросе её значений.

Причём желательно, чтобы это «что-то» было числом. Для возможности сравнения.

Что в рассмотренном примере можно вычислить такого, что характеризовало бы разброс значений?

Можно вычислить отклонения каждого значения от среднего арифметического, а затем найти среднее арифметическое этих отклонений.

Попробуем

( (40-36) + (40-36) + (40-36) + (40-36) + (20-36) ) / 5 = (4 + 4 + 4 + 4 + (–16) ) / 5 = 0.

Не подходит.

Знаки отклонений противоположны, поэтому отклонения взаимно уничтожаются.

Следовательно, надо избавиться от знаков.

Первая мысль, которая приходит в голову – это вычислить вначале модули этих отклонений, а уже затем – их среднее арифметическое.

( |40-36| + |40-36| + |40-36| + |40-36| + |20-36| ) / 5 =

= (4 + 4 + 4 + 4 + 16) / 5 = 32 / 5 = 6,4 град.

Вот это уже то, что надо. Модуль устраняет чувствительность к направленности отклонения, т.е. учитывается только величина этого отклонения без знака.

Эта способ вычисления очень нагляден и исторически был предложен самым первым.

Однако впоследствии оказалось, что при его использовании в более сложных ситуациях возникают математические трудности.

Поэтому в настоящее время и в теории вероятности, и в статистике для большего удобства при вычислении отклонения используется не модуль, а возведение в квадрат, т.е. находится среднее арифметическое квадратов отклонений

( (40-36)2 + (40-36)2 + (40-36)2 + (40-36)2 + (20-36)2 ) / 5 =

= (16 + 16 + 16 + 16 + 256) / 5 = 320 / 5 = 64 град2.

Характеристика разброса значения здесь будет иметь размерность «градус в квадрате». (Почти что квадратный градус)

Чтобы вернуться к обычным, т.е. нормальным градусам из неё извлекают корень

= 8 град.

Видим, что другой способ вычисления дал другое число. Но и в том, и в другом случае величина характеризует рассеяние или разброс относительно среднего значения.

А теперь давайте серьёзно получим выражение для рассеяния с использованием возведения в квадрат как способа устранения зависимости от знака отклонения.

Рассуждения будут такие же, как и при выводе выражения для среднего арифметического.

Рассмотрим дискретную случайную величину Х (большое) с N возможными значениями.

Пусть с ней проделано n одинаковых опытов.

При этом случайная величина Х значение принялараз,

раз

значение принялараз,

и так далее …,

значение принялараз

.

Общее количество появления всех значений равно n, т.е.

Найдём среднее арифметическое случайной величины Х по n опытам.

Формулу для среднего арифметического уже получали

.

Теперь займёмся рассеянием.

В примере с больницей мы вычисляли среднее арифметическое квадратов отклонений от среднего. Запишем то же самое в общем виде.

Искомую величину для рассеяния будем обозначать как .

Рассеяние, по-латински, – дисперсия, т.е. на букву «D».

==

Преобразуем это выражение, учтя повторяемость значений:

где - это частота появления значениявn опытах.

Из полученного выражения видно, что рассеяние вычисляется как усреднённая сумма квадратов отклонений от среднего арифметического. В качестве множителей при каждом слагаемом суммы выступают частоты.

Мы вычислили среднее арифметическое квадратов отклонений. Говорят также, что получен средний квадрат отклонения от среднего арифметического.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]