Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие по статистике.doc
Скачиваний:
48
Добавлен:
15.02.2016
Размер:
3.79 Mб
Скачать

1.3.1. Определение числовых характеристик при малой выборке

Основными числовыми характеристиками выборки являются характеристика положения (среднее значение) и характеристика вариации признака (дисперсия).

Пример 1. 1.Предположим, решили создать мастерскую по пошиву мужской обуви. На какой размер обуви следует ориентироваться. Решили провести статистическое наблюдение: спросили у 20 случайных прохожих мужчин, какой размер обуви они носят. Оказалось

Размер,

39

40

41

42

43

44

45

Количество,

1

3

4

5

4

2

1

20

Определить среднее значение измеряемой величины и дисперсию при малом числе измерений

Определяем средний размер обуви по формуле

= 41,9.

Находим дисперсию

2,29.

Для прогнозирования необходимо оперировать параметрами генеральной совокупности, а не данными, полученными из случайной выборки. Каковы значения этих характеристик для генеральной совокупности ?

Теоретические положения.В соответствии с законом больших чисел, с увеличением числа измерений числовые характеристики, полученные в результате опыта, все более приближаются к числовым характеристикам генеральной совокупности.

Среднее значение для генеральной совокупности обозначают и называют математическим ожиданием. Вполне возможно, что в данном случае. Но если бы мы опросили других прохожих, то получили бы другое значение, которое, вполне возможно, оказалось бы. Следовательно,не содержит систематической ошибки, т.е.«является несмещенной оценкой». На основании этого среднее значение, полученное по результатам опыта, является подходящей (приемлемой) характеристикой случайных значений.

В теории вероятностей доказано, что в отличии от , дисперсия содержит систематическую ошибку. Систематическую ошибку всегда можно учесть с помощью коэффициента. Введя поправочный коэффициент, формула для определения дисперсии для малой выборки принимает вид.

Следовательно, и.

Таким образом, в статистике принимают

Числовые характеристики

выборки

генеральной совокупности

1.3.2. Оценка надежности значенийи. Ошибка выборки.

Статистические характеристики всегда содержат ошибку. Предполагается, что ошибки определения статистических характеристик распределены по нормальному закону. Нормальный закон предполагается, что:

- ошибки не беспредельны;

- чем больше ошибка, тем меньше вероятность ее появления и наоборот;

- появление ошибки более 3 – практически невозможное событие.

Нормальный закон имеет место для генеральной совокупности. Для выборки ограниченного объема используют распределение СТЬЮДЕНТА. Характерно, что с увеличением числа опытов распределение СТЬЮДЕНТА все более приближается к нормальному закону. Так как число измерений в нашем примере всего n=20, то для оценки точностиипридется использовать распределение СТЬЮДЕНТА.

Для оценки точности статистических характеристик с использованием распределения СТЬЮДЕНТА составлены специальные таблицы.

Оценим точность значения =41,9, рассчитанного по 20-ти измерениям:

1. Задаемся гарантированной вероятностью, т.е. с какой вероятностью мы можем утверждать, что полученный ответ верен. Гарантированную вероятностью обозначают буквой . По физическому смыслуесть вероятность того, что найденное значениеможет оказаться в области практически невозможных событий. Вероятность такого события должна быть небольшой. Пусть.

2.Рассчитываем среднее квадратическое отклонение для входа в таблицу по формуле

.

3. Используя специальную таблицу, находи значение коэффициента СТЬЮДЕНТА, который обозначают . Входом в таблицу являютсяи число степеней свободы=19:

.

Примечание.При отсутствии таблицы можно воспользоваться компьютером. Для этого вExcelвыделить любую ячейку, затем последовательно вызвать Статистические функции, СТЬЮДРАСПОБР и в появившемся подменю указать: Вероятность 0,1; Степени свободы 19, ОК. В выделенной ячейке появится число 1,729133 (значение коэффициента СТЬЮДЕНТА).

4. Рассчитывают величину доверительного интервала .

Смысл полученного результата: вероятность того, что мы ошибаемся равна 0,1. С вероятностью 0,9 можно утверждать, что истинное значение mхне выходит за пределы доверительного интервала 41,9±0,6, т.е. находится в пределах 41,3 <mх< 42,5 или на рисунке

Аналогично рассчитывается доверительный интервал для дисперсии, но при этом используется другая таблица и несколько отличная методика.

Ошибка выборки. В теории вероятностей численное значение

называют среднее квадратическое отклонение, а значение

– доверительным интервалом.

В статистике введена другая терминология: – средняя ошибка малой выборки;– предельная ошибка малой выборки.