Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Спирина М.С. ТВиМС 1 часть.doc
Скачиваний:
499
Добавлен:
18.02.2016
Размер:
1.39 Mб
Скачать

Глава 3. Элементы математической статистики

3.1. Выборочный метод

3.1.1 Задачи и методы математической статистики

Математическая статистика — это раздел математики, посвященный методам сбора, анализа и обработки результатов статистических данных наблюдений для научных и практических целей. Методы математической статистики используют в тех случаях, когда изучают распределение массовых явлений, т.е. большой совокупности предметов или явлений, распределенных по определенному признаку.

Пусть подлежит изучению совокупность однородных объектов, объединенных общим признаком или свойством качественного или количественного характера. Отдельные элементы такой совокупности называются ее членами. Все число членов совокупности составляет ее объем. Совокупность всех объектов, объединенных по некоторому признаку, будем называть генеральной совокупностью. Например, изучается доход населения, рыночная стоимость акций или отклонение от Госстандарта в ходе качественной оценки изготавливаемой продукции.

Математическая статистика тесно связана с теорией вероятности и опирается на ее выводы. В частности, понятию генеральной совокупности в математической статистике соответствует понятие пространства элементарных событий в теории вероятностей.

Изучение всей генеральной совокупности чаще всего невозможно или нецелесообразно из-за значительных материальных затрат, порчи или уничтожения объекта исследования. Так, невозможно получить объективную и полную информацию о доходе населения всего региона, т.е. каждого конкретного его обитателя. В связи с порчей объекта исследования, невозможно получить достоверную информацию о качестве, например, некоторых лекарственных средств или продуктов питания.

Основная задача математической статистики заключается в исследовании генеральной совокупности по выборочным данным в зависимости от поставленной цели, то есть изучение вероятностных свойств совокупности: закона распределения, числовых характеристик и т.д. для принятия управленческих решений в условиях неопределенности.

3.1.2 Виды выборки

Одним из методов математической статистики является выборочный метод. На практике чаще всего исследуется не вся генеральная совокупность, а ограниченного объема выборка из нее.

Выборкой (выборочной совокупностью) называют совокупность случайно отобранных объектов. С помощью выборочного метода исследуется не вся генеральная совокупность, а выборка (х1, х2,...,xn) как результат ограниченного ряда наблюдений. Затем по вероятностным свойствам данной выборки из некоторой генеральной совокупности выносится суждение о всей генеральной совокупности. Для получения выборки применяют различные методы отбора. Объекты исследования после изучения можно в генеральную совокупность, что соответствуетвыборке.

Выборка называется репрезентативной или представительной, если она хорошо воспроизводит генеральную совокупность, то есть вероятностные свойства выборки совпадают или близки к свойствам самой генеральной совокупности.

Итак, результативность применения выборочного метода повышается при соблюдении ряда условий, к которым можно отнести следующие:

  1. Количество исследуемых элементов выборки достаточно для выводов, то есть выборка представительна или «репрезентативна».

Так, достаточное количество деталей в партии, проверяемой на качество (брак), устанавливается с помощью законов теории вероятностей и математической статистики.

  1. Элементы выборки должны быть разнообразны, взяты случайно, т.е. должен соблюдаться принцип рандомизации.

  2. Изучаемый признак характерен, типичен для всех элементов множества изучаемых объектов т.е. для всей генеральной совокупности.

  3. Изучаемый признак является существенным для всех элементов данного класса.

Изменение признака статистической совокупности, изучаемого выборочным методом, называется вариацией, а наблюдаемые значения признака xi вариантой. Абсолютной частотой (частотой или частостью) варианты xi называется число членов совокупности (генеральной или выборки), имеющих значение xi (т.е. это число частиц i-го сорта).

Ранжированная группировка вариант по отдельным значениям признака (или по интервалам изменения), т.е. последовательность вариант, расположенная в порядке возрастания, называется вариационным рядом. Любую функцию (X1,X2,…,Xn) от результатов наблюдений X1,X2,…,Xn исследуемой случайной величины называют статистикой.

Принято объем генеральной совокупности обозначать N, ее абсолютные частоты — Ni, объем выборки — n, ее абсолютные частоты — ni. Очевидно, что

, .

Отношение частоты к объему совокупности называется относительной частотой или статистической вероятностью и обозначается Wi или :

.

Если количество вариант велико или близко к объему выборки (при дискретном распределении), а также если выборка производится из непрерывной генеральной совокупности, то вариационный ряд составляют не по отдельным – точечным – значениям, а по интервалам значений генеральной совокупности. Вариационный ряд, представленный таблицей, построенный с помощью процедуры группировки, будем называть интервальным. При составлении интервального вариационного ряда первая строка таблицы заполняется равными по длине интервалами значений исследуемой совокупности, вторая – соответствующими абсолютными или относительными частотами.

Пусть из некоторой генеральной совокупности в результате n наблюдений извлечена выборка объема п. Статистическим распределением выборки называется перечень вариант и соответствующих им абсолютных или относительных частот. Точечный вариационный ряд абсолютных частот может быть представлен таблицей:

xi

х1

х2

хk

ni

n1

n2

nk

причем .

Точечный вариационный ряд относительных частот представляют таблицей:

xi

х1

х2

хk

причем .

При построении интервального распределения существуют правила в выборе числа интервалов или величины каждого интервала. Критерием здесь служит оптимальное соотношение: при увеличении числа интервалов улучшается репрезентативность, но увеличивается объем данных и время на их обработку. Разность xmax - xmin между наибольшим и наименьшим значениями вариант называют размахом выборки.

Для подсчета числа интервалов k обычно применяют эмпирическую формулу Стерджесса:

k = 1+3,3221g n (3.1)

(подразумевается округление до ближайшего целого). Соответственно, величину каждого интервала h можно вычислить по формуле:

. (3.2)

За начало первого интервала рекомендуется брать величину, равную

xmin = xmax- 0,5h.

Каждый интервал должен содержать не менее пяти вариант. В том случае, когда число вариант в интервале меньше пяти, соседние интервалы принято объединять.