Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие программные стат комплексы.doc
Скачиваний:
36
Добавлен:
14.03.2016
Размер:
1.32 Mб
Скачать

Пример выполнения

1. Исходные данные для расчета приведены в табл. 2:

Таблица 2

Результаты контроля содержания соли (%) в вареных колбасах

Дата контроля

Содержание соли, %

Дата контроля

Содержание соли, %

04.08.03

2,21

11.08.03

2,42

05.08.03

2,12

12.08.03

2,03

06.08.03

2,28

13.08.03

2,23

07.08.03

2,39

14.08.03

2,40

08.08.03

2,37

15.08.03

2,14

2. Результаты расчета основных показателей описательной статистики:

Таблица 3

Столбец1

Среднее

2,259

Стандартная ошибка

0,043

Медиана

2,255

Мода

#Н/Д

Стандартное отклонение

0,135

Дисперсия выборки

0,018

Эксцесс

-1,19

Асимметричность

-0,33

Интервал

0,39

Минимум

2,03

Максимум

2,42

Сумма

22,59

Счет

10

Наибольший (1)

2,42

Наименьший (1)

2,03

Уровень надежности (95,0%)

0,097

3. На основании проведенного выборочного обследования и рассчитанных по данной выборке показателей описательной статистики (табл. 3) с уровнем надежности 95 %, можно предположить, что средний показатель содержания соли в вареных колбасах за период с 04.08.2003 г. по 15.08.2003 г. находился в следующих пределах:

x=0,097; x - x = 2,259-0,097 = 2,162;

x + x = 2,259+0,097 = 2,356;

границы доверительного интервала [ 2,162 ; 2,356 ].

Коэффициент вариации

= / x 100 % = 0,135 100 / 2,259  6,0 %,

что существенно меньше 40 % и свидетельствует о небольшой колеблемости показателя качества в исследованной выборочной совокупности.

Надежность средней в выборке подтверждается также и ее незначительным отклонением от медианы: 2,259 - 2,255 = 0,004.

Отрицательные значения коэффициентов асимметрии и эксцесса позволяют говорить о том, что данное эмпирическое распределение отличается от нормального, «длинная часть» кривой распределения расположена слева от среднего и кривая распределения имеет более низкую и «плоскую» вершину.

Содержание отчета

1. Отчет должен быть выполнен на листах формата А4.

2. В отчете должны быть приведены цель работы, исходные данные для расчета (табл. 2) и основные показатели описательной статистики (табл. 3).

3. На основании проведенного выборочного обследования и рассчитанным по выборке показателям описательной статистики должны быть сформулированы соответствующие выводы.

Контрольные вопросы

  1. Какая программная надстройка табличного процессора Microsoft Excel используется для статистического анализа информации?

  2. Какие методы статистической обработки данных реализованы в Microsoft Excel?

  3. Каковы основные элементы управления диалоговым окном каждого режима работы, задающие параметры выполнения режима?

  4. Какие статистические функции связаны с режимом работы Описательная статистика?

Лабораторная работа № 2

Изучение статистических функций

распределений с использованием

табличного процессора excel

и надстройки «пакет анализа»

Цель работы – изучение статистических функций непрерывных и дискретных распределений с использованием программной надстройки «Пакет анализа» табличного процессора Microsoft Excel.

Краткие теоретические сведения

Случайной величиной называется переменная величина, принимающая в результате испытания одно возможное значения, зависящее от случайных причин. Случайная величина может быть:

  1. непрерывной – принимающей все значения из некоторого бесконечного или конечного промежутка;

  2. дискретной – принимающей отдельные возможные значения с определенными вероятностями.

Функцией распределения случайной величины X называется функция F(x), определяющая вероятность того, что случайная величина X принимает значение, меньшее x, т.е.

.

Иногда функцию F(x) называют интегральной функцией распределения.

Функция распределения вероятностей непрерывной случайной величины дает полную вероятностную характеристику ее поведения. Однако непрерывную случайную величину можно задать и с помощью функции f(x), называемой плотностью распределения (или дифференциальной функции распределения). Плотностью распределения вероятностей f(x) непрерывной случайной величины X называют первую производную от функции распределения F(x)

.

Плотности распределений непрерывных случайных величин называют также законами распределений. Кривая распределения, выражающая общую закономерность данного типа распределения, называется теоретической кривой распределения.

В практике статистической обработки информации широко используются различные виды теоретических распределений – нормальное распределение, биномиальное, распределение Пуассона и др. Каждое из теоретических распределений имеет свою специфику и свою область применения.

Для формирования массива случайных чисел, распределенных по одному из заданных теоретических распределений, служит режим работы Генерация случайных чисел.

Параметры диалогового окна Генерация случайных чисел меняются в зависимости от выбранного распределения (равномерное, нормальное, Бернулли, биномиальное, Пуассона, модельное или дискретное) (на рис. 3 приведен пример диалогового окна при выборе нормального закона распределения):

Общими параметрами для всех подрежимов являются:

  1. Число переменных – вводится число столбцов значений, которые необходимо разместить в выходном диапазоне; если это число не введено, то все столбцы в выходном диапазоне будут заполнены;

  2. Число случайных чисел – вводится число случайных значений, которое необходимо вывести в каждом столбце выходного диапазона. Каждое случайное значение будет помещено в строке выходного диапазона. Если число случайных чисел не будет введено, все строки выходного диапазона будут заполнены;

Рис. 3

  1. Распределение – в данном раскрывающемся списке выбирается тип распределения, которое необходимо использовать для генерации случайных чисел;

  2. Случайное рассеивание – вводится «стартовое» число для генерации определенной последовательности случайных чисел;

  3. Выходной интервал / Новый рабочий лист / Новая рабочая книга – переключатель, определяющий положение выходного диапазона. В положении Выходной интервал активизируется поле, в которое необходимо ввести ссылку на левую верхнюю ячейку выходного диапазона. Размер выходного диапазона будет определен автоматически и на экране появится сообщение в случае возможного наложения выходного диапазона на исходные данные. В положении Новый рабочий лист открывается новый лист, в который начиная с ячейки А1 вставляются результаты анализа. Если необходимо задать имя открываемого рабочего листа, его вводят в поле, расположенное напротив соответствующего положения переключателя. В положении Новая рабочая книга открывается новая книга, на первом листе которой начиная с ячейки А1 вставляются результаты анализа.

Генерация случайных чисел, распределенных

по нормальному закону

В диалоговом окне Генерация случайных чисел в область Параметры задаются характеристики нормального закона распределения – математическое ожидание (поле Среднее) и стандартное отклонение (поле Стандартное отклонение).

Для расчета нормального распределения используется функция НОРМРАСП (x; среднее; стандартное_откл; интегральная). Аргументами этой функции являются:

  1. x – значение, для которого вычисляется нормальное распределение;

  2. среднее – средняя арифметическая распределения;

  3. стандартное_откл – стандартное отклонение распределения;

  4. интегральная – логическое значение, определяющее форму функции. Если аргумент интегральная =1, то функция НОРМРАСП рассчитывает интегральную функцию распределения; если аргумент интегральная =0 – дифференциальную функцию распределения.

Уравнение для плотности нормального распределения имеет вид

,

а уравнение нормальной функции распределения –

.

Функция НОРМРАСП использует первое уравнение, если аргумент интегральная =0, и второе уравнение, если аргумент интегральная =1.

Результаты статистических наблюдений оформляются в виде таблиц и статистических рядов распределений. Удобнее всего ряды распределений анализировать с помощью их графического изображения, позволяющего судить о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дает гистограмма, которую зачастую строят вместе с кумулятивной кривой по накопленным частотам.

Режим Гистограмма (рис. 4) служит для вычисления частот попадания данных в указанные границы интервалов, а также для построения гистограммы интервального вариационного ряда распределения.

Рис. 4

В диалоговом окне данного режима задаются следующие параметры:

  1. поле Входной интервал – вводится ссылка на ячейки, содержащие анализируемые данные;

  2. Интервал карманов (необязательный параметр) – вводится ссылка на ячейки, содержащих набор граничных значений, определяющих интервалы (карманы), эти значения должны быть введены в возрастающем порядке. Если диапазон карманов не был введен, то набор интервалов, равномерно распределенных между минимальным и максимальным значениями данных, будет создан автоматически;

  3. флажок Метки – устанавливается в активное состояние, если первая строка (столбец) во входном диапазоне содержит заголовки. Если заголовки отсутствуют, флажок следует деактивизировать, в этом случае будут автоматически созданы стандартные названия для данных выходного диапазона;

  4. переключатель Выходной интервал / Новый рабочий лист / Новая рабочая книга. В положении Выходной интервал активизируется поле, в которое необходимо ввести ссылку на левую верхнюю ячейку выходного диапазона. Размер выходного диапазона будет определен автоматически и на экране появится сообщение в случае возможного наложения выходного диапазона на исходные данные. В положении Новый рабочий лист открывается новый лист, в который начиная с ячейки А1 вставляются результаты анализа. Если необходимо задать имя открываемого рабочего листа, его вводят в поле, расположенное напротив соответствующего положения переключателя. В положении Новая рабочая книга открывается новая книга, на первом листе которой начиная с ячейки А1 вставляются результаты анализа;

  5. Парето (отсортированная гистограмма) – устанавливается в активное состояние, чтобы представить данные в порядке убывания частоты. Если флажок снят, то данные в выходном диапазоне будут приведены в порядке следования интервалов;

  6. Интегральный процент – устанавливается в активное состояние для расчета выраженных в процентах накопленных частот (накопленных частостей) и включения в гистограмму графика кумуляты;

  7. Вывод графика – устанавливается в активное состояние для автоматического создания встроенной диаграммы на листе, содержащем выходной диапазон.