Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
102
Добавлен:
07.03.2015
Размер:
7.87 Mб
Скачать

Глава 9. Примеры решения задач с использованием системы statistica

9.1. Краткая характеристика системы

Рассмотрим приемы решения статистических задач с применением специализированной системы статистического анализа данных – STАTISTICA. Мы будем использовать полностью русифицированную версию, предоставленную российским представительством компанииStatSoft, снабженную техническим руководством и электронным учебником1. Для тех, кто не располагает русифицированной версией, приведем оригинальные названия пунктов меню и кнопок диалоговых окон системыSTATIATICA5.5. Интерфейс более поздних версий системы будет интуитивно понятен.

STATISTICA– это универсальная система, включающая расчет набора статистик и графиков, дисперсионный и непараметрический анализ, корреляционный и многомерный регрессионный анализ, кластерный и факторный анализ и т.д. В системе данные организованы в виде наблюдений и переменных. Наблюдения можно рассматривать как эквивалент записей в программе управления базами данных, а переменные – как эквивалент полей. Переменные могут иметь имя, например ВЕС, РОСТ (по умолчаниюVAR1,VAR2, …). Наблюдения (CASE) имеют порядковую нумерацию, но могут содержать имена наблюдений, например Иванов, Петров.

Файлы данных системы STATISTICAпомимо исходных данных могут хранить и другую информацию, например:

  • формат отображения;

  • определенные значения, которые нужно пропускать при расчетах;

  • длинные имена переменных и комментариев;

  • длинные метки и комментарии для отдельных значений;

  • формулы, которые можно использовать для задания, перекодирования или преобразования каждой переменной;

  • динамически обновляемые связи между файлом данных и другими файлами данных, совместимыми с Windows; за подробностями следует обратиться к справочнику системы или к специальной литературе1.2

Наборы файлов данных системы STATISTICA(расширение *.sta) можно рассматривать как «рабочие книги», так как они содержат информацию о всех дополнительных файлах (например, графиках, отчетах и программах), которые используются с текущим набором данных. Список этих файлов можно просмотреть, нажав кнопкуРабочая книга(Workbook) на панели инструментов главного окна системы.

9.2. Описательная статистика

Пример 9.1.Требуется определить среднюю величину дневной выручки в магазине. Пусть мы располагаем выборкой этой величины, которая фиксировалась кассиром ежедневно в течение месяца. Эти данные приведены в табл. 9.1.

Таблица 9.1.Исходные данные к примеру 9.1

День

Выручка (руб.)

День

Выручка (руб.)

День

Выручка (руб.)

1

27479,27

11

38077,50

21

53686,90

2

39469,80

12

69720,76

22

69582,56

3

43501,55

13

38106,10

23

30865,84

4

39264,79

14

50553,20

24

44048,56

5

30043,48

15

43583,21

25

61449,22

6

67662,00

16

41282,52

26

53349,40

7

68987,42

17

46200,47

27

55048,30

8

35961,27

18

45346,07

28

39927,48

9

36232,53

19

54307,78

29

38368,89

10

50277,72

20

67304,06

30

31470,00

Решение. Для решения поставленной задачи необходимо будет по данным этой выборки определить математическое ожидание случайной величины (выручки), дисперсию и среднеквадратичное отклонение. Затем построить доверительный интервал на оценку математического ожидания, задавшись приемлемой доверительной вероятностью (например, 95 %).

Решение

  1. З

    Х

    апустите программуSTATISTICAи в переключателе модулей системы (рис.9.1) выберите режимОсновные статистики и таблицы (BasicStatistics). Нажмите клавишуПереключиться в(SwitchTo) – на экране появится основное окно системы. Как правило, в этом окне откроется таблица с раннее использовавшимся набором данных. Можете закрыть эту таблицу, нажав кнопку в правом верхнем углу.

  2. Теперь нужно создать свою электронную таблицу данных. В основном окне системы выберите меню Файл (рис.9.2) и команду Создать данные…(New Data). В диалоговом окне Открытие файла данных(OpenDataFile) (рис.9.3.) выберите нужный каталог и введите имя файла. По умолчанию файлам, содержащим таблицы данных, присваивается расширение .sta.

Рис.9.1.Окно переключателя модулей

Рис.9.2. Меню команды Файл

Рис.9.3. Окно открытия файла данных

После нажатия кнопки Сохранить (Save) появится пустая таблица данных по умолчанию размером 10п * 10н, т.е. 10 переменных (VARIABLES) представлены значениями в 10 наблюдениях (CASE). В нашем случае имеется всего одна переменная и 30 наблюдений. Поэтому с помощью меню Переменные / удалить (Vars/Delete) удалите из таблицы переменные VAR2 – VAR10, а с помощью меню Наблюдения / добавить (Case/Add) добавьте еще 20 наблюдений после 10-го. Щелкните дважды по ячейке с именем VAR1, задайте имя переменной нашего примера – ВЫРУЧКА (рис.9.4) и нажмите кнопку ОК.

В окне Данные(Data) введите значения выручки в магазине из табл.9.1 и сохраните данные с помощью команды менюФайл/ Сохранить (File/Save).

Рис. 9.4. Задание формата для ввода переменной

  1. Теперь можно приступить к расчету требуемых статистических характеристик. С помощью меню Анализ/Описательная статистика (Analysis/DecriptiveStatistics) вызовите диалоговое окноОсновные статистики и таблицы(BasicStatistics) (рис.9.5), выберите командуОписательные статистики (DecriptiveStatistics) и нажмитеОК. В появившемся окне (рис.9.6), нажав кнопкуПеременные (Variables), укажите имя исследуемой переменной; в данном случае она единственная в списке – ВЫРУЧКА.

Рис.9.5. Окно выбора метода основных статистик

Вернувшись в окно Описательные статистики (Decriptive Statistics), нажмите кнопку Другие статистики (More statistics) и в появившемся списке укажите следующие статистические характеристики:

 математическое ожидание (Mean);

 стандартное отклонение (StandardDeviation);

 дисперсия (Variance);

 стандартная ошибка (Standard error of mean);

 доверительный интервал на математическое ожидание при доверительной вероятности 95 % (95 % confidencelimitsofmean).

Рис.9.6. Диалоговое окно описательной статистики

Запустите вычислительную процедуру, нажав кнопку ОК. На экране появится следующая таблица результатов (рис.9.7). Из этой таблицы можно легко увидеть, что величина ежедневной выручки в магазине с вероятностью 95 % лежит в пределах от 42304,96 до 51772,28 руб. и в среднем составляет 47038,62 руб.

Рис.9.7. Результат расчета основных характеристик случайной величины

Визуальную интерпретацию результатов можно представить с помощью двумерного графика. В диалоговом окне Описательные статистикинажмите клавишуГрафики «ящики с усами»(Box&WiskerType). В появившемся окне выберите тип графика:Среднее/Стандартная ошибка/Стандартное отклонение(Mean/SE/SD). НажмитеОКи получите графическое окно (рис 9.8).

Рис. 9.8. Диаграмма размаха значений случайной величины

Смысл этого графика очень простой: точка в центре прямоугольника (ящика) соответствует среднему значению выручки. От этого значения откладываются положительная и отрицательная величины стандартной ошибки (ширина ящика) и положительная и отрицательная величины стандартного отклонения (усы).

Задание для самостоятельной работы

Как вы думаете, как повлияет (увеличится или уменьшится) ширина доверительного интервала на оценку среднего значения, если объем выборки уменьшить вдвое? Проверьте свое предположение, проведя повторный расчет в системе STATISTICAдля первых 15 наблюдений. Для этого предварительно из таблицы данных удалите наблюдения с 16-го по 30-е.

Соседние файлы в папке Тер вер и мат стат