Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Планирование и обработка эксперимента / Spirin - Metodi planirovaniya i obrabotki 2004.pdf
Скачиваний:
601
Добавлен:
13.05.2017
Размер:
7.84 Mб
Скачать

7.КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …

7.3.3.Ввод данных

Данные в STATISTICA организованы в виде электронной таблицы – Spreadsheet. Они могут содержать как численную, так и текстовую информацию. Данные в электронной таблице могут иметь различные форматы (например, даты, времени и др.). Электронные таблицы в STATISTICA поддерживают различные типы операций с данными, такие как: операции с использованием буфера обмена WINDOWS, операции с выделенными блоками значений (аналогично MS Excel).

Ввести данные в электронную таблицу можно одним из следующих способов. Непосредственно ввести их в электронную таблицу с клавиатуры. Для автоматизации ручного ввода данных в STATISTICA имеются развитые инструментальные

средства.

Вычислить новые данные на основе уже введенных данных при помощи фор-

мул, которые можно задать в электронной таблице. При этом имеется возможность быстрого доступа к большому количеству специализированных статистических функций, допускается использование логических операторов.

Воспользоваться данными, подготовленными в другом приложении. При этом доступны следующие способы ввода данных из других приложений STATISTICA:

операции копирования данных через буфер обмена WINDOWS;

импорт данных из наиболее популярных приложений, например электронных таблиц, систем управления базами данных и др.;

использование механизма динамической связи DDE между данными в STATISTICA и другим WINDOWS приложением. В этом случае все изменения данных, внесенные позднее в источник (WINDOWS приложение), будут автоматически (динамически) отражены в файле исходных данных для системы

STATISTICA.

На любом этапе ввода данных система STATISTICA позволяет быстро вычис-

лить основные статистические характеристики данных, отобразить их графически и

перейти к статистическому анализу.

225

7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …

7.3.4. Вывод численных и текстовых результатов анализа

Численные результаты статистического анализа в системе STATISTICA выводятся в виде специальных электронных таблиц, которые называются таблицами вывода результатов – Scrollsheet. Таблицы Scrollsheet могут содержать любую информацию (как численную, так и текстовую) размером от короткой строчки до нескольких мегабайтов.

STATISTICA содержит большое количество инструментов для просмотра результатов статистического анализа и их визуализации. Они включают в себя стандартные операции по редактированию таблицы (вставка, удаление, операции над блоками, автозаполнение блоков и др.), операции просмотра (подвижные границы столбцов, разделение прокрутки в таблице и др.), доступ к основным статистикам и графическим возможностям системы STATISTICA. При выводе целого ряда резуль-

татов (например, корреляционной матрицы) STATISTICA отмечает значимые коэффициенты корреляции цветом. Пользователь имеет возможность выделить при помощи цвета необходимые значения в таблице Scrollsheet.

Если пользователю необходимо провести детальный статистический анализ промежуточных результатов, то можно сохранить таблицу Scrollsheet в формате файла STATISTICA и далее работать с ним, как с обычными данными.

Кроме вывода результатов анализа в виде отдельных окон с графиками и таблицами Scrollsheet, в системе имеется возможность создания отчета, в окно которого может быть выведена вся эта информация – это документ (в формате RTF), который может содержать любую текстовую или графическую информацию. В STATISTICA имеется возможность автоматического создания отчета, так называемого автоотчета. При этом любая таблица Scrollsheet или график могут автоматически быть направлены в отчет.

7.3.5. Статистические процедуры системы STATISTICA

Статистические процедуры системы STATISTICA, как уже было отмечено,

сгруппированы в нескольких специализированных статистических модулях (рис. 7.3).

В каждом модуле можно выполнить определенный способ обработки, не обращаясь

кпроцедурам из других модулей. Ниже приводится краткое описание отдельных ста-

тистических модулей, знакомство с которыми поможет инженеру-исследователю в

226

Рис. 7.3. Основные статистические модули системы STATISTICA

7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …

его практике для профессиональной обработки, анализа и представления результатов эксперимента (промышленного, лабораторного, вычислительного и др.).

Модуль Основные статистики и таблицы (Basic Statistics/Tables) включает в себя следующие группы статистических процедур:

Описательные статисти-

ки (Descriptive statistics). Группа производит вычисление практически всех описательных статистик, среднее арифметическое, выборочную дисперсию, стандартное

отклонение, медиану, моду, максимальное и минимальное значения, размах, доверительные ин-

тервалы для среднего и многие другие описательные статистики. Здесь же предусмотрен широкий выбор критериев для тестирования нормальности распределения. Практически все описательные статистики могут быть вычислены для данных, разделенных на группы с помощью одной или нескольких группирующих переменных. Имеется возможность интерактивного удаления выбросов на графике, выделение и маркировка необходимых подмножеств на графике, сглаживание данных и другие возможности.

Корреляционные матрицы (Correlation matrices). Данная группа включает большое количество средств, позволяющих исследовать зависимости между пере-

менными путем вычисления практически всех общих мер зависимости (коэффициен-

тов корреляции).

t-критерии для зависимых и независимых выборок (t-test for independent and dependent samples). Эта группа процедур позволяет осуществить проверку истинно-

сти статистических гипотез относительно наблюдаемых случайных величин путем выполнения специальных тестов.

Таблицы частот (Frequency tables). Группа позволяют строить таблицы частот и гистограммы выбранных переменных. При этом значения переменных можно разбивать на классы и группировать произвольным образом.

227

7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …

Калькулятор вероятностных распределений (Probability calculator). Данная группа позволяет вычислить характеристики многих стандартных вероятностных распределений: нормального, хи-квадрат, Стьюдента, F-распределения и др.

Модуль Множественная регрессия (Multiple regression) включает в себя ис-

черпывающий набор средств множественной линейной и фиксированной нелинейной (в частности, полиномиальной, экспоненциальной, логарифмической и др.) регрессий, позволяющих вычислять неизвестные коэффициенты в заранее заданных пользователем регрессионных моделях.

Модуль Нелинейное оценивание (Nonlinear estimation) дает возможность оценить практически любые определенные пользователем нелинейные модели, осуществить подгонку к наблюдаемым данным кривой, по существу, любого типа. Важным преимуществом данного модуля, в отличие от других программ нелинейного оценивания, является то, что в нем не накладывается ограничения на размер об-

рабатываемого файла данных. Оценки коэффициентов нелинейной модели могут быть построены с помощью оценок метода наименьших квадратов, метода максимального правдоподобия или заданной пользователем функции потерь. Пользователь может выбрать одну из нескольких вычислительных процедур: квазиньютоновский метод, симплекс-метод и др. Кроме того, пользователь может сам определить любой тип нелинейной модели, набрав соответствующее уравнение в редакторе системы.

Модуль Дисперсионный анализ (ANOVA/MANOVA) дает возможность оце-

нить степень воздействия различных факторов на измеряемые данные и выделить среди них наиболее значимые (существенные). Для проверки основных предположений дисперсионного анализа имеется широкий выбор статистических процедур, в частности критерии Фишера, Кохрена, Бартлета и др.

Модуль Факторный анализ (Factor analysis) позволяет проводить факторный

анализ, основная цель которого заключается в том, чтобы выделить скрытые общие

факторы, т.е. воздействующие на все параметры объекта, а не на какой-то один параметр или группу. Выделяемые общие факторы определяют связи между наблю-

даемыми параметрами объекта.

Модуль Непараметрическая статистика и подгонка распределения

(Nonparametrics/Distribution) дает возможность сравнить распределение наблюдае-

мых величин с большим количеством различных теоретических распределений. Имеется возможность подогнать к данным нормальное, логнормальное, экспоненци-

228