- •ОГЛАВЛЕНИЕ
- •ПРЕДИСЛОВИЕ
- •1. ЭКСПЕРИМЕНТ КАК ПРЕДМЕТ ИССЛЕДОВАНИЯ
- •1.1. Понятие эксперимента
- •1.2. Классификация видов экспериментальных исследований
- •2.1. Случайные величины и параметры их распределений
- •2.2. Нормальный закон распределения
- •3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
- •3.2. Оценивание с помощью доверительного интервала
- •3.2.2. Построение доверительного интервала для дисперсии
- •3.3. Статистические гипотезы
- •3.4. Отсев грубых погрешностей
- •3.4.1. Критерий Н.В. Смирнова
- •3.4.2. Критерий Диксона
- •3.5. Сравнение двух рядов наблюдений
- •3.5.1. Сравнение двух дисперсий
- •3.5.2. Проверка однородности нескольких дисперсий
- •3.7. Преобразование распределений к нормальному
- •4.1. Характеристика видов связей между рядами наблюдений
- •4.2. Определение коэффициентов уравнения регрессии
- •4.3. Определение тесноты связи между случайными величинами
- •4.4. Линейная регрессия от одного фактора
- •4.5. Регрессионный анализ
- •4.5.1. Проверка адекватности модели
- •4.5.2. Проверка значимости коэффициентов уравнения регрессии
- •4.6. Линейная множественная регрессия
- •4.7. Нелинейная регрессия
- •5. ОЦЕНКА ПОГРЕШНОСТЕЙ РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ
- •5.1. Оценка погрешностей определения величин функций
- •5.2. Обратная задача теории экспериментальных погрешностей
- •5.3.Определение наивыгоднейших условий эксперимента
- •6. МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТОВ. ЛОГИЧЕСКИЕ ОСНОВЫ
- •6.1. Основные определения и понятия
- •6.2. Пример хорошего и плохого эксперимента
- •6.3. Планирование первого порядка
- •6.3.1. Выбор основных факторов и их уровней
- •6.3.2. Планирование эксперимента
- •6.3.3. Определение коэффициентов уравнения регрессии
- •6.3.4. Статистический анализ результатов эксперимента
- •6.3.5. Дробный факторный эксперимент
- •6.4. Планы второго порядка
- •6.4.1. Ортогональные планы второго порядка
- •6.4.2. Ротатабельные планы второго порядка
- •6.5.1. Метод покоординатной оптимизации
- •6.5.2. Метод крутого восхождения
- •6.5.3. Симплексный метод планирования
- •7.1. Общие замечания
- •7.2. Статистические функции Microsoft Excel
- •7.3. Краткое описание системы STATISTICA
- •7.3.1. Общая структура системы
- •7.3.2. Возможные способы взаимодействия с системой
- •7.3.3. Ввод данных
- •7.3.4. Вывод численных и текстовых результатов анализа
- •7.3.5. Статистические процедуры системы STATISTICA
- •7.3.6. Структура диалога пользователя в системе STATISTICA
- •7.3.7. Примеры использования системы STATISTICA
- •СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
- •ПРИЛОЖЕНИЕ
7.КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …
7.3.3.Ввод данных
Данные в STATISTICA организованы в виде электронной таблицы – Spreadsheet. Они могут содержать как численную, так и текстовую информацию. Данные в электронной таблице могут иметь различные форматы (например, даты, времени и др.). Электронные таблицы в STATISTICA поддерживают различные типы операций с данными, такие как: операции с использованием буфера обмена WINDOWS, операции с выделенными блоками значений (аналогично MS Excel).
Ввести данные в электронную таблицу можно одним из следующих способов. Непосредственно ввести их в электронную таблицу с клавиатуры. Для автоматизации ручного ввода данных в STATISTICA имеются развитые инструментальные
средства.
Вычислить новые данные на основе уже введенных данных при помощи фор-
мул, которые можно задать в электронной таблице. При этом имеется возможность быстрого доступа к большому количеству специализированных статистических функций, допускается использование логических операторов.
Воспользоваться данными, подготовленными в другом приложении. При этом доступны следующие способы ввода данных из других приложений STATISTICA:
•операции копирования данных через буфер обмена WINDOWS;
•импорт данных из наиболее популярных приложений, например электронных таблиц, систем управления базами данных и др.;
•использование механизма динамической связи DDE между данными в STATISTICA и другим WINDOWS приложением. В этом случае все изменения данных, внесенные позднее в источник (WINDOWS приложение), будут автоматически (динамически) отражены в файле исходных данных для системы
STATISTICA.
На любом этапе ввода данных система STATISTICA позволяет быстро вычис-
лить основные статистические характеристики данных, отобразить их графически и
перейти к статистическому анализу.
225
7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …
7.3.4. Вывод численных и текстовых результатов анализа
Численные результаты статистического анализа в системе STATISTICA выводятся в виде специальных электронных таблиц, которые называются таблицами вывода результатов – Scrollsheet. Таблицы Scrollsheet могут содержать любую информацию (как численную, так и текстовую) размером от короткой строчки до нескольких мегабайтов.
STATISTICA содержит большое количество инструментов для просмотра результатов статистического анализа и их визуализации. Они включают в себя стандартные операции по редактированию таблицы (вставка, удаление, операции над блоками, автозаполнение блоков и др.), операции просмотра (подвижные границы столбцов, разделение прокрутки в таблице и др.), доступ к основным статистикам и графическим возможностям системы STATISTICA. При выводе целого ряда резуль-
татов (например, корреляционной матрицы) STATISTICA отмечает значимые коэффициенты корреляции цветом. Пользователь имеет возможность выделить при помощи цвета необходимые значения в таблице Scrollsheet.
Если пользователю необходимо провести детальный статистический анализ промежуточных результатов, то можно сохранить таблицу Scrollsheet в формате файла STATISTICA и далее работать с ним, как с обычными данными.
Кроме вывода результатов анализа в виде отдельных окон с графиками и таблицами Scrollsheet, в системе имеется возможность создания отчета, в окно которого может быть выведена вся эта информация – это документ (в формате RTF), который может содержать любую текстовую или графическую информацию. В STATISTICA имеется возможность автоматического создания отчета, так называемого автоотчета. При этом любая таблица Scrollsheet или график могут автоматически быть направлены в отчет.
7.3.5. Статистические процедуры системы STATISTICA
Статистические процедуры системы STATISTICA, как уже было отмечено,
сгруппированы в нескольких специализированных статистических модулях (рис. 7.3).
В каждом модуле можно выполнить определенный способ обработки, не обращаясь
кпроцедурам из других модулей. Ниже приводится краткое описание отдельных ста-
тистических модулей, знакомство с которыми поможет инженеру-исследователю в
226
7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …
его практике для профессиональной обработки, анализа и представления результатов эксперимента (промышленного, лабораторного, вычислительного и др.).
Модуль Основные статистики и таблицы (Basic Statistics/Tables) включает в себя следующие группы статистических процедур:
Описательные статисти-
ки (Descriptive statistics). Группа производит вычисление практически всех описательных статистик, среднее арифметическое, выборочную дисперсию, стандартное
отклонение, медиану, моду, максимальное и минимальное значения, размах, доверительные ин-
тервалы для среднего и многие другие описательные статистики. Здесь же предусмотрен широкий выбор критериев для тестирования нормальности распределения. Практически все описательные статистики могут быть вычислены для данных, разделенных на группы с помощью одной или нескольких группирующих переменных. Имеется возможность интерактивного удаления выбросов на графике, выделение и маркировка необходимых подмножеств на графике, сглаживание данных и другие возможности.
Корреляционные матрицы (Correlation matrices). Данная группа включает большое количество средств, позволяющих исследовать зависимости между пере-
менными путем вычисления практически всех общих мер зависимости (коэффициен-
тов корреляции).
t-критерии для зависимых и независимых выборок (t-test for independent and dependent samples). Эта группа процедур позволяет осуществить проверку истинно-
сти статистических гипотез относительно наблюдаемых случайных величин путем выполнения специальных тестов.
Таблицы частот (Frequency tables). Группа позволяют строить таблицы частот и гистограммы выбранных переменных. При этом значения переменных можно разбивать на классы и группировать произвольным образом.
227
7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …
Калькулятор вероятностных распределений (Probability calculator). Данная группа позволяет вычислить характеристики многих стандартных вероятностных распределений: нормального, хи-квадрат, Стьюдента, F-распределения и др.
Модуль Множественная регрессия (Multiple regression) включает в себя ис-
черпывающий набор средств множественной линейной и фиксированной нелинейной (в частности, полиномиальной, экспоненциальной, логарифмической и др.) регрессий, позволяющих вычислять неизвестные коэффициенты в заранее заданных пользователем регрессионных моделях.
Модуль Нелинейное оценивание (Nonlinear estimation) дает возможность оценить практически любые определенные пользователем нелинейные модели, осуществить подгонку к наблюдаемым данным кривой, по существу, любого типа. Важным преимуществом данного модуля, в отличие от других программ нелинейного оценивания, является то, что в нем не накладывается ограничения на размер об-
рабатываемого файла данных. Оценки коэффициентов нелинейной модели могут быть построены с помощью оценок метода наименьших квадратов, метода максимального правдоподобия или заданной пользователем функции потерь. Пользователь может выбрать одну из нескольких вычислительных процедур: квазиньютоновский метод, симплекс-метод и др. Кроме того, пользователь может сам определить любой тип нелинейной модели, набрав соответствующее уравнение в редакторе системы.
Модуль Дисперсионный анализ (ANOVA/MANOVA) дает возможность оце-
нить степень воздействия различных факторов на измеряемые данные и выделить среди них наиболее значимые (существенные). Для проверки основных предположений дисперсионного анализа имеется широкий выбор статистических процедур, в частности критерии Фишера, Кохрена, Бартлета и др.
Модуль Факторный анализ (Factor analysis) позволяет проводить факторный
анализ, основная цель которого заключается в том, чтобы выделить скрытые общие
факторы, т.е. воздействующие на все параметры объекта, а не на какой-то один параметр или группу. Выделяемые общие факторы определяют связи между наблю-
даемыми параметрами объекта.
Модуль Непараметрическая статистика и подгонка распределения
(Nonparametrics/Distribution) дает возможность сравнить распределение наблюдае-
мых величин с большим количеством различных теоретических распределений. Имеется возможность подогнать к данным нормальное, логнормальное, экспоненци-
228