- •1. Общие требования
- •1.1. Требования по оформлению
- •1.2. Требования к реализации
- •1.3 Пример интерфейса пользователя
- •1.4 Выдача и прием заданий
- •2. Общая схема построения работы
- •2.1. Общий метод генерации непрерывных распределений
- •2.2. Генерация чисел, по нормальному закону с использованием центральной предельной теоремы
- •3. Статистическая проверка гипотез
- •Исследование алгоритмов проверки гипотезы о математическом ожидании
- •Исследование алгоритмов проверки гипотезы о дисперсиях
- •Исследование алгоритмов проверки гипотезы о равенстве математических ожиданий
- •Исследование алгоритмов проверки гипотезы о выявлении аномальных измерений
- •Исследование алгоритма проверки гипотезы об однородности ряда дисперсий
- •Исследование алгоритма проверки гипотезы о распределениях
- •№5 Исследование байесовского правила классификации в распознавании образов при непрерывных информативных признаках (условные плотности известны с точностью до параметров) и без обучающей выборки.
- •5. Планирование эксперимента Исследование алгоритмов построения степенных моделей с использованием ортогональных планов первого и второго порядков
№5 Исследование байесовского правила классификации в распознавании образов при непрерывных информативных признаках (условные плотности известны с точностью до параметров) и без обучающей выборки.
Цель работы: исследование решающего правила классификации при условиях:
Имеется два независимых непрерывных информативных признака и неизвестно сколько классов;
Априорные вероятности классов неизвестны;
Все условные плотности вероятности (при условии истинности того или иного класса) для информативных признаков одинаковы и известны с точностью до параметров :
;
обучающая выборка неизвестна. Имеется обыкновенная выборка объёма .
Как видно из условий задача очень похожа на уже рассмотренную в пункте 4.1 задачу, но эта ситуация более сложная и к тому же более распространенная на практике Необходимо построить самообучающуюся систему классификации.
Рассмотрим один из вариантов.
П о количеству максимумов мы можем определить количество классов.
По количеству минимумов и их положению мы можем определить границы классов, что позволит произвести разбиение исходной выборки на две части и тем самым свести практически свести ситуацию к задаче, описанной в пункте 4.1.
Далее строится процедура последовательного (итерационного) расчета порога (в многомерном случае – разделяющей поверхности) . Например, задается нулевое приближение порога . Оно разбивает исходную выборку (по которой оценивалась безусловная плотность на две части. Выборка становится обучающей. По ней (как было рассмотрено выше) оцениваются условные взвешенные плотности и , а следовательно, решающая функция и новое приближение порога (разделяющей поверхности) и т. д.
Возможны и другие пути самообучения.
Например для моделирования этой ситуации вы можете взять два класса ( = 2), один информативный признак и условные плотности , – это нормальные законы распределения:
, .
Если законы имеют одинаковую единичную дисперсию и отличаются математическими ожиданиями: = 0, = 4, то итоговые плотности распределения информативного признака при различных значениях априорных вероятностей классов и приведены на рис. 4.3.
При реализации расчетно-графической работы необходимо варьировать: количество классов, математические ожидания и априорные вероятности классов.
Для наглядной демонстрации реализованная программа должна выводить графики похожие на те, что приведены на рисунке 4.3.
5. Планирование эксперимента Исследование алгоритмов построения степенных моделей с использованием ортогональных планов первого и второго порядков
Цель работы: исследование алгоритмов планирования эксперимента при построении степенных моделей первого и второго порядка.
Объект исследования (рисунок. 5.1) имеет два входа и один выход . Основная проблема планирования эксперимента состоит в создании таких планов покачивания входных переменных (при снятии экспериментальных данных [ ] с объекта), которые обеспечивают более быстрое и точное построение модели объекта. Выход объекта состоит из неизвестного сигнала (здесь – неизвестная функции от входов, называемая поверхностью отклика) и центрированной аддитивной помехи ( ).
Модель первого порядка:
,
Модель второго порядка:
Здесь – базовая точка.
Измерения выхода объекта некоррелированные равноточные.
Расчёт параметров моделей первого и второго порядков в безразмерных переменных проводится по методу наименьших квадратов.
№6 Построение линейной модели.
Итак, модель имеет вид:
Экспериментальные точки для входных координат зададим в вершинах гиперпрямоугольника. Точки такого плана для показаны в верхней части рис. 5.2. Эти точки равномерно распределены относительно известной базовой точки .
Интервалы покачивания относительно базовой точки задаются экспериментатором, и они определяют область изучения объекта. Для этой области и строится линейная модель.
С целью унификации процедур построения планов, исследования их свойств, расчета параметров и исследования качества модели осуществляется переход от размерных входных переменных к безразмерным :
.
Точки плана в вершинах прямоугольника (верхняя часть рисунка 4) в новых координатах оказываются в вершинах квадрата с единичными координатами (нижняя часть рисунка. 5.2). Центр плана переходит в начало координат. Полученный план представлен в табл. 5.1. В этом плане кроме безразмерных входных переменных , введены столбец фиктивной переменной и столбец измерений выхода объекта в каждой точке плана. Фиктивный столбец состоит из +1 и служит для симметрии расчета всех коэффициентов модели. Для упрощения записи плана единица опускается и указывается только знак единичной координаты.
Таблица
5.1
|
|
|
|
|
1 |
+ |
+ |
+ |
|
2 |
+ |
– |
+ |
|
3 |
+ |
+ |
– |
|
4 |
+ |
– |
– |
|
В новых безразмерных координатах линейная модель также сохраняет линейный вид:
Из этого уравнения следует алгоритм расчета коэффициентов по коэффициентам :
Параметры модели рассчитаем по критерию наименьших квадратов
предполагая, что измерения выхода некоррелированные и равноточные с дисперсией . Из этого критерия следует система линейных алгебраических уравнений:
,
,
.
Здесь – столбцы матрицы планирования, включая фиктивный столбец , состоящий из "плюс единиц", – столбец измерений выхода объекта; и – скалярные произведения столбцов матрицы планирования:
Если реализован план, представленный в табл. 5.1, то векторы-столбцы взаимно ортогональны, т. е. . Система уравнений распадается на независимые уравнения, из которых вычисляются параметры модели:
Здесь учтено, что скалярные произведения векторов самого на себя одинаковы и равны количеству измерений.
Корреляционная матрица для параметров, удовлетворяющих критерию наименьших квадратов, равна матрице, обратной матрице системы алгебраических уравнений для :
= =
= =
= =
= .
Параметры некоррелированные и дисперсия их одинакова:
.
Дисперсия выхода линейной модели
, .
одинакова на равном расстоянии от центра плана, т. е. ортогональный план первого порядка является и ротатабельным.
Проверим адекватность модели. Вычисляем остаточную сумму квадратов , делим ее на число степеней свободы и получаем остаточную дисперсию (дисперсию адекватности):
.
Здесь – выход объекта в -й точке эксперимента, – выход модели в той же точке. При хорошем описании с помощью модели сигнальной части выхода объекта остаточная дисперсия оценивает дисперсию выхода объекта.
Плохо, что у остаточной дисперсии только одна степень свободы . Вынести гарантированное решение с помощью такой «плохой» оценки нельзя. Для улучшения итогового решения об адекватности модели надо увеличить число степеней свободы оценки за счёт проведения в каждой точке плана нескольких (3–5) измерений. Коррекцию формул расчёта проведите самостоятельно.
На основе дополнительного эксперимента объема в центре плана строим оценку для дисперсии выхода объекта. Число степеней свободы для оценки равно величине .
Далее по статистике Фишера проверяется гипотеза о равенстве дисперсий. Эта гипотеза совпадает с гипотезой об адекватности модели. Если статистика не превосходит порогового значения , то принимается гипотеза об адекватности модели. В противоположном случае эта гипотеза отвергается. Тогда надо заново строить модель, например, усложняя ее за счет введения дополнительных факторов, либо отказываться от линейной модели и переходить к построению квадратичной модели.
Блок схема последовательности выполнения операций приведена на рис. 5.3.
При построении более сложной квадратичной модели 2-го порядка
Используем композиционный ортогональный (при этом ) план Бокса – Уилсона – см. таблицу 5.2. Здесь же показана замена столбцов с квадратичными переменными , соответствующими столбцами , .
Все элементы каждого столбца , отличаются от соответствующих элементов столбцов , на свою постоянную величину (среднее арифметическое):
Таблица 5.2
|
|
|
|
|
|
|
|
|
1 |
+ |
+ |
+ |
+ |
+ |
+ |
|
|
2 |
+ |
– |
+ |
– |
+ |
+ |
|
|
3 |
+ |
+ |
– |
– |
+ |
+ |
|
|
4 |
+ |
– |
– |
+ |
+ |
+ |
|
|
5 |
+ |
+ |
0 |
0 |
+ |
0 |
|
|
6 |
+ |
– |
0 |
0 |
+ |
0 |
|
|
7 |
+ |
0 |
+ |
0 |
0 |
+ |
|
|
8 |
+ |
0 |
– |
0 |
0 |
+ |
|
|
9 |
+ |
0 |
0 |
0 |
0 |
0 |
|
|
В новых переменных все столбцы , , , , , ортогональны.
С учетом новых переменных имеем следующее уравнение модели:
.
Здесь .
План реализуется на объекте – см. таблицу 5.3. Например, в точке 5 плана , , что соответствует реальным входным переменным: , . Реализуем эти значения входов на объекте и измеряем значение выходной переменной .
Таблица 5.3
|
|
|
|
|
|
|
|
1 |
+ |
+ |
+ |
+ |
|
|
|
2 |
+ |
– |
+ |
– |
|
|
|
3 |
+ |
+ |
– |
– |
|
|
|
4 |
+ |
– |
– |
+ |
|
|
|
5 |
+ |
+ |
0 |
0 |
|
|
|
6 |
+ |
– |
0 |
0 |
|
|
|
7 |
+ |
0 |
+ |
0 |
|
|
|
8 |
+ |
0 |
– |
0 |
|
|
|
9 |
+ |
0 |
0 |
0 |
|
|
|
Параметры в силу ортогональности плана вычисляются независимо (так же как и при использовании ортогонального плана первого порядка):
,
, ,
,
, .
Параметры некоррелированные и дисперсии их различны:
, , , .
В заключение остается пересчитать коэффициент
,
который оценивает сигнальную часть выхода объекта в центре плана.
В итоге построена модель второго порядка:
, , ,
, , .
Адекватность модели проверяется по той же схеме, как и для линейной модели. Соответствующие формулы выпишите самостоятельно.
Блок схема последовательности выполнения операций при построении квадратичной модели приведена на рис. 5.4.
На рисунке 5.5 приведена блок-схема последовательности выполнения операций при имитации объекта.
Интенсивность помехи берётся по отношению к интенсивности сигнальной части. Показатели интенсивности и относительную величину интенсивностей Вы должны выбрать самостоятельно и использовать при установлении соответствующих закономерностей.
Приведённые ранее блок-схемы помогут Вам составить и выполнять план исследований.