Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Самостоятельная работа 1.docx
Скачиваний:
3
Добавлен:
23.11.2019
Размер:
961.92 Кб
Скачать

Исследование алгоритмов проверки гипотезы о выявлении аномальных измерений

Цель работы: реализация и исследование решающего правила проверки гипотезы о выявлении аномальных измерений.

В качестве объекта для исследования следует использовать нормально распределенную случайную величину .

Входные данные: параметры случайной величины (математическое ожидание и дисперсия), объем выборки , уровень значимости , значение (произвольно вводимое исследователем) для которой будет производится проверка гипотезы.

Следует рассмотреть двупороговую процедуру распознавания:

Пороговые коэффициенты можно реализовать в виде статического массива «зашитого» в программу или в виде внешнего файла (что более предпочтительно).

Для получения оценок математического ожидания и дисперсии объекта (так как они необходимы для вычисления статистики и дальнейшей ее проверки в решающем правиле) необходимо сгенерировать (с использованием одного из вышеописанных методов генерации нормально распределенных случайных величин) выборку объема и вычислить оценки по этой выборки. Рекомендуемый объем выборки .

Программный стенд, реализованный в рамках расчетно-графической работы, должен позволять исследователю (студенту в процессе выполнения работы и преподавателю в процессе приема работы у студента) вводить все выше перечисленные входные данные, выполнять одиночные проверки, а так же реализовывать исследование зависимости решающего правила проверки гипотезы о выявлении аномальных измерений от объема выборки и дисперсии объекта.

№3.

Исследование алгоритма проверки гипотезы об однородности ряда дисперсий

Цель работы: реализация и исследование решающего правила проверки гипотезы об однородности ряда дисперсий.

В качестве объектов для исследования следует использовать рад нормально распределенных случайных величин , ,…, .

Входные данные: параметры случайных величин (математические ожидания и дисперсии), объемы всех выборок одинаковые и равны , уровень значимости .

Следует рассмотреть однопороговую процедуру распознавания:

Пороговые коэффициенты можно реализовать в виде статического массива «зашитого» в программу или в виде внешнего файла (что более предпочтительно).

Для получения оценок математических ожиданий и дисперсий объектов (так как они необходимы для вычисления статистик и дальнейших проверок в решающем правиле) необходимо сгенерировать (с использованием одного из вышеописанных методов генерации нормально распределенных случайных величин) одномерных выборок объема . Рекомендуемый объем выборок .

Программный стенд, реализованный в рамках расчетно-графической работы, должен позволять исследователю (студенту в процессе выполнения работы и преподавателю в процессе приема работы у студента) вводить все выше перечисленные входные данные, выполнять одиночные проверки, а так же реализовывать исследование зависимости решающего правила проверки гипотезы о равенстве математических ожидании от объема выборки и дисперсий случайных величин , ,…, .

Исследование алгоритма проверки гипотезы о распределениях

Цель работы: реализация и исследование решающего правила проверки гипотезы о распределениях.

В качестве объекта для исследования следует использовать случайную величину .

Входные данные: закон распределения и параметры случайной величины (параметры зависят от закона) и предполагаемый закон распределения, объем выборки , уровень значимости , число интервалов для построения гистограммы по выборке.

Выборка генерируется по указанному закону для случайной величины (способ генерации зависит от ее закона).

Затем строится гистограмма и производится проверка гипотзы:

Программный стенд, реализованный в рамках расчетно-графической работы, должен позволять исследователю (студенту в процессе выполнения работы и преподавателю в процессе приема работы у студента) вводить все выше перечисленные входные данные, выполнять одиночные проверки, а так же реализовывать исследование зависимости решающего правила проверки гипотезы о распределении от объема выборки, количества интервалов в гистограмме.

4 Классификация в распознавании образов

№4 Исследование байесовского правила классификации в распознавании образов при непрерывных информативных признаках (условные плотности известны с точностью до параметров)

Цель работы: исследование решающего правила классификации при условиях:

  • Имеется два независимых непрерывных информативных признака и два класса ;

  • Априорные вероятности классов неизвестны;

  • Условные плотности вероятности (при условии истинности того или иного класса) для информативных признаков известны с точностью до параметров :

;

  • известна обучающая выборка объёма :

    • , когда истинным является класс 1;

    • , когда истинным является класс 2.

За основу берётся байесовское правило классификации с заменой в нём априорных вероятностей и условных плотностей вероятности их состоятельными оценками:

В результате решающая функция приобретает форму:

и в пороговом байесовском решающем правиле она сравнивается с нулём:

  • если , то принимается решение об истинности первого класса;

  • если же , то принимается решение об истинности второго класса.

По обучающей выборке доопределяются априорные вероятности:

и параметры условных плотностей , . Причём, первая группа оценок параметров находится по первой части обучающей выборки (когда истинным является класс 1), а вторая группа оценок параметров находится по второй части обучающей выборки (когда истинным является класс 2).

При исследовании построенного решающего правила (алгоритма работы классификатора) за счёт имитации статистических свойств объекта классификации необходимо получать обучающую выборку. Этот этап обычно осуществляется следующим образом. Исследователь по своему выбору задает статистические свойства объекта в виде структуры и параметров условных плотностей вероятности , априорных вероятностей классов и общего объема обучающей выборки .

Всё вышеперечисленное объединено в блок-схему последовательности выполнения операций, представленную на рисунке 4.1.

При составлении плана исследований студенты выделяют варьируемые переменные (плотности распределения, параметры) на фоне всех возможных переменных:

1 Структуры условных плотностей вероятности (например, равномерный, нормальный, экспоненциальный др. законы) для объекта классификации, параметры плотностей, априорные вероятности классов.

2 Структуры выбранных условных плотностей вероятности классификатора, алгоритмы расчёта оценок параметров этих плотностей и априорных вероятностей классов.

3 Объём обучающей выборки .

Затем конкретизируют структуры условных плотностей (это нечисловые, неупорядоченные дискретные переменные) и дискретные числовые значения соответствующих варьируемых параметров.

Для каждого набора указанных дискретных значений производится вычисление оценки вероятности ошибки классификации , где – число ошибочных решений классификатора на обучающей выборке. В итоге получается так называемый «куб данных», на основе которого строятся графики (обычно, двумерные и трёхмерные, хотя могут быть построены и более полные аналитические степенные квадратичные модели с помощью использования планов второго порядка) и дается им объяснение в соответствии с теорией классификации.