Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Моделирование систем_ЛАБ2.doc
Скачиваний:
14
Добавлен:
04.12.2018
Размер:
990.72 Кб
Скачать

Лабораторная работа №4. «Распознавание свойств в управлении качеством аис»

Постановка задачи. Основной целью решения за­дачи является получение студентами практических навыков в вы­явлении свойств функционирования АИС в ходе моделирования и экспериментального исследования, а также закрепление теоре­тических знаний, полученных в лекционном курсе.

Методом исследования служит кластерный анализ, реализуе­мый средствами программы кластер-анализа ППСА STADIA.

В экспериментальных исследованиях АИС всегда возникает задача выявления свойств моделируемого ИР, так как любое науч­ное исследование, в том числе процесс моделирования, невоз­можно выполнить без распознавания свойств изучаемого объекта. Сложность распознавания свойств обусловлена необходимостью выбора эффективного индикатора в конкретных условиях. Этот индикатор должен отображать наиболее полный состав свойств функционирования АИС и иметь возможность корректно распо­знавать состав существенных свойств АИС так, чтобы не потребо­валось привлекать значительные ресурсы в распознавании. Оче­видно то, что подобная противоречивость усложняет решение за­дачи.

В данной задаче наиболее эффективным индикатором свойств функционирования АИС является статистическая структура де­фектов функционирования АИС. Сбор и регистрация дефектов могут выполняться по различным компонентам АИС, например, по этапам технологического процесса обработки данных АИС. Подобная выборка дефектов имеет совокупность свойств, т.е. по сути, неоднородна. Устранение неоднородности предполагает выявление состава свойств, которыми обладает ис­следуемый технологический процесс.

Одним из методов решения подобных задач выступает класси­фикация данных выборки и выявление и/или уточнение сущест­венных свойств, характеризующих технологию АИС (см. ЛР №1). Разделение данных на классы производится по такому основа­нию, как мера близости (удаленности) каждого события (дефекта) или значение (набор значений) события, отображаемого на вре­менной, стоимостной и других шкалах.

В нашей задаче данные выборки представляют собой набор дефектов обработки документов. Каждый дефект описывается временем и стоимостью его обнаружения и исправления. Задача заключается в том, чтобы по двум переменным — времени и стоимости — провести разделение дефектов на классы и вы­явить на этой основе существенные свойства статистической структуры дефектов обработки документов. В реше­нии данной задачи классификация (группирование) данных выборки выполняется по критерию «мера близости (расстояния)» с применением средств кластерного анализа ППСА STADIA. В решении задач кластеризации имеется несколько мер близо­сти [3]; в нашей задаче наиболее приемлемо евклидово рас­стояние.

Задача решается с привлечением данных выборки дефектов по двум переменным, каждая из которых состоит из 20 чисел. Пере­численные ниже переменные xl и х2 отображают соответственно время (в минутах) и стоимость (в копейках) обнаружения и ис­правления дефектов:

xl:3, 11, 2460, 4, 13, 2952, 5, 14, 3444, 3, 12, 2450, 4, 13, 2952, 3, 12, 3440, 2, 15;

х2: 40, 143, 31900, 52, 169, 38100, 72, 185, 44700, 40, 156, 31800, 54, 165, 38100, 39, 156, 44500, 26, 190.

Основные этапы решения задачи. Решение задачи выполняется в несколько этапов.

1. Ввод данных статистической структуры дефектов. После загруз­ки ППСА STADIA посредством клавиатуры вводятся данные (значения каждой переменной) в столбцы xl и х2 электронной таблицы. Необходимо обеспечить точно такую же последователь­ность данных, в какой они даны в ЛР №3. Нарушение последова­тельности повлечет за собой некорректное решение задачи кластер-анализа.

2. Выполнение кластерного анализа статистической структуры де­фектов. Классификация статистической структуры дефектов проводится в следующей последовательности: 1) кликнуть меню «Статистика»; 2) в открывшемся подокне «Статистические мето­ды» в подполе «Многомерные методы» кликнуть кнопку «Q-кла-стерный», после чего появится подокно «Исходные данные»; 3) в меню «Исходные данные» кликнуть кнопку 1=переменные объекты; 4) в появившемся меню «Метрика вычисления расстояний» кликнуть кнопку «1=Евклид», после чего появится подокно «Объединяющая».

Если необходима гибкая стратегия кластеризации, в этом же меню следует предварительно устанавливать коэффициент Beta = —0,25. Поскольку в нашей задаче заранее неизвестно число кластеров, задача заключается именно в их определении. Если в субполе «Число кластеров» имеется цифра, ее нужно заменить на нуль. Затем в меню «Объединяющая» нужно кликнуть кнопку 1=ближайшего соседа, после чего на экране появится подполе «Confirm» с вопросом «Выдать таблицу расстояний?».

В подполе «Confirm» необходимо кликнуть кнопку Yes, после чего появится график, отражающий результаты кластеризации статистической структуры дефектов (рис. 4.1), в виде дендро-граммы объединения кластеров; в нашем случае — групп дефектов с однородными свойствами. По оси абсцисс указаны порядковые номера дефектов, которые они получили при вводе, т.е. номера строк электронной таблицы. По оси ординат указаны расстояния между дефектами в соответствии со шкалой расстояний, вычис­ленных по программе кластер-анализа.

Рис. 4.1. График (дендрограмма) результатов кластеризации дефектом

В состав результатов кластер-анализа входят также «Таблица расстояний» (рис. 4.2) и (на этом же экране ниже «Таблицы рас­стояний» под рубрикой «Кластеры») список объектов; в нашем случае — номера дефектов. Здесь указываются значения среднего внутрикластерного расстояния, по которому можно сравнивать варианты кластеризации текущих данных, и найден­ные кластеры с порядковыми номерами входящих в каждый кла­стер объектов (дефектов).

Рис. 4.2. «Таблица-расстояний» кластер-анализа дефектов

3. Анализ результатов кластеризации. Стратегия «ближайшего соседа» отчетливо выделяет три группы (класса) дефектов обработки доку­ментов. На минимальном расстоянии (примерно 15,03) произошло объединение дефектов 19, 7, 13,4, 10, 1, 16; на расстоянии пример­но 30,02 произошло объединение дефектов 20, 14, 8, 5, 17, 11, 2; на расстоянии примерно 4030 произошло объединение дефектов 18, 15,6,9. В последнюю третью группу дефектов отнесены дефекты 3 и 12. Их объединение произошло при расстоянии 11,18.

В нашей задаче первый кластер составили дефекты с минимальными значениями времени и стоимости, сформирован­ные прежде всего. При идентификации этих дефектов установлено, что они характеризуются наличием искажений символов (цифр, букв) в реквизитах документов, допущенных при выполнении тех­нологических операций с документами. Во второй кластер де­фектов вошли пропуски, или отсутствие элементов документов (рек­визитов-оснований), являющихся регламентом структуры того или иного документа. В третьем кластере объединены дефекты, ха­рактеризующиеся опозданием, несвоевременным представлением документов от этапа к этапу технологического процесса обработки данных, т.е. нарушением регламентных сроков представления доку­ментов. Эти три кластера дефектов можно обозначить соответствен­но как дефекты по достоверности, полноте и своевременности. Та­ким образом, выделяются три наиболее существенных признака (свойства) функционирования данной АИС в технологии обработ­ки документов. При использовании кластер-анализа в других АИС кластеры могут иметь и другие свойства.

Целесообразно провести более полный анализ влияния меры близости (удаленности) кластеров по шкале расстояний оси орди­нат графика дендрограммы. Например, дефекты достоверности отличаются наименьшим разбросом, на втором месте дефекты по полноте и далее дефекты по своевременности. Класс дефектов по полноте имеют меньшую удаленность от класса дефектов по дос­товерности, чем от класса дефектов по своевременности. Поэтому если дефекты по достоверности и полноте в организационно-тех­ническом отношении могут быть сравнительно просто локализо­ваны и устранены, то дефекты по своевременности исправить на­много труднее в силу того, что для этого необходим более широ­кий спектр организационно-технических мероприятий.

4. Формулирование выводов по результатам решения задачи. В выводах необходимо сформулировать место и значение анализа статисти­ческой структуры данных выборки на неоднородность; показать, какие пути и инструментальные средства могут быть использова­ны для решения этой задачи; отметить, какие критерии класси­фикации данных выборки могут быть применимы, и перечислить основные этапы кластеризации.

5. Составление и оформление отчета о решении задачи производятся после выполнения работ в полном объеме.

Варианты

Контрольные вопросы

  1. Назовите отличительные признаки дескриптивного и формализованного моделирования ИР

  2. Приведите классификацию математических моделей МИР

  3. Назовите системные требования к математическим моделям МИР

  4. Какие компоненты составляют кибернетическую модель ИР?

Лабораторная работа №5.