Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория систем и системный анализ.doc
Скачиваний:
114
Добавлен:
15.11.2018
Размер:
1.69 Mб
Скачать
    1. 6.5. Регистрация экспериментальных данных и ее связь с последующей их обработкой

Результаты любого эксперимента фиксируют в той или иной форме, а затем используют для той цели, ради которой и проводился эксперимент. Иногда эти операции практически совмещены во времени, например при автоматическом управлении производственным процессом, при автоматизации экспериментов в реальном масштабе времени и т.п. В некоторых же видах человеческой практики (научные исследования;

системный анализ; контрольная, ревизионная, следственная и другие виды административной деятельности; учебные эксперименты и пр.) обработка экспериментальных данных является отдельным, самостоятельным этапом, промежуточным между этапами получения информации (измерения) и ее использования (принятия решений и их выполнения) . В таких случаях исходной информацией для обработки являются протоколы наблюдений (называемые также матрицами данных, экспериментальными таблицами).

Характер самих протоколов наблюдений и методы их обработки зависят от того, какова модель, для уточнения которой ставится эксперимент: фактически обработка данных - это просто преобразование информации к виду, удобному для использования, перевод ответов природы с языка измерений на язык уточняемой модели. Наши знания могут быть как первоначальными, грубыми, так и далеко продвинутыми, хорошо структурированными, хотя и требующими уточнения. Соответствующие два типа моделей разные авторы называют по-разному, в зависимости от того, какой их аспект они хотят подчеркнуть: дескриптивные и конструктивные, качественные и количественные, декларативные и процедуральные, классификационные и числовые. Мы в данном параграфе будем пользоваться последними терминами; отметим, что в них отражено и то различие, что классификационные модели описывают множество различных объектов, а числовые - один объект (или множество схожих объектов). Отметим также, что в классификационной модели могут участвовать количественные переменные, и это не меняет ее качественного характера (например, диагноз больному ставится с учетом количественных анализов); аналогично, в числовых моделях часть переменных может измеряться в слабых шкалах. Рассмотрим кратко особенности экспериментальных данных и их обработки для обоих типов моделей.

      1. Классификационные модели

Классификационные модели являются основополагающими, первичными, исходными формами знания. Узнавание окружающих предметов -типичный пример классификационных процессов в мыслительной деятельности человека (и животных). И в науке познание начинается с соотнесения изучаемого объекта с другими, выявления сходства и различия между ними. Поэтому протокол наблюдений на классификационном уровне эксперимента содержит результаты измерения ряда признаков Х для подмножества А объектов, выбранных из множества : каждый объект аi А обладает значениями признаков хi=(хi0, ... , хin) {X0, ... , Xn}=X, i=1, ... , N, n - число признаков, N -число объектов в А. Признак характеризует конкретное свойство объекта, поэтому иногда такой протокол называют таблицей "объект - свойство".

Как уже отмечалось, способ обработки протокола зависит от цели обработки. Часто оказывается, что задача может быть сформулирована как определение по наблюдавшимся значениям признаков х=(х1, ... , хn) значений ненаблюдаемого ("целевого") признака хg. Как правило, целевыми признаками являются те параметры модели, которые требуется уточнить по экспериментальным данным.

Рассмотрим различные типы задач для классификационных моделей.

Кластеризация (поиск "естественной" группировки объектов). Не заданы ни границы классов в пространстве признаков, ни число классов. Требуется их определить исходя из "близости", "похожести" или "различия" описаний объектов хi=(хi1, ... , хin). Компоненты вектора Хо-признаки кластера, значения которых подлежат определению.

Классификация (распознавание образов). Число классов задано. Если также заданы границы между классами, то имеем априорную классификацию; если границы требуется найти, оценить по классифицированным примерам, то задача называется распознаванием, образов по обучающей выборке. Целевой признак Х0 имеет значения в номинальной шкале (имена классов).

Упорядочивание объектов. Требуется установить отношения порядка между х10, ... , хN0 , (или некоторой их частью) по определенному критерию предпочтения.

Уменьшение размерности модели. Классификационные модели как первоначальные, "сырые", учитывают множество предположений, которые еще надо проверять. Так, сам список признаков Х формируется эвристически, часто "с запасом", и оказывается довольно длинным, а главное, избыточным, содержащим "дублирующие" и "шумящие" признаки. Поэтому одна из важных задач совершенствования классификационных моделей состоит в уменьшении размерности модели с помощью отбора наиболее информативных признаков, "склеивания" нескольких признаков в один и т.п. Как следует из практики, информативные признаки могут оказаться различными для разных классов [З].