Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория систем и системный анализ.doc
Скачиваний:
114
Добавлен:
15.11.2018
Размер:
1.69 Mб
Скачать
      1. Агрегаты-операторы

Одна из наиболее частых ситуаций, требующих агрегирования, состоит. в том, что совокупность данных, с которыми приходится иметь дело, слишком многочисленна, плохо обозрима, с этими данными трудно "работать". Именно интересы работы с многочисленной совокупностью данных приводят к необходимости агрегирования. В данном случае на первый план выступает такая особенность агрегирования, как уменьшение размерности: агрегат объединяет части в нечто целое, единое, отдельное.

Простейший способ агрегирования состоит в установлении отношения эквивалентности между агрегируемыми элементами, т.е. образования классов. Это позволяет говорить не только о классе в целом, но и о каждом его элементе в отдельности.

Можно рассматривать различные задачи, связанные с классификацией и ее использованием. Приведем примеры таких задач: классификация как самая простая, самая первая, "атомарная" форма моделирования (это проблематика философии и психологии); элемент как .представитель класса (совсем не простой вопрос; так, в теории случайных процессов это приводит к проблеме эргодичности); искусственная классификация и природная кластеризация (т.е. образование классов "для удобства" и естественная общность определенных явлений, возможные соотношения, между ними; например, созвездия - первое или второе или отчасти то и другое?); иерархическая и фасетная (сетевая) классификация и т.д. Классификация является очень важным и многофункциональным, многосторонним явлением в человеческой практике вообще и в системном анализе в частности. С практической точки зрения одной из важнейших является проблема определения, к какому классу относится данный конкретный элемент. Обсудим ее подробнее.

      1. Классификация как агрегирование

Если признак принадлежности к классу является непосредственно наблюдаемым, то кажется, что особых трудностей классификации нет. Однако и в этих случаях на практике возникает вопрос о надежности, правильности классификации. Например, разложить окрашенные куски картона по цветам - трудная задача даже для ученых-психологов: отнести ли оранжевый кусок к "красным" или "желтым", если между ними нет других классов? По одежде военных можно определить не только, к какому государству они принадлежат, но и в каком роде войск служат, в каком чине состоят и т.д. Но эту четкость и однозначность враг может

использовать, переодевая своих диверсантов в форму противника, и тогда распознавание "своих" от "чужих" осуществляется с помощью других признаков. Если же непосредственно наблюдаемый признак принадлежности к классу формулируется на естественном языке, то, как известно, некоторая неопределенность (расплывчатость) становится неизбежной (например, кого отнести в класс "высоких людей"? - см. § 6.3 и 7.8).

Сложности классификации резко возрастают, если признак классификации не наблюдается непосредственно, а сам является агрегатом косвенных признаков. Типичным примером является диагностика заболевания по результатам анамнеза: диагноз болезни (ее название есть имя класса) представляет собой агрегат большой совокупности ее симптомов и характеристик состояния организма. Если классификация имеет природный характер, то агрегирование косвенных признаков может рассматриваться как обнаружение закономерностей в таблицах экспериментальных данных [4; б], т.е. как поиск устойчивых, достаточно часто повторяющихся в обучающей выборке "сцеплений" признаков (см. § 6.4 и 7.7). При этом приходится перебирать все возможные комбинации признаков с целью проверки их повторяемости в обучающей» выборке (например, в таблице, строки которой соответствуют данным предварительных опроса и анализов для каждого пациента). Вообще, метод перебора вариантов - самый очевидный, простой и надежный способ поиска решения. Несмотря на трудоемкость, его нередко с успехом применяют. Т. Эдисон утверждал, что перебор - его основной метод изобретательской деятельности (хотя, скорее всего, это была шутка). Метод Ф. Цвикки морфологического анализа систем [8], машинное обнаружение закономерностей [5; 6; 7б], дискретные задачи оптимизации-уже не шуточные, а типичные примеры использования перебора. Однако уже при совсем небольшом количестве признаков полный перебор становится нереальным даже при использовании ЭВМ. Успех в значительной степени зависит от того, удастся ли найти метод сокращения перебора, приводящий к "хорошим" решениям, и разработке таких методов посвящено значительное количество исследований.

Все сказанное свидетельствует о том, что агрегирование в классы является эффективной, но далеко не тривиальной процедурой. Если представлять класс как результат действия агрегата-оператора, то такой оператор имеет вид "ЕСЛИ <условия на агрегируемые признаки>, ТО <имя класса>". Как было отмечено, иногда класс непосредственно задается совокупностью признаков, а в ряде случаев, наоборот, требуется доопределить оператор, выявив экспериментально, при каких условиях на признаки объект будет принадлежать заданному классу.