Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shporki.doc
Скачиваний:
9
Добавлен:
17.12.2018
Размер:
261.12 Кб
Скачать

30. Пример обучения символьной системы методом индукции.

Индуктивное определение вводит понятие, объемом которого является множество объектов. Оно состоит из трех частей:

1. Задание начального базового множества объектов, входящих в объем определяемого понятия.

2. Описание способа конструирования новых объектов для пополнения объема из уже заданных объектов.

3. Заключительное утверждение, говорящее, что в определяемое множество входят только те элементы, которые получаются применением пунктов 1 и 2.

4. Определение S - выражения:Каждый атом - S - выражение

1. Если a 1 и a 2 - S - выражения, то точечная пара (a 1 . a 2) - тоже S - выражение (a 1 и a 2 - метапеременные, которые служат для обозначения объектов).

2. S - выражениями являются только те объекты, которые получаются на основе пунктов 1 и 2.

Примеры S - выражений: 15, А, А15, В%-, (А . В), (А . (В . С)).Представление S - выражений в виде деревьев и в виде сот - ячеек

Графически S – выражения можно представлять деревьями: точечная пара задает разветвление. Например:

a) (a . b) b) (a . (b . c)) c) ((a . b) . c)

В памяти ЭВМ S – выражениями представляются записями (cons-ячейками), имеющими два поля, которые называются CAR и CDR соответственно. Их тип – указатель на cons-ячейку или строку символов. Т.о., это запись с вариантами. Наши примеры:

S - выражениями мы можем представить упорядоченные последовательности произвольной длинны. Например, последовательность <m1, m2,… mn> будет иметь вид (m1 . (m2 . (… (mn . NIL)… ))).

Здесь атом NIL служит для обозначения конца последовательности. Такие последовательности, элементами которых могут быть тоже последовательности, называют списками (Для краткости приведенный выше список будем записывать в виде (m1, m2 , … mn) ). По существу множество списков является подмножеством S - выражений. Если S - выражение является списком, то его можно переписать в более удобном виде, используя следующие правила: 1) Если точка стоит перед открывающейся скобкой, то она опускается вместе с соответствующими закрывающимися скобками. Например: (a . (b . (c . nil))) преобразуется в (a b . (c . nil)) и далее в (a b c . nil) 2)Если точка стоит перед атомом nil, то они опускаются. В соответствие с этим правилом наше выражение примет вид: (a b c)

Более сложный пример: (a . ((с . (d . nil)) . (b . nil))) Будем удалять точки слева направо: (a (с . (d . nil)) . (b . nil)) (a (с d . nil) . (b . nil)) (a (с d . nil) b . nil)

Теперь удалим два вхождения . nil и получим список (a (с d) b).

31. Методы интеллектуального анализа данных.

Типовые задачи для методов интеллектуального анализа данных (прогнозирование, маркетинговый анализ, анализ работы персонала, анализ эффективности, профилирование клиентов, оценка потенциальных клиентов, анализ результатов маркетинговых исследований, анализ работы региональных отделений компании, сравнительный анализ конкурирующих фирм). Стандартные типы закономерностей, которые позволяют выявлять методы Data Mining (ассоциация, последовательность, классификация, кластеризация, прогнозирование). Классы систем интеллектуального анализа данных (предметно-ориентированные аналитические системы, статистические пакеты, нейронные сети, системы рассуждений на основе аналогичных случаев, деревья решений, эволюционное программирование, генетические алгоритмы, алгоритмы ограниченного перебора).

В регрессионном анализе критериальный показатель z рассматривается как «зависимая» переменная (как правило, ранговая или количественная), которая выражается функцией от «независимых» признаков хь..., хр. Линейная функция множественной регрессии записывается след. образом:

w0 называется свободным членом, а элементы весового вектора w=(wi,...,wp)T называются коэффициентами регрессии. Для оценки эффективности регрессионного уравнения вводится вектор остатков £ = (sn...,&N) , который отражает влияние на z-совокупности неучтенных случайных факторов либо меру достижимой аппроксимации значений Z;.

Различают два подхода к определению параметров уравнения множественной регрессии в зависимости от происхождения матрицы данных. В первом случае считается, что признаки детерминированы и случайной величиной является только зависимая переменная z. Во втором подходе предполагается, что и независимые признаки х* и z — случайные величины, имеющие совместное распределение. В такой ситуации оценка уравнения регрессии есть оценка условного математического ожидания случайной величины z от случайных величин Xi.

Методы сравнения с образцом.

В методах данной группы объекты рассматриваются как прецеденты и исследуется только одна операция - определение сходства (различия) этих прецедентов с неизвестным объектом. Сходство (различие) выражается геометрически через расстояние в р-мерном пространстве признаков.

Метод сравнения с прототипом

Применяется тогда, когда классы объектов отображаются в пространстве признаков компактными геометрическими группировками. В таком случае обычно в качестве точки-прототипа выбирается центр геометрической группировки класса (или ближайший к центру объект), определяемый как

Z=(x1+...+хNi),

Где Nj- количество объектов в классе п\.

В качестве меры близости могут применяться различные меры расстояний, например, квадрат евклидова расстояния.

Так как хтх не зависит от класса, то этот член можно из приведенного выражения исключить. Тем самым, умножив оставшуюся часть на -1/2, получим правило классификации, эквивалентное линейной решающей функции

yi(x)=xtzi-l/2(ziTzi).

Статическая классификация

Предполагается, что известны "эталонные" значения вектора состояния -^эт'' заведомо принадлежащие каждому из рассматриваемых классов Sfc состояний объекта и выступающие в качестве "центров" этих классов. Пусть, кроме того, известны плотности распределения вероятностей fyX/S^J вектора X при условии, что состояние объекта относится к классу Sfc. Ставится следующая задача: по результатам ограниченного числа измерений X\tj)> t j E 7] необходимо принять решение о принадлежности объекта к одному из выделенных классов состояний.

Решение этой задачи сводится к нахождению некоторой разделяющей функции (линии, поверхности) в пространстве переменных состояния (рис. 13).

Вид этой разделяющей функции должен выбираться таким образом, чтобы минимизировать вероятность принятия ошибочных решений или среднюю стоимость потерь, вызванных такими решениями.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]