Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Донецкий национальный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Lektsii_po_IS_2001-2002.doc

Скачиваний:

174

Добавлен:

13.04.2015

Размер:

3.13 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 2913 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Лекция 9. Теорема Новикова

Естественно, что первый же вопрос, который возник при изучении персептрона,— насколько эффективен предложенный Розенблаттом алгоритм построения разделяющей гиперплоскости, т. е. всегда ли с помощью этого алгоритма может быть построена гиперплоскость, разделяющая два множества векторов и. Конечно, имеются в виду случаи, когда такая гиперплоскость в принципе существует.

В 1960 году американский ученый А. Новиков показал, что если последовательность, составленную из всех элементов множеств и, предъявить персептрону достаточное число раз, то он, в конце концов, разделит ее (конечно, если разделение с помощью гиперплоскости в принципе возможно). Это утверждение оказалось чрезвычайно важным для развития теории обучающихся программ. Использованные для его доказательства понятия оказались полезными и при установлении более тонких свойств алгоритмов обучения. Рассмотрим их подробнее.

Утверждение Новикова относится к случаю, когда в пространстве Y существует гиперплоскость, проходящая через начало координат и разделяющая два множества векторов и, т. е. когда существует такой вектор , что выполняются неравенства

(9.1)

Здесь использовано обозначение

Рассмотрим множество W, состоящее из всех векторов и. Тогда система неравенств (9.1) примет вид

Если обозначить , а ,

то условие разделимости векторов иможет быть формально выражено так:.

Рис. 9.1.

Величине может быть дана следующая геометрическая интерпретация. Пусть, как на рис. 9.1, множество векторовобозначено крестиками, а множество векторов кружками. Утверждение о том, что два множества векторов разделимы гиперплоскостью, проходящей через начало координат, эквивалентно тому, что выпуклая оболочка векторов ,не содержит нуля или, что то же самое, расстояние от начала координат до выпуклой оболочки множестваW отлично от нуля (Выпуклой оболочкой множества называется минимальное выпуклое множество, содержащее эти элементы. В свою очередь выпуклым множеством называется множество, которое наряду с любыми двумя точками содержит отрезок их соединяющий). Величина как раз и равна расстоянию от выпуклой оболочки множестваW до начала координат.

Особенность алгоритма персептрона, состоящая в том, что разделяющая гиперплоскость проходит через начало координат, не является серьезным ограничением при построении произвольной разделяющей гиперплоскости (в том числе и не проходящей через начало координат). Если для разделения классов необходима гиперплоскость, не проходящая через начало координат, то достаточно расширить пространство Y, добавив к векторам и, еще одну координату и положить ее равной 1. Тогда нетрудно видеть, что в новом пространстве множества разделимы гиперплоскостью, проходящей через начало координат. Итак, пусть расстояние от начала координат до выпуклой оболочки множестваW отлично от нуля и равно , а расстояние от начала координат до конца самого далекого вектора этого множества равноD.

Тогда, как показал Новиков, после многократного предъявления обучающей последовательности, составленной из элементов множеств {у} и {}, будет проведено не болееисправлений коэффициентов.

Докажем теорему Новикова в несколько более общей формулировке.

Теорема 9.1. Пусть дана произвольная бесконечная ограниченная по модулю последовательность векторов , принадлежащих множествами. Пусть существует гиперплоскость, проходящая через начало координат и разделяющая множестваи, т.е. существует единичный вектортакой, что

для всех ,

для всех

Тогда при использовании персептронной процедуры построения разделяющей гиперплоскости с начальными вершинами элемента, равными нулю, число исправлений ошибок не превзойдет числа

Эта теорема утверждает, что если существует гиперплоскость, разделяющая множества и, то персептрон после конечного числа исправлений ошибок построит разделяющую гиперплоскость.

Доказательство. Рассмотрим новую последовательность , которая отличается от исходной тем, что векторы, принадлежащие, заменены на. Тогда как работа персептрона может быть описана так. Обозначим черезвектор, координатами которого являются весаR-элемента после просмотра i членов последовательности.