Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Управление МСС

.pdf
Скачиваний:
7
Добавлен:
30.04.2015
Размер:
404.62 Кб
Скачать

Рис. 3. Пример возможного разбиения на классы

Правила обучения сети строится на основе базового правила обучения сети векторного квантования. Пусть на вход системы подаётся вектор сигналов x, класс которого известен. Если он классифицируется системой правильно, то соответствующий x кодовый вектор W слегка сдвигается в сторону вектора сигнала

(«поощрение»):

(1) Wnew = Wold(1 − θ) + xθ,

Если же x классифицируется неправильно, то соответствующий x кодовый вектор W слегка сдвигается в противопо-

ложную сторону от сигнала («наказание»):

(2) Wnew = Wold(1 + θ) − xθ, где θ (0,1) — шаг обучения.

Для обеспечения стабильности используется метод с затухающей скоростью обучения. Возможно также использование разных шагов для «поощрения» правильного решения и для «наказания» неправильного.

В процессе обучения «учитель» и сеть (сетевой методист и сообщество) [9] подвергаются воздействию со стороны внешней среды (Единое информационно-методическое пространство) [12], то есть на их входы поступает тренировочный сигнал (метод обучения), совпадающий с одним из входных шаблонов. «Учитель» (сетевой методист) сообщает сети, какова должна

11

быть правильная (желаемая) реакция на поступившее воздействие, выдавая соответствующий выходной шаблон.

На основании величины ошибки между реальным и желаемым выходами сети по определенному правилу проводится настройка ее параметров. Регулярно повторяя этот процесс, можно настроить ИНС так, что она будет эмулировать «учителя», то есть его знания о внешней среде перейдут к ней.

Типичными задачами, решаемыми с помощью прямого обучения, являются аппроксимация неизвестной функции, описываемой набором данных, и идентификация динамического объекта. В этих задачах известны входные сигналы и правильная реакция на них, то есть тренировочный набор шаблонов.

Наиболее известным методом прямого контролируемого обучения слойных прямонаправленных ИНС является алгоритм обратного распространения ошибки (backpropagation algorithm) [7].

Основная идея этого метода состоит в распространении сигналов ошибки от выходов сети к её входам, в направлении, обратном прямому распространению сигналов в обычном режиме работы [14].

Для возможности применения метода обратного распространения ошибки передаточная функция нейронов должна быть дифференцируема.

Наиболее часто в качестве функций активации используются следующие виды сигмоид:

(3)

f (s) =

 

 

 

 

1

 

 

 

– экспоненциальная сигмоида,

1

+ e2as

 

 

 

 

 

 

 

 

(4)

f (s) =

 

 

 

 

s

 

 

– рациональная сигмоида,

 

 

s

 

+ a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

s

 

 

(5)

f (s) = th

s

=

e a

e

 

a

 

– гиперболический тангенс,

 

 

 

a

 

s

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ea

+ e

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где s — выход сумматора нейрона, α — произвольная константа.

12

Сигмоид применяется в нейронных сетях для того, чтобы ввести некоторую нелинейность в работу сети, но при этом не слишком сильно изменить результат ее работы.

Одна из причин, по которой сигмоид используется в нейронных сетях, это простое выражение её производной через саму функцию (которое и позволило существенно сократить вычислительную сложность метода обратного распространения ошибки, сделав его применимым на практике):

(6) σ(x) =σ(x) (1 σ(x)) .

Не менее важной причиной введения нелинейности является математически доказанная возможность получить сколь угодно точное приближение любой непрерывной функции многих переменных, используя операции сложения и умножения на число, суперпозицию функций, линейные функции, а также одну произвольную непрерывную нелинейную функцию одной переменной (Обобщенная аппроксимационная теорема).

Таким образом осуществляется прямое контролируемое обучение сети.

Существует другая разновидность контролируемого обучения – стимулируемое обучение.

Стимулируемое обучение не использует знания «учителя» о желаемом выходе ИНС, вместо этого обучение проводится по результату оценки проводимого сетью преобразования входвыход. Оценку выполняет внешнее окружение после подачи на вход сети тренировочного воздействия. При этом настройка параметров ИНС проводится так, чтобы максимизировать скалярный индекс этой оценки, называемый стимулом

(reinforcement signal).

Идея такого способа опирается на реальный процесс обучения, проходящий у живых существ. В психологии он известен, как закон действия Торндайка. Применительно к стимулируемому обучению ИНС этот закон может быть перефразирован следующим образом: если действие, предпринятое системой обучения, приводит к удовлетворению потребностей, то тенденция системы проводить это же действие увеличивается (система

13

стимулируется). В противном случае активизация действий системы уменьшается [13].

Наиболее характерным примером системы стимулируемого обучения является адаптивная система управления. В ней обучаемой частью является контроллер (куратор методической службы региона), а объект управления (сетевое сообщество),

внешние воздействия и сигналы задания (методы обучения) выступают его внешней средой (ЕИМП) [11]. В результате воздействия из этой среды контроллер вырабатывает определенный управляющий сигнал, который переводит объект управления в новое состояние. При этом качество управления можно оценить лишь по выходному сигналу объекта. Так как требуемая реакция контроллера, обеспечивающая заданное состояние объекта, заранее неизвестна, то нельзя сформировать тренировочный набор шаблонов, и, следовательно, применить прямое контролируемое обучение. В этом случае возможно лишь стимулируемое обучение контроллера по качеству работы всей системы управления в целом, то есть по оценке состояния внешней среды.

Возможны две реализации стимулируемого обучения: с непосредственным стимулированием и с задержанным стимулированием. В первом случае оценка работы и соответствующая ей настройка параметров ИНС проводится на каждом шаге работы системы обучения. Во втором случае, при задержанном стимулировании, настройка сети выполняется так, чтобы максимизировать кумулятивную оценку работы системы на определенной последовательности шагов.

Хотя непосредственное стимулирование более свойственно классическим схемам адаптивного управления, в своей работе мы уделим внимание методам задержанного стимулирования.

Для сходимости метода непосредственного стимулирования необходимо, чтобы каждое последующее положение внешней среды определялось лишь ее предыдущим положением и предыдущим воздействием, оказанным ИНС [8]. При задержанном обучении такое ограничение снимается. С другой стороны, гораздо проще сформулировать критерий, определяющий опти-

14

мальное поведение системы управления в целом, по результатам какого-то действия, чем критерий, направляющий ее движение на каждом шагу. В общем можно заметить, что система, обучающаяся лишь по результатам своего взаимодействия с внешней средой, является более интеллектуальной, чем использующая дополнительную информацию «учителя».

5. Выводы

Сопоставление теорий управления сетевыми сообществами и искусственными нейронными сетями позволило сходные признаки исследуемых систем:

-Сетевое сообщество, так же как и ИНС, обладает пластичностью, что делает это сообщество универсальной системой обработки информации.

-Изначальными знаниями сетевое сообщество и ИНС не обладают.

-Функция алгоритма обучения такого сообщества близка к теории адаптивных линейных фильтров, которые уже давно и успешно применяются в управлении.

-Отличительной особенностью управления сетевым сообществом является тот факт, что могут появляться новые члены сообщества, могут из него выходить и менять свои связиотношения с другими членами сообщества.

-Сетевые сообщества реализуют свою интеллектуальную мощь, благодаря двум основным своим свойствам: параллельно распределенной структуре и способности обучаться и обобщать полученные знания. Под свойством обобщения понимается способность сообщества генерировать правильные выводы для новых данных, которые не были учтены в процессе обучения (тренировки). Эти два свойства делают сетевое сообщество системой переработки информации, которая решает сложные многомерные задачи в области методов обучения.

Анализ этих выводов позволяет говорить о появлении синтетической теории, объединяющей в себе инженерный и социальный подходы, а следовательно рассматривать сетевое мето-

15

дическое сообщество как практическое применение искусственных нейронных сетей в социальной системе.

Литература

1.БАРЦЕВ С. И., ГИЛЕВ С. Е., ОХОНИН В. А. Принцип двойственности в организации адаптивных сетей обработ-

ки информации. В кн.: Динамика химических и биологических систем. – Новосибирск: Наука, 1989. – С. 6-55.

2.ДЖОНСОН Д., ДЖОНСОН Р., ДЖОНСОН-ХОЛУБЕК Э.

Методы обучения. Обучение в сотрудничестве // Экономи-

ческая школа, 2001 г. – 256c.

3.НОВИКОВ А.М., НОВИКОВ Д.А. Методология. – М.: Синтег, 2007.

4.НОВИКОВ Д.А. Введение в теорию управления образовательными системами. – М.: Эгвес, 2009. – 156 с.

5.НОВИКОВ Д.А., ГЛОТОВА Н.П. Модели и механизмы управления образовательными сетями и комплексами. – М.:

Институт управления образованием РАО, 2004.

6.ПАТАРАКИН Е.Д. Сетевые сообщества и обучение. - ПЕР СЭ, 2006 г. – 112с.

7.ХАЙКИН С. Нейронные сети: полный курс. 2-е издание – Вильямс, 2006г. –1104с.

8.ТАРХОВ Д.А. Нейронные сети. Модели и алгоритмы. –

Радиотехника, 2005г. –256с.

9.ФРОЛОВ И.Н. Модель информационно-методической службы образовательной системы региона // Инновацион-

ные технологии обучения: проблемы и перспективы. Сборник научных трудов Всероссийской научно-методической конференции. Липецк, 2008.

10.ФРОЛОВ И.Н. Влияние сетевого сообщества на качество преподавания // Материалы Всероссийской научнопрактической конференции «Информационная безопасность в открытом образовании». Магнитогорск, МГУ, 2007.

16

11.ФРОЛОВ И.Н. Вопросы формирования ЕИМП образовательной системы региона // Вестник РУДН. Серия «Инфор-

матизация образования». Москва, 2008. №4.

12.ФРОЛОВ И.Н. Понятие единого информационнометодического пространства образовательной системы региона // Дистанционное и виртуальное обучение. Москва, 2008. №5

13.ФРОЛОВ И.Н. Познавательные потребности: проблема развития и способы её решения с использованием компьютерных технологий. - Липецк, 2007. – 108с.

14.HOLLAND J. H. Adaptation in natural and artificial systems.

University of Michigan Press, Ann Arbor, 1975.

MANAGE NETWORK METHODICAL СOMMUNITY BASED ON ARTIFICIAL NEURAL NETWORKS

Ilya Frolov, Lipetsk State Teacher Training University, Cand. Sc., assistant professor (f_i_n@rambler.ru)

Abstract: In this paper we attempt to describe the theory of network management community through the model of artificial neural networks (ANN). The concept of network methodical community (NMC), detailing its composition and structure are determined by control objects, lists the core functions and mechanisms of governance. We analyze the mathematical component of the learning opportunities for NMC.

Keywords: informatization of education, community networking, artificial neural networks, educational environment.

17