- •Введение
- •Место нейронных сетей среди других методов решения задач
- •Биологический нейрон
- •Искусственный нейрон
- •Активационные функции
- •Ограничения модели нейрона
- •Однослойные искусственные нейронные сети
- •Многослойные искусственные нейронные сети
- •Обучение искусственных нейронных сетей
- •Алгоритмы обучения
- •Многослойный персептрон
- •Xijl — I-й входной сигнал j-го нейрона в слое l ;
- •Алгоритм решения задач с помощью мсп
Активационные функции
-
Жесткая ступенька:
Рис. Жесткая ступенька.
Здесь θ – пороговый уровень нейрона. Данная функция используется в классическом искусственном нейроне. Нейроны с такой нелинейностью требуют малых вычислительных затрат. Данная функция чрезмерно упрощена и не позволяет моделировать схемы с непрерывными сигналами. Отсутствие первой производной затрудняет применение градиентных методов для обучения таких нейронов.
-
Логистическая функция (сигмоида):
Рис. Логистическая функция.
Эта функция часто применяется для сетей с непрерывными сигналами.
Она симметрична относительно точки с координатами NET = 0, OUT = 0,5, что делает равноправными значения OUT = 0 и OUT = 1. Тем не менее диапазон выходных значений от 0 до 1 несимметричен, что замедляет обучение соответствующей нейронной сети. Данная функция является сжимающей, т.к для малых значений NET коэффициент передачи K = OUT/NET велик, для больших значений он снижается. Поэтому диапазон сигналов, с которыми нейрон работает без насыщения, оказывается широким. Производная непрерывна и легко выражается через саму функцию, что ускоряет обучение нейрона.
-
Гиперболический тангенс:
Рис. Гиперболический тангенс
Также часто применяется для сетей с непрерывными сигналами. Фунция симметрична относительно точки (0, 0), что является преимуществом по сравнению с сигмоидой. Производная также непрерывна и легко выражается через саму функцию.
-
Пологая ступенька:
Легко рассчитывается, но имеет разрывную производную в точках NET = θ, NET = θ + Δ, что усложняет алгоритм обучения.
Рис. Пологая ступенька.
-
Гауссова кривая: .
Рис. Гауссова кривая.
Применяется в случаях, когда реакция нейрона должна быть максимальной для некоторого определенного значения NET.
Выбор функции активации определяется следующими факторами:
-
Спецификой задачи.
-
Удобством реализации на ЭВМ, в виде электрической схемы или другим способом.
-
Алгоритмом обучения: некоторые алгоритмы накладывают ограничения на вид функции активации, что необходимо учитывать.
Чаше всего вид нелинейности не оказывает принципиального влияния на решение задачи. Однако удачный выбор может сократить время обучения в несколько раз.
Ограничения модели нейрона
-
Вычисления выхода нейрона предполагаются мгновенными, не вносящими задержки. Непосредственно моделировать динамические системы, имеющие "внутреннее состояние", с помощью таких нейронов нельзя.
-
В модели отсутствуют нервные импульсы. Нет модуляции уровня сигнала плотностью импульсов, как в нервной системе. Не появляются эффекты синхронизации, когда скопления нейронов обрабатывают информацию синхронно, под управлением периодических волн возбуждения-торможения.
-
Нет четких алгоритмов для выбора функции активации.
-
Нет механизмов, регулирующих работу сети в целом (пример - гормональная регуляция активности в биологических нервных сетях).
-
Чрезмерная формализация понятий: "порог", "весовые коэффициенты". В реальных нейронах нет числового порога, он динамически меняется в зависимости от активности нейрона и общего состояния сети. Весовые коэффициенты синапсов тоже не постоянны. "Живые" синапсы обладают пластичностью и стабильностью: весовые коэффициенты настраиваются в зависимости от сигналов, проходящих через синапс.
-
Существует большое разнообразие биологических синапсов. Они встречаются в различных частях клетки и выполняют различные функции. Тормозные и возбуждающие синапсы реализуются в данной модели в виде весовых коэффициентов противоположного знака, по разнообразие синапсов этим не ограничивается. Дендро-дендритные. аксо-аксональные синапсы не реализуются в модели ФН.
-
В модели не прослеживается различие между градуальными потенциалами и нервными импульсами. Любой сигнал представляется в виде одного числа.
Итак, модель формального нейрона не является биоподобпой и скорее похожа на математическую абстракцию, чем на живой нейрон. Тем не менее с помощью таких нейронов решается большое многообразие задач.