- •Искусственные нейронные сети, их классификация и основные классы решаемых задач
- •Сети радиальных базисных функций (rbf-сети): структура и назначение
- •Формальные нейроны, входная функция и функции активации или выхода нейрона и их виды
- •Интерполяция и аппроксимация функций с помощью rbf-сетей
- •Динамические нейронные сети. Сети с внешней и внутренней динамикой
- •Backpropagation-алгоритм обучения многослойных персептронов и его недостатки. Основные требования к функции активации нейрона в Backpropagation-сетях
- •Бинарные сети Хопфилда (Hopfield): структура, свойства, назначение и области применения. Непрерывные сети Хопфилда
- •9. Применение Backpropagation-нейросетей для преобразования ascii-текста в речевой сигнал (проект neTtalk) и для анализа видеоизображений
- •Правило останова переходного процесса в сети Хопфилда. Теорема Коэна (Сohen) и Гроссберга ( Grossberg)
- •11. Функция ошибки нейросети и градиентный способ определения ее минимума
- •12. Применение многослойных персептронов для прогнозирования способности к возврату кредита
- •14. Двухслойные и многослойные нейросети и их аппроксимационные
- •15.Сети Хопфилда: назначение, типы, структура, принцип действия
- •1) Режим фильтрации;
- •2) Синхронный режим;
- •Обучение нейросетей с поощрением и без поощрения (Supervised and unsupervised learning). Примеры.
- •Алгоритм Кохонена и его сходимость (одномерный и двумерный случай)
- •18)Основные недостатки алгоритма обучения с обратным распространением ошибки (Backpropagation) и способы их смягчения
- •19)Сети Кохонена, их структура и алгоритм обучения
- •20. Моделирование основных логических схем нейросетями
- •21. Частично рекуррентные сети Жордана и Элмана и их применение для прогнозирования временных рядов
- •5.3.2. Нейросети Жордана(Jordan) и Элмана(Elman)
- •22. Сети Кохонена. Основные стадии работы и области применения. Алгоритм обучения
- •23.Нейросети прямого распространения информации 1го и 2го порядка (fFсети 1го и 2го порядка)
- •24.Применение rbf-сетей для аппроксимации психометрической функции преподавателя
- •Гауссова (колокольная) фа(функция активации)
- •25. Моделирование схемы исключающего или (xor-схемы) двухслойным персептроном
- •26. Сети радиальных базисных функций (rbf-сети): структура и назначение
-
Обучение нейросетей с поощрением и без поощрения (Supervised and unsupervised learning). Примеры.
Обучение с поощрением (англ. reinforcement learning) — один из способов машинного обучения, в ходе которого испытуемая система (агент) обучается, взаимодействуя с некоторой средой. С точки зрения кибернетики, является одним из видов кибернетического эксперимента. Откликом среды (а не специальной системы управления подкреплением, как это происходит в обучении с учителем) на принятые решения являются сигналы подкрепления, поэтому такое обучение является частным случаем обучения с учителем, но учителем является среда или ее модель. Также нужно иметь в виду, что некоторые правила подкрепления базируются на неявных учителях, например, в случае ИНС, на одновременной активности формальных нейронов, из-за чего их можно отнести к обучению без учителя.
Среда и агент
Агент воздействует на среду, а среда воздействует на агента. О такой системе говорят, что она имеет обратную связь. Такую систему нужно рассматривать как единое целое, и поэтому линия раздела между средой и агентом достаточно условна. Конечно, с анатомической или физической точек зрения между средой и агентом (организмом) существует вполне определенная граница, но если эту систему рассматривать с функциональной точки зрения, то разделение становится не четким. Например, резец в руке скульптора можно считать либо частью сложного биофизического механизма, придающего форму куску мрамора, либо частью материала, которым пытается управлять нервная система.
[править]Система подкрепления и ее виды
Розенблатт пытался классифицировать различные алгоритмы обучения, называя их системами подкрепления.[1] Он даёт следующее определение:
Системой подкрепления называется любой набор правил, на основании которых можно изменять с течением времени матрицу взаимодействия (или состояние памяти) перцептрона.
Кроме классического метода обучения перцептрона — метода коррекции ошибки, которого можно отнести к обучению с учителем, Розенблатт также ввёл понятие об обучении без учителя, предложив несколько способов обучения:
-
Альфа-системой подкрепления называется система подкрепления, при которой веса всех активных связей cij, которые ведут к элементу uj, изменяются на одинаковую величину r, а веса неактивных связей за это время не изменяются.
-
Гамма-системой подкрепления называется такое правило изменения весовых коэффициентов некоторого элемента, при котором веса всех активных связей сначала изменяются на равную величину, а затем из их всех весов связей вычитается другая величина, равная полному изменению весов всех активных связей, деленному на число всех связей. Эта система обладает свойством консервативности относительно весов, так как у нее полная сумма весов всех связей не может ни возрастать, ни убывать.
Обучение с поощрением
При решении задачи кластеризации или автоматической классификации отсутствует обучающая последовательность образов с метками классов. Этот режим называется обучением без поощрения. Для его обозначения иногда используется методологически менее корректный термин «обучение без учителя». Алгоритмы кластеризации оперируют мерами сходства и различия отдельных образов и на этой основе осуществляют разбиение образов на группы (кластеры), в каждой (в каждом) из которых обьединяются естественно близкие образы. Методы автоматической классификации (кластеризации) широко используются для извлечения знаний (Data Mining), сжатия данных, медицинской и технической .
Пример: Задача коммивояжёра (англ. Travelling salesman problem, TSP) (коммивояжёр — разъездной сбытовой посредник) - одна из самых известных задач комбинаторной оптимизации, заключающаяся в отыскании самого выгодного маршрута, проходящего через указанные города хотя бы по одному разу с последующим возвратом в исходный город. В условиях задачи указываются критерий выгодности маршрута (кратчайший, самый дешёвый, совокупный критерий и т. п.) и соответствующие матрицы расстояний, стоимости и т. п. Как правило, указывается, что маршрут должен проходить через каждый город только один раз — в таком случае выбор осуществляется среди гамильтоновых циклов.
Существует несколько частных случаев общей постановки задачи, в частности геометрическая задача коммивояжёра (также называемая планарной или евклидовой, когда матрица расстояний отражает расстояния между точками на плоскости), треугольная задача коммивояжёра(когда на матрице стоимостей выполняется неравенство треугольника), симметричная и асимметричная задачи коммивояжёра. Также существует обобщение задачи, так называемая обобщённая задача коммивояжёра.
Общая постановка задачи, впрочем как и большинство её частных случаев, относится к классу NP-полных задач.