Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Monografia-2004.doc
Скачиваний:
22
Добавлен:
05.11.2018
Размер:
2.11 Mб
Скачать

3.3.2. Оптимальные таблицы и карты маршрутизации и вычисление оптимальных маршрутов

Для каждого узла ТКС зададим функционал оценки стоимостей маршрутов до остальных узлов ТКС в виде

, (3.3.8)

где wj – стоимости звеньев (каналов связи), образующих маршрут из ai в ak.

Заметим, что при неполноте информации о текущем состоянии ТКС, доступной узлу ai (например, в динамически изменяющихся ТКС), значение функционала может не совпадать с точным значением стоимости маршрута. В таких случаях обычно используются методы, оценивающие значение функционала стоимости маршрута (например, методы Q-маршрутизации) [18].

Пусть таблицы маршрутизации строятся следующим образом:

. (3.3.9)

где функции ρi вычисляются по следующей формуле:

(3.3.10)

Такие таблицы будем называть оптимальными таблицами маршрутизации. Они представляют для каждого узла TKC оптимальную локальную БД маршрутизации.

Множество таких таблиц определяет оптимальную карту маршрутизации и реализующую её глобальную БД оптимальной маршрутизации ТКС.

Теорема 3.3.2: Маршруты, определяемые по формулам (3.3.9) и (3.3.10), являются оптимальными, в том смысле, что функционал (3.2.1), оценивающий их стоимость, принимает на этих маршрутах минимальное значение, т.е.

ρi(f)=Kopt(ai, f)) = min K(ai, f). (3.3.11)

Для доказательства этой теоремы прежде всего заметим, что второе утверждение напрямую следует из описанного метода построения оптимальных таблиц маршрутизации по формулам (3.3.9) и (3.3.10).

Докажем теперь первое утверждение теоремы 3.3.2 по индукции, а именно: если n-звенные маршруты, построенные по формулам (3.3.9) и (3.3.10), оптимальны, то (n+1)-звенные маршруты, построенные по этим же формулам, также будут оптимальны.

База: n=0.

Так как стоимость маршрута неотрицательна, а стоимость всех 0-звенных маршрутов равна 0, то для n=0 доказываемое утверждение верно.

Индукционный переход: n  n+1.

Рассмотрим (n+1)-звенный маршрут P0(n+1)(s,f) от заданного узла-источника s к фиксированному узлу-получателю f, определяемый оптимальными таблицами маршрутизации, в виде

. (3.3.12)

Стоимость этого маршрута равна ρs(f)=K(s,f). Так как маршруты P0(n) оптимальны, а функционалы ρi соответствуют их стоимостям, то из формул (3.3.9) и (3.3.10) следует, что

. (3.3.13)

Таким образом, стоимость (n+1)-звенного маршрута, определенного по оптимальным таблицам маршрутизации, является минимальной из всех возможных. Это значит, что маршрут P0(n+1)(s,f) оптимален для любых узлов –источников sA и узлов-получателей fA.

Теорема 3.3.2. доказана.

Эта теорема конструктивна, так как по существу она определяет метод вычисления (планирования) оптимальных маршрутов передачи пакетов данных от любого узла-источника s к заданному узлу-получателю f, основанный на построении оптимальной карты маршрутизации для ТКС.

3.4. RL-подход к динамической Q-маршрутизации

Динамическим аналогом традиционных алгоритмов статической (фиксированной) маршрутизации является так называемый алгоритм Q-маршрутизации (Q-routing) [18]. Этот алгоритм динамической маршрутизации основан на RL (Reinforcement Learning), подходе, использующем распределенный механизм оценки стоимостей маршрутов в динамических ТКС. Опишем этот алгоритм подробнее.

Алгоритм Q-маршрутизации потоков данных является модификацией алгоритма маршрутизации Беллмана-Форда [17]. Он эффективно работает как в статических, так и в динамических ТКС с высоким риском сетевых перегрузок.

Алгоритм является распределенным, так как выполняется в каждом узле ТКС. Он производит итеративные (рекуррентные) вычисления для определения и корректировки маршрутов, близких к оптимальным. При этом используется функционал, оценивающий стоимость маршрутов передачи пакетов данных в глобальных ТКС.

Особенность алгоритма заключается в том, что в каждом узле ТКС для каждого узла-получателя определяется не весь маршрут, а только соседний узел, которому нужно переслать пакет. Таким образом, рекуррентный алгоритм Q-маршрутизации вычисляет локально- оптимальные маршруты. При этом не гарантируется глобальная оптимальность синтезированных маршрутов.

Задача Q-маршрутизации в динамических ТКС формулируется следующим образом.

Пусть заданы:

G(A(t),R(t),W(t)) – ориентированный граф ТКС;

– узел-источник пакетов данных;

– стоимость ребра , удовлетворяющая естественным соотношениям:

w(i,i)=0; , если узлы i и j не соединены

, если узлы i и j соединены;

– функционал стоимости маршрутов, соответствующий оценке узлом стоимости маршрута, содержащего ребро , до узла-получателя .

Требуется построить локально-оптимальные маршруты от узла-источника до остальных узлов , позволяющие на каждом шаге минимизировать стоимость каналов связи ТКС.

Решение этой задачи разбивается на два этапа:

- прокладка начальных маршрутов

- корректировка маршрутов.

Опишем вычислительную работу алгоритма на каждом этапе.

1-й этап (прокладка начальных маршрутов)

Вычисление начальных маршрутов можно осуществить с помощью алгоритма Беллмана-Форда. По окончании работы этого алгоритма значения функционала стоимостей определяются по следующей формуле:

, (3.4.1)

где L(v,f) – стоимость кратчайшего маршрута от узла vдо узла f.

На данном этапе главный интерес представляют не столько сами начальные маршруты (их можно и не запоминать), сколько получение начальных значений функционала .

2-й этап (корректировка маршрутов)

На каждом шаге алгоритма происходит обновление оценок стоимостей по рекуррентной формуле

), (3.4.2)

где – «коэффициент обучения» (обычно выбирается =0.5), а lk(f,v) вычисляется по формуле:

. (3.4.3)

Технология прокладки маршрута с помощью описанного алгоритма заключается в следующем

При передаче пакета данных узлу-получателю f узел-источник s0 сначала пересылает его к соседнему узлу v=a1, на котором значение функции минимально. Затем этот узел a1 пересылает пакет узлу v =a2, на котором достигается минимум функции и т.д. до тех пор, пока пакет данных не придет в заданный узел-получатель f.

Эффективность алгоритма Q-маршрутизации зависит от выбора коэффициента обучения μ. При значениях , близких к 1, возрастает риск возникновения так называемых «узких мест», т.е. возможность появления маршрутов, совместно используемых для передачи пакетов данных несколькими парами “источник-получатель”.

Заметим, что если маршрут оптимален, то любой содержащийся в нем подмаршрут тоже оптимален. Таким образом, если несколько пар «источник-получатель» будут передавать пакеты данных только по оптимальному маршруту, то это с большой вероятностью приведет к перегрузке соответствующих каналов связи ТКС.

При значениях “коэффициента обучения” , близких к 0, изменения стоимостей маршрутов будут мало влиять на решение. В этом случае вычисляемые по алгоритму маршруты могут быть достаточно далеки от глобально оптимальных.

Экспериментальные исследования показали, что распределенный алгоритм Q-маршрутизации достаточно легко адаптируется как к возможным изменениям структуры (топологии) параметров динамических ТКС, как и к возможным изменениям направлений передачи и интенсивности потоков данных.

На рис.3.4.1. приводится сравнительная характеристика алгоритмов Q-маршрутизации (Q-routing) и OSPF-алгоритма (Shortest Path), полученная в работе [18]. Ось абсцисс на приведенной диаграмме соответствует средней загрузке сети, ось Y - среднему времени доставки пакетов данных.

Рис.3.4.1. Сравнительная оценка эффективности работы алгоритмов Q-маршрутизации и OSPF

Как видно из рис. 3.4.1, при увеличении нагрузки на сеть алгоритм Q-маршрутизации оказывается более устойчивым, чем алгоритм OSPF, который является стандартом в современных ТКС.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]