Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Имитационное моделирование экономических процессов

.pdf
Скачиваний:
241
Добавлен:
01.05.2014
Размер:
6.69 Mб
Скачать

лирования обычно используются не менее двух программных датчи­ ков, случайных величин, распределенных по нормальному закону (их выбор осуществляется автоматически управляющей программой).

Экспоненциальное распределение. Оно также занимает очень важное место при проведении системного анализа экономической деятельности. Этому закону распределения подчиняются многие явления, например:

время поступления заказа на предприятие;

посещение покупателями магазина-супермаркета;

телефонные разговоры;

срок службы деталей и узлов в компьютере, установленном, например, в бухгалтерии.

Рассмотрим это распределение подробнее. Если вероятность на­ ступления события на малом интервале времени At очень мала и не зависит от наступления других событий, то интервалы времени ме­ жду последовательностями событий распределяются по экспоненци­ альному закону с плотностью вероятностей

, t>0 ; , t<0 .

Особенностью этого распределения являются его параметры:

математическое ожидание Щ1] =1/Х;

дисперсия D[t] =а^ = (1/Я,)^.

Математическое ожидание равно среднеквадратичному отклоне­ нию, что является одним из основных свойств экспоненциального распределения.

На первый взгляд, это распределение является надуманным. По­ этому рассмотрим предельную теорему о суперпозиции потоков. Предположим, что можно наблюдать к независимых потоков собы­ тий (рис. 1.4). В каждом таком потоке можно наблюдать ruj элемен­ тарных событий, у - 1, ... , к. Интервалы времени между событиями - это независимые случайные величины, распределенные по неизвест­ ному закону с математическим ожиданием 1/Xj. Спроектируем мо­ менты всех событий на общую ось времени и рассмотрим случай­ ный интервал времени t=T{k} между двумя событиями полученного суммарного потока, состоящего из и событий, где

n='Lm-

31

^п

tl2

tu

 

l,"!

hi

tn

Ы

 

\m2

 

tk.l

 

k2

\m^

tn

0 Рис. 1.4. Интерпретация предельной теоремы о суперпозиции потоков событий

Теорема 2 (без доказательства). Если сделать предельный пере­ ход и устремить и->оо , то распределение случайной величины ин­ тервала t=T{k\ в суммарном потоке событий, состоящем из Jt .эле­ ментарных потоков, устремится к экспоненциальному с математиче­ ским ожиданием

MW = - 1

Следствие (без доказательства). Поток заявок, интервал поступ­ ления которых в некую систему имеет экспоненциальное распреде­ ление, является простейшим.

Прокомментируем практический смысл этой теоремы.

Пример 1.2. Допустим, что имеется некая крупная фирма. Кли­ енты фирмы - это физические и юридические лица. Каждый из них может иметь набор планов и расписанных дел на значительном ин­ тервале времени. Однако если рассмотреть суммарный поток обра­ щений этих клиентов к служащим фирмы по разным вопросам, то интервал времени между двумя последовательными обращениями в

32

соответствии с рассмотренной теоремой является случайной вели­ чиной, распределенной по экспоненциальному закону.

Перейдем к рассмотрению функции, позволяющей получить псевдослучайную последовательность, распределенную по экспо­ ненциальному закону. Текст соответствующей программы на C++:

float expont(float га)

{

float г; r=log(rundum()); return(m*(-r));

}

Единственный входной параметр программы - математическое ожидание т = M[t]. В этой программе использован метод обратных функций.

Обобщенное распределение Эрланга. Обычно распределение Эрланга используется в случаях, когда длительность какого-либо процесса можно представить как сумму к элементарных последова­ тельных составляющих, распределенных по экспоненциальному закону. Если обозначить математическое ожидание длительности всего процесса как M[t]=l/X, среднюю длительность элементарной составляющей как \/Х, то плотность вероятностей распределения Эрланга представляется следующей формулой:

P(t) =

О, КО

Дисперсия такого распределения D[t] = —;j- . )Ск

Очевидно, что при к=1 - это экспоненциальное распределение. Разновидности этого распределения для разных к> О представлены на рис. 1.5.

Предположим, что в распределении Эрланга имеется не строго фиксированное число экспоненциально распределенных отрезков к, а переменное, с вероятными изменениями в пределах одного интер­ вала. Тогда можно говорить лишь о средней величине s таких отрез­ ков, где S - число с плавающей точкой. После такого перехода от дискретных к непрерывным величинам появляется возможность работы и со значениями в пределах О < s < 1.

33

о

t

Рис. 1.5. Вид распределения Эрланга при различных значениях к: 1 - экспоненциальное; 2,3 - распределения второго и третьего порядков

Рассмотрим программную функщоо, реализующую такое рас­ пределение:

float erlang{float m, float s)

{

a,

b;

float

i n t

i ,

k;

a= 0.0;

к= Sj-

to = S - k;

for( i=0;i<k;i++ ) a += expont(m); if ( rundumO < b ) a += expont(m);

return(a);

}

Эта функщш имеет два входных параметра:

• m - математическое ожидание элементарного интервала времени, причем m=l/Xt,

• S - среднее число элементарных отрезков в общей длительности процесса.

34

Видно, что при значениях s ^ 1 (в том числе целых) получаем обычное распределение Эрланга с параметрами: M[t\ = ms = 1/Х и D[t] - m^s=lA,^/t. Однако при О < s < О это распределение меняется коренным образом: фактически мы получаем процесс испытаний Бернулли. В результате этих испытаний «успехом» считается полу­ чение элементарного отрезка, распределенного по экспоненциаль­ ному закону с математическим ожиданием m (вероятность успеха равна s), а неудачей с вероятностью 1- s является получение элемен­ тарного отрезка с нулевой длиной. Если по такому правилу будет работать какой-то генератор заявок, то он будет создавать группы

заявок. Причем средний размер группы будет равен и = 1/s , а сред­ ний интервал времени между двумя последовательными группами равен т .

Математическое ожидание интервала между двумя последова­ тельными заявками и в этом случае определяется выражением M[t] = ms = 1/Я,. Что касается дисперсии, то она существенно меня­ ется и определяется по формуле:

i3[0 = mVf--l

Одно из свойств групповых потоков заключается в том, что среднеквадратичное отклонение интервала между заявками превос­ ходит математическое ожидание этого интервала.

Если имеется возможность собрать статистику по групповому потоку на практике или получить такой поток с помощью рассмот­ ренной выше программной функции, то можно определить коэффи­ циент вариации с и связь этого коэффициента со средним размером группы заявок по формуле

ЧЫ)

Это соотнощение позволяет отслеживать появление групповых потоков в реальных системах или в их имитационных моделях.

Обобщенное распределение Эрланга применяется при создании как чисто математических, так и имитационных моделей в двух слу­ чаях.

Во-первых, его удобно применять вместо нормального распреде­ ления, если модель можно свести к чисто математической задаче, применяя аппарат марковских или полумарковских процессов либо

35

используя метод Кендалла. Однако такие модели далеко не всегда адекватны реальным процессам.

Во-вторых, в реальной жизни существует объективная вероят­ ность возникновения групп заявок в качестве реакции на какие-то действия, поэтому возникают групповые потоки. Применение чисто математических методов для исследования в моделях эффектов от таких групповых потоков либо невозможно из-за отсутствия способа получения аналитического выражения, либо затруднено, так как ана­ литические вьфажения содержат большую систематическую погреш­ ность из-за многочисленных допущений, благодаря которым исследо­ ватель смог получить эти вьфажения. Для описания одной из разно­ видностей группового потока можно применить обобщенное распре­ деление Эрланга, которое рассмотрим ниже. Внешне похожее на гам­ ма-распределение, оно имеет свои математические особенности.

Появление групповьк потоков в сложных экономических систе­ мах приводит к резкому увеличению средних длительностей различ­ ных задержек (заказов в очередях, задержек платежей и др.), а также к увеличению вероятностей рисковых событий или страховых случаев.

Треугольное распределение. Применимость такого распределе­ ния рассмотрим на примере, связанном с динамическими характери­ стиками системы управления базами данных (СУБД) в экономиче­ ской информационной системе.

Пример 1.3. Предположим, что база данных находится на ком­ пьютере, не входящем в состав какой-либо вычислительной" сети. Поэтому пользователь, работающий с этой базой, имеет во время работы монопольный доступ к ней. Известны структуры и частоты запросов пользователей к этой базе данных. Рассмотрим три сл)^ая физической организации базы данных (рис. 1.6).

Первый случай. Допустим, что администратор базы данных (сис­ темный программист) осуществил физическую организацию дан­ ных, которая обладает следующими свойствами:

наиболее вероятное время ответа на запрос близко к О с;

минимальное вероятное время ответа не менее О с;

максимальное вероятное время ответа не превьппает 15 с;

• распределение вероятностей представлено линией 1 на рис. 1.6.

Этот системный программист обеспечил минимальное время для наиболее вероятных запросов за счет увеличения времени для менее вероятных. Среднее время получения ответа в этом случае / = 5 с. '

36

Второй случай. Администратор базы данных по просьбе пользо­ вателей решил уменьшить время ответа на те запросы, которые ред­ ко возникают. Для этого он переделал физическую организацию данных и получил следующие ее свойства:

наиболее вероятное время ответа на запрос равно 5 с;

минимальное вероятное время ответа не менее О с;

максимальное вероятное время ответа не преЬьпиает 10 с;

распределение вероятностей показано линией 2 на рис. 1.6.

Рис. 1.6. График плотности вероятностей для треугольного распределения: 1 - максимум слева; 2 - максимум в центре; 3 - максимум справа

Таким образом, системный программист обеспечил снижение времени ответа для менее вероятных запросов за счет увеличения времени ответа для наиболее в^оятных. Среднее время получения ответа осталось тем же: г = 5 с.

Третий случай. Администратор базы данных решил еще более уменьшить время ответа на менее вероятные запросы. Для этого он опять переделал физическую организацию данных и получил сле­ дующие свойства:

наиболее вероятное время ответа на запрос равно 7,5 с;

минимальное вероятное время ответа не менее О с;

37

максимальное вероятное время ответа не превышает 7,5;

распределение вероятностей изображено линией 3 на рис. 1.6. Этот системный программист обеспечил дальнейшее снижение

времени ответа для менее вероятных запросов за счет увеличения времени ответа для более вероятных. Среднее время получения от­ вета и в этом случае не изменилось: / = 5 с.

Возникает естественный вопрос: «Какая физическая организация лучше?». Если отбросить факторы, определяющие большую или меньшую важность запросов, и вспомнить, что база данных не имеет множественного доступа из вычислительной сети, то можно утвер­ ждать, что все три способа организации данных одинаковы, так как пользователи этой базы имеют одно и то же среднее время ответа.

Однако если пЬдключить компьютер с нашей базой к локаи.- ной вычислительной сети и разрешить доступ к базе данных боль­ шому числу пользователей этой сети из рабочих компьютеров этих пользователей, то необходимо учитывать возникновение очереди запросов к базе данных при ее монопольном использовании. Пред­ положим, что число пользователей довольно велико и выполняют­ ся условия предельной теоремы о суперпозиции потоков событий (в нашем случае возникновение запроса к базе данных - это событие). Тогда поток запросов к базе простейший (экспоненци­ альное распределение интервала поступления). Поэтому выполня­ ются условия, при которых справедлива следующая формула для оценки средней задержки запросов в очереди (формула ПоллачекаХинчина):

^'~ 2(1-р) '

где tti - искомая средняя задержка в очереди; ts - среднее время обслуживания;

р - загрузка обслуживающего узла (р = /j / г^^ 1); С;- коэффициент вариации времени обслуживания.

Если известно среднеквадратичное отклонение времени обслу­ живания Qs, то Cs = Gs/ ts. в трех рассмотренных случаях t^ = t = 5c.

Загрузка не изменяется, так как поток запросов к базе данных тот же самый. Однако разброс значений в первом случае примерно в 3 раза

38

больше, чем в третьем. Соответственно с} может быть больше при­ близительно в 9 раз (т.е. на порядок!), а это часть множителя в чис­ лителе формулы.

После этого можно сделать вывод, что задержка в очереди в пер­ вом случае будет значительно больше, чем в третьем. Во втором случае задержка в очереди также будет превосходить задержку, воз­ никающую в третьем случае. Поэтому наиболее рациональным от­ носительно возникающих задержек является третий способ органи­ зации базы данных.

Выражения для определения математического ожидания Л^^] и дисперсии D\t\ получаются интегрированием с использованием оп­ ределений первого и второго моментов:

3

36

Ниже приведен текст программной функции на C++, возвра­ щающей случайную величину, распределенную по треугольному закону:

float t r i p l e x ( f l o a t а, float m, float b)

{

float X, r; г=гип(3глп () ;

if( r <= (m-a)/(b-a). )

X = a + sqrt( r*(m-a)*(b-a) ); else

X = b - sqrt( (1.0-r)*{b-m)*(b-a) ); return(x);

}

Эта программа использует метод обратных функций. Она имеет три входных параметра:

а - минимально возможное значение интервала времени;

b - максимально возможное значение интервала времени;

m - наиболее вероятное значение интервала времени (макси­ мум плотности вероятностей).

Естественно, входные параметры должны удовлетворять сле­ дующим условиям: а < m < b .

39

1.4

НЕТРАДИЦИОННЫЕ СЕТЕВЫЕ МОДЕЛИ И ВРЕМЕННЫЕ ДИАГРАММЫ ИНТЕРВАЛОВ АКТИВНОСТИ

Основа концепции имитационного инструментария, с помощью которого можно проводить структурный анализ и имитационное моделирование, заключается в механизмах, позволяющих агрегиро­ вать элементарные процессы и устанавливать между ними функцио­ нальные связи (гфичинно-следственные, информационные, финан­ совые и иные). Ниже предлагается сетевая концепция, существенно отличающаяся от аналитического аппарата, рассмотренного в лите­ ратуре по теории массового обслуживания, использующая удачные результаты теории стохастических сетей и численные методы, осно­ ванные на диффузной аппроксимации процессов массового обслу­ живания.

Эта концепция разработана, в первую очередь, для последующей реализации имитационных механизмов в рамках специального паке­ та имитационного моделирования. Она предназначена для верифи­ кации работоспособности пакета, для оценочных расчетов при от­ ладке имитационных моделей, но не предназначена для практиче­ ских расчетов показателей риска по аналитическим формулам.

Идею предлагаемой концепции рассмотрим на примере из кон­ кретного проекта «Открытое образование» («е-образование»),'реали­ зуемого под патронажем Международной академии открытого обра­ зования (МАОО).

Учебные процессы в открытом образовании. Учебный про­ цесс - это понятие, охватывающее всю учебную деятельность клас­ сического университета. Учебный процесс состоит из многих ком­ понентов: процесса обучения студента по конкретной специальности в течение пяти лет, семестрового учебного процесса на потоке, про­ цесса изучения дисциплины. Классический университет имеет жест­ кий избыточный набор ресурсов, который позволяет реализовать учебный процесс в любой его интерпретации. Однако такой фикси­ рованный набор приводит к издержкам планирования, к удорожа­ нию обучения студента без гарантий высокого качества.

В открытом образовании работают специалисты, имеющие ква­ лификацию не ниже, чем в классическом университете. Единствен­ ное, что их отличает, - это различные образовательные технологии (классическая и комплексная).

40