§ 17. Нижняя граница сложности в среднем

При рассмотрении сложности в среднем мы основываемся на тех же понятиях нижней границы, оптимального и оптимального по порядку сложности алгоритма, которые были введены для сложности в худшем случае.

Пример 17.1. Вновь обратимся к классу алгоритмов сортировки. Будем, как и в § 6, рассматривать вероятностное пространство П_n.

Предложение 17.1. Функция log₂n! является нижней границей сложности в среднем для класса алгоритмов сортировки массивов длины n с помощью сравнений.

§ 17. Нижняя граница сложности в среднем

119

Прежде всего докажем вспомогательное утверждение.

Лемма 17.1. В любом двоичном дереве с т листьями сумма высот всех листьев не меньше т log₂ т.

Доказательство. Пусть непусто множество М всех двоичных деревьев, для которых сумма высот всех листьев меньше т log₂ т. Выберем в М какое-нибудь из деревьев, имеющих наименьшую сумму высот, и обозначим его U (сумму высот всех листьев будем обозначать через Я(J7)). Это дерево не может состоять из одного лишь корня, потому что для такого дерева обсуждаемое неравенство выполнено. Далее, из корня этого дерева не может выходить только одно ребро, потому что для дерева, получающегося из исходного удалением корня и этого ребра, обсуждаемое неравенство не выполняется, и такое новое дерево имеет сумму высот меньшую, чем дерево U (противоречие со способом выбора дерева U). Поэтому из корня дерева U выходит два ребра, концы которых являются корнями двух деревьев и_г и U₂, для которых выполнено обсуждаемое неравенство. Пусть эти деревья имеют, соответственно, т_г и т₂ листьев, т_ъ т₂ > 0. Имеем соотношение для сумм высот всех листьев

H{U) =H(U₁) + Я(!У₂) + т^т_г log₂ т_г + т₂ log₂ m₂ + т.

Отсюда получаем

Я([7) =г т_г log₂ т_г + {т- т_г) log₂(m-т_г)+т

при некотором т_г таком, что 1 ^ т_г ^ т - 1.

Легко показать, что при фиксированном т функция /(х) =х log₂ х+ + (т-х) log₂(m-x) достигает минимума на отрезке [1, т - 1] в точке (не обязательно целой) т/2. Поэтому

Я([7) ^ j log₂ j + j log₂ Щ-+т = т log₂ т. Но это противоречит способу выбора U. Лемма доказана. □

Доказательство предложения 17.1. Рассмотрим какое-либо дерево сортировки массива длины п. Это дерево имеет ровно п! листьев, каждый лист соответствует перестановке элементов исходного массива. Появление на выходе рассматриваемой сортировки любой из этих

1 перестановок имеет одну и ту же вероятность —, количество сравнений, приводящее к этой перестановке—это высота соответствующего этой перестановке листа. Поэтому математическое ожидание числа

сравнений равно произведению суммы высот всех листьев на —.

120 Глава 4. Нижняя граница сложности. Оптимальные алгоритмы

Согласно лемме 17.1 сумма высот всех листьев должна быть не меньше, чем n\ log₂ n\. Отсюда математическое ожидание числа срав нений не меньше, чем log₂ n\. □

Доказанные ранее теорема 16.2 и предложение 16.1 справедливы в равной мере и для сложности в худшем случае, и для сложности в среднем. Принимая это во внимание, мы получаем следствие предложения 17.1:

Сортировка бинарными вставками и сортировка фон Неймана, а также быстрая сортировка являются оптимальными по порядку сложности в среднем по числу сравнений.

К этому списку позднее мы добавим и рекурсивную сортировку слияниями. Наиболее же существенно упоминание в этом списке быстрой сортировки. С одной стороны, как мы знали и раньше, эта сортировка очень удобна и имеет низкую пространственную сложность, с другой—мы видим теперь, что и в смысле временной сложности в среднем эта сортировка в определенном смысле может быть отнесена к наилучшим.

Можно показать существование оптимальной в среднем сортировки: для каждого фиксированного n в множестве всех деревьев сортировки массивов длины n можно рассмотреть подмножество деревьев, имеющих наименьшую сумму H высот всех листьев (тогда и H/n\ будет иметь наименьшее значение), и взять какое-нибудь из деревьев этого подмножества. Определяя сортировку этим способом для всех n мы получаем оптимальную сортировку. Для любой оптимальной в среднем сортировки выполнено

T_opt(n)~log₂n!~nlog₂n,

так как, например, мы имеем T_vN(n)~log₂n! и

T_vN(n) ^ T_vN(n) ^ T(n) ^ log₂ n\.

В этом примере, как и во всем этом параграфе, мы не касаемся рандомизированных алгоритмов, о которых будет говориться в § 18.

Как мы ранее наблюдали в некоторых примерах, рассмотрение функции L, подобранной надлежащим образом, и изучение изменения ее значений в ходе выполнения алгоритма нередко позволяет получать хорошие оценки (в частности, нижние границы) сложности в худшем случае. Рассмотрение такого рода функций может приводить к цели и при исследовании сложности в среднем. В задаче 37 функцию L можно определить как максимум значений компонент

<<< < Предыдущая 36 37 38 39 40 41 42 43 44 45 46 4748 / 9348 49 50 51 52 53 54 55 56 57 58 59 60 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.11.2018554.5 Кб268_Электростатика.doc
#
25.09.2019290.3 Кб219.Поляризация.doc
#
11.05.2015253.63 Кб47923-kinematika.pdf
#
12.11.2018445.44 Кб1669_Законы постоянного тока.doc
#
11.05.201592.86 Кб9about_ns2_rus.pdf
#
11.05.20152.74 Mб136abramov_s_a_lekcii_o_slozhnosti_algoritmov.doc
#
11.05.201523.5 Mб115Access 2007.pdf
#
11.05.20157.97 Mб158ALGEBRA.pdf
#
11.05.20154.88 Mб18All.pdf
#
11.05.20154.31 Mб559Anteny_Fidery.pdf
#
11.05.20151.01 Mб103Atomnaya_fizika_UP.pdf