Алгоритм пирамидальной сортировки (HeapSort)

Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Уфимский Государственный Авиационный Технический Университет

Предмет:

Методы программирования и прикладные алгоритмы

Файл:

Дроздов С. Методичка. Сортировка и поиск.doc

Скачиваний:

Добавлен:

02.05.2014

Размер:

561.66 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 279 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Алгоритм пирамидальной сортировки (HeapSort)

В некоторых приложениях (например, в задачах управления оборудованием в реальном времени) крайне важно иметь гарантию, что время работы критических ветвей программы даже в самом плохом случае не превысит некоторой заданной величины. Для таких задач использование QuickSortможет оказаться неприемлемым ввиду названного выше недостатка этого алгоритма – времени работы порядкаO(n²)в худшем случае. В этой ситуации следует использовать такой алгоритм, который работает гарантированно быстро даже в худшем случае.

Наиболее известным из таких алгоритмов является HeapSort, который по-русски принято называть пирамидальной сортировкой.

В основе алгоритма лежит понятие пирамиды.

Массив Aназывается пирамидой, если для всех его элементов выполнены следующие неравенства:

(3.1)

Смысл неравенств (3.1) можно наглядно пояснить на рис.3.1.

Рис. 3.1. Представление пирамиды в виде дерева

На рисунке массив-пирамида из 10 элементов изображен в виде сбалансированного бинарного дерева, вершины которого пронумерованы сверху вниз и слева направо. При этом элемент a_kвсегда будет в дереве «отцом» элементовa_2kиa_2k+1(если такие элементы имеются). Тогда неравенства (3.1) означают, что значение «отца» должно быть не меньше, чем значения каждого из «сыновей».

Следует, однако, помнить, что пирамида – это не дерево, а массив с определенными свойствами, а изображение пирамиды в виде дерева дано только для наглядности.

Пирамида вовсе не обязательно является сортированным массивом, однако она служит удобным промежуточным результатом при сортировке. Отметим, что первый элемент пирамиды (a₁) всегда является максимальным элементом массива.

Работа алгоритма HeapSortсостоит из двух последовательных фаз. На первой фазе исходный массив перестраивается в пирамиду, а на второй фазе из пирамиды строится сортированный массив.

Основной операцией, используемой как на первой, так и на второй фазах сортировки, является так называемое просеиваниеэлемента сквозь пирамиду.

Предположим, что неравенства (3.1) выполнены для элементов пирамиды, начиная с индексаk+1(т.е. для элементовa_k+1,a_k+2, … ,a_n). Процедура просеивания элементаa_kдолжна обеспечить выполнение (3.1) дляa_kи при этом не нарушить этих неравенств дляa_k+1,a_k+2, … ,a_n.

Алгоритм просеивания заключается в следующем.

Если a_kне имеет сыновей (т.е.2k > n), то просеивание закончено.
Если a_kимеет ровно одного сына (т.е.2k = n), то присвоитьl := nи перейти к шагу 4.
Сравнить значения двух сыновей вершины a_k: еслиa₂_k>a₂_k₊₁, тоl := 2k, иначеl := 2k + 1(т.е.l– это индекс большего из сыновейa_k).
Сравнить значения элемента a_kсо значением его большего сынаa_l: еслиa_k<a_l, то поменять местамиa_kиa_l.
Присвоить k := lи перейти к шагу 1.

На рис. 3.1выполнение просеивания выглядит следующим образом: вершина дерева, значение которой меньше значения хотя бы одного из ее сыновей, опускается вдоль одной из ветвей дерева, пока не займет свое законное место. При этом все остальные вершины дерева за пределами этой ветви остаются неизменными^¹.

Нетрудно видеть, что максимально возможное число повторений цикла в процедуре просеивания не превышает log₂n(поскольку на каждой итерации значениеkувеличивается по крайней мере в 2 раза).

Теперь нетрудно описать алгоритм сортировки HeapSortв целом, используя понятие просеивания элемента.

Первая фаза алгоритма (построение пирамиды)начинается с вычисления наибольшего индекса элементаa_k, у которого есть хотя бы один сын. Очевидно,k := n div 2. Затем выполняется просеивание элементовa_k,a_k–1,a_k–2, …,a₂,a₁. На этом построение пирамиды завершено.

Вторая фаза алгоритма (построение сортированного массива)состоит из следующих шагов.

Поменять местами элементы a₁иa_n. Напомним, что в пирамидеa₁– максимальный элемент; после обмена он будет стоять на последнем месте.
Присвоить n := n - 1. Тем самым мы как бы исключаем последний элемент из пирамиды и включаем его в сортированный массив, который должен быть результатом работы алгоритма.
Поскольку после обмена для нового элемента a₁могло нарушиться свойство (3.1), выполнить просеиваниеa₁. После этого на местеa₁окажется максимальный из оставшихся элементов пирамиды.
Если n > 1, то перейти к шагу 1, иначе сортировка завершена.

На каждой итерации второй фазы происходит исключение из пирамиды максимального из оставшихся в ней элементов. Этот элемент записывается на подобающее ему место в сортированном массиве. К концу работы алгоритма вся пирамида превращается в сортированный массив.

Оценим время работы каждой фазы алгоритма HeapSort. Первая фаза состоит изn/2операций просеивания, каждая из которых включает не болееlog₂(n)итераций цикла. Отсюда можем легко получить для первой фазы оценкуT_макс(n) = O(nlog(n)). Однако эта оценка чересчур грубая. В дальнейшем нам понадобится более точная оценка времени работы первой фазыHeapSort. Чтобы получить такую оценку, рассмотрим рис.3.2.

Рис. 3.2. Число итераций просеивания при построении пирамиды

Из числа всех nэлементов массиваAпримерно половина (n/2) не имеет сыновей и не требует просеивания (т.е. число итераций просеивания равно 0). Четверть элементов (n/4) имеет сыновей, но не имеет внуков, для этих элементов может быть выполнено не больше одной итерации просеивания. Для одной восьмой части элементов (n/8) могут быть выполнены две итерации, для одной шестнадцатой (n/16) – три итерации и т.д. Суммарное число итераций просеивания определится формулой:n(01/2 + 11/4 + 21/8 + 31/16 + …). Тряхнув воспоминаниями о матанализе, можно вычислить значение суммы ряда в скобках; это значение равно 1. Таким образом, получаем линейную оценку времени для первой фазы:T_макс(n) = O(n).

Вторая фаза алгоритма в основном представляет собой просеивание элементов сквозь уменьшающуюся пирамиду. Число итераций цикла можно примерно оценить как сумму log₂(n) + log₂(n–1) + log₂(n–2) + … + log₂(3) + log₂(3). Поверим без доказательства, что с точностью доO-большого эта сумма даетT_макс(n) = O(nlog(n)).

Время работы алгоритма в целом определяется более трудоемкой второй фазой и удовлетворяет оценке T_макс(n) = O(nlog(n)). Можно доказать, что такая же оценка справедлива и для среднего времени сортировки:T_ср(n) = O(nlog(n)). Таким образом,HeapSortпредставляет собой алгоритм сортировки, который гарантирует достаточно быструю работу даже в случае самых неудачных исходных данных. ЭтимHeapSortвыгодно отличается отQuickSort, который такой гарантии не дает. С другой стороны, практика показывает, что в среднем алгоритмHeapSortработает примерно вдвое медленнее, чемQuickSort.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 279 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете Методы программирования и прикладные алгоритмы

#
02.05.20143.46 Mб52Введение в С++. Страуструп..doc
#
02.05.2014648.7 Кб158Дроздов С. Комбинаторные задачи и элементы теории вычислительной сложности.DOC
#
02.05.2014561.66 Кб99Дроздов С. Методичка. Сортировка и поиск.doc
#
02.05.201453.76 Кб22Лабораторная работа №3.doc
#
02.05.2014995.33 Кб49Справочник по С++.doc
#
02.05.201425.43 Mб38Шпоры по МПиПА.doc
#
02.05.2014352.77 Кб28Шпоры по МПиПА1.doc