- •Содержание
- •Основные сведения
- •Понятия алгоритма и структуры данных
- •Анализ сложности и эффективности алгоритмов и структур данных
- •Структуры данных
- •Элементарные данные
- •Данные числовых типов
- •Данные целочисленного типа
- •Данные вещественного типа
- •Операции над данными числовых типов
- •Данные символьного типа
- •Данные логического типа
- •Данные типа указатель
- •Линейные структуры данных
- •Множество
- •Линейные списки
- •Линейный однонаправленный список
- •Линейный двунаправленный список
- •Циклические списки
- •Циклический однонаправленный список
- •Циклический двунаправленный список
- •Разреженные матрицы
- •Матрицы с математическим описанием местоположения элементов
- •Матрицы со случайным расположением элементов
- •Очередь
- •Нелинейные структуры данных
- •Мультисписки
- •Слоеные списки
- •Спецификация
- •Реализация
- •Деревья
- •Общие сведения
- •Обходы деревьев
- •Спецификация двоичных деревьев
- •Реализация
- •Основные операции
- •Организация
- •Представление файлов b-деревьями
- •Основные операции
- •Общая оценка b-деревьев
- •Алгоритмы обработки данных
- •Методы разработки алгоритмов
- •Метод декомпозиции
- •Динамическое программирование
- •Поиск с возвратом
- •Метод ветвей и границ
- •Метод альфа-бета отсечения
- •Локальные и глобальные оптимальные решения
- •Алгоритмы поиска
- •Поиск в линейных структурах
- •Последовательный (линейный) поиск
- •Бинарный поиск
- •Хеширование данных
- •Функция хеширования
- •Открытое хеширование
- •Закрытое хеширование
- •Реструктуризация хеш-таблиц
- •Поиск по вторичным ключам
- •Инвертированные индексы
- •Битовые карты
- •Использование деревьев в задачах поиска
- •Упорядоченные деревья поиска
- •Случайные деревья поиска
- •Оптимальные деревья поиска
- •Сбалансированные по высоте деревья поиска
- •Поиск в тексте
- •Прямой поиск
- •Алгоритм Кнута, Мориса и Пратта
- •Алгоритм Боуера и Мура
- •Алгоритмы кодирования (сжатия) данных
- •Общие сведения
- •Метод Хаффмана. Оптимальные префиксные коды
- •Кодовые деревья
- •Алгоритмы сортировки
- •Основные сведения. Внутренняя и внешняя сортировка
- •Алгоритмы внутренней сортировки
- •Сортировка подсчетом
- •Сортировка простым включением
- •Сортировка методом Шелла
- •Сортировка простым извлечением.
- •Древесная сортировка
- •Сортировка методом пузырька
- •Быстрая сортировка (Хоара)
- •Сортировка слиянием
- •Сортировка распределением
- •Сравнение алгоритмов внутренней сортировки
- •Алгоритмы внешней сортировки
- •Алгоритмы на графах
- •Алгоритм определения циклов
- •Алгоритмы обхода графа
- •Поиск в глубину
- •Поиск в ширину (Волновой алгоритм)
- •Нахождение кратчайшего пути
- •Алгоритм Дейкстры
- •Алгоритм Флойда
- •Переборные алгоритмы
- •Нахождение минимального остовного дерева
- •Алгоритм Прима
- •Алгоритм Крускала
- •190000, Санкт-Петербург, ул. Б. Морская, 67
Министерство образования Российской Федерации
Санкт-Петербургский государственный университет
аэрокосмического приборостроения
СТРУКТУРЫ И АЛГОРИТМЫ ОБРАБОТКИ ДАННЫХ
Учебное пособие
Санкт-Петербург
2003
УДК 681.3
Ключарев А.А., Матьяш В.А., Щекин С.В.
Структуры и алгоритмы обработки данных
– СПб, ГУАП, 2003. –
В учебном пособии приводятся описания различных форм организации данных в программах, методов обработки данных в различных классах задач и осуществляется их сравнительный анализ.
Учебное пособие предназначено для изучения теоретического материала дисциплин «Структуры и алгоритмы и обработки данных» и «Структуры и алгоритмы компьютерной обработки данных» студентами различных форм обучения, проходящих подготовку по специальностям 220400 и 351500.
Рецензенты:
Утверждено:
Содержание
Введение 4
1 Основные сведения 5
2 Структуры данных 12
3 Алгоритмы обработки данных 78
Литература 162
Русскоязычные ресурсы InterNet 163
Введение
В этом учебном пособии описаны структуры данных и алгоритмы, которые являются основой современного компьютерного программирования. Знание этих структур и алгоритмов позволяет осуществлять выбор наиболее оптимальных способов решения задач, возникающих при создании программного обеспечения различного назначения.
Учебное пособие состоит из трех разделов. В первом разделе рассматриваются основные понятия алгоритмов и структур данных, а также основные подходы к анализу их сложности.
Во втором разделе приводятся описания различных структур данных и основных операций над ними. Рассмотрены элементарные типы данных, линейные и нелинейные структуры, а также файлы.
Третий раздел посвящен основным алгоритмам обработки рассмотренных ранее структур данных и анализу сложности этих алгоритмов. Приводятся различные алгоритмы поиска, сортировки, сжатия данных и алгоритмы на графах, а также обсуждаются методы разработки алгоритмов.
Материал учебного пособия базируется на следующих дисциплинах: «Программирование на языках высокого уровня», «Математическая логика и теория алгоритмов», «Дискретная математика», «Математическое обеспечение программных систем».
-
Основные сведения
-
Понятия алгоритма и структуры данных
-
Алгоритм – это точное предписание, определяющее вычислительный процесс, ведущий от варьируемых начальных данных к искомому результату.
ЭВМ в настоящее время приходится не только быстро считать и выполнять определенные алгоритмы, но и хранить значительные объемы информации, к которым можно довольно быстро и легко обратиться. Эта информация в некотором смысле представляет собой абстракцию некоторого фрагмента реального мира и состоит из определенного множества данных, относящихся к какой-либо проблеме.
Независимо от содержания и сложности любые данные в памяти ЭВМ представляются последовательностью двоичных разрядов, или битов, а их значениями являются соответствующие двоичные числа. Данные, рассматриваемые в виде последовательности битов, имеют очень простую организацию или, другими словами, слабо структурированы. Для человека описывать и исследовать сколько-нибудь сложные данные в терминах последовательностей битов весьма неудобно. Более крупные и содержательные, нежели бит, «строительные блоки» для организации произвольных данных получаются на основе понятия «структуры данного».
Под структурой данных в общем случае понимают множество элементов данных и множество связей между ними. Такое определение охватывает все возможные подходы к структуризации данных, но в каждой конкретной задаче используются те или иные его аспекты. Поэтому вводится дополнительная классификация структур данных, направления которой соответствуют различным аспектам их рассмотрения. Прежде чем приступать к изучению конкретных структур данных, дадим их общую классификацию по нескольким признакам.
Понятие «физическая структура данных» отражает способ физического представления данных в памяти машины и называется еще структурой хранения, внутренней структурой или структурой памяти.
Рассмотрение структуры данных без учета ее представления в машинной памяти называется абстрактной или логической структурой. В общем случае между логической и соответствующей ей физической структурами существует различие, степень которого зависит от самой структуры и особенностей той среды, в которой она должна быть отражена. Вследствие этого различия существуют процедуры, осуществляющие отображение логической структуры в физическую и, наоборот, физической структуры в логическую. Эти процедуры обеспечивают, кроме того, доступ к физическим структурам и выполнение над ними различных операций, причем каждая операция рассматривается применительно к логической или физической структуре данных. Кроме того, в зависимости от размещения физических структур, а соответственно, и доступа к ним, различают внутренние (находятся в оперативной памяти) и внешние (на внешних устройствах) структуры данных.
Различаются элементарные (простые, базовые, примитивные) структуры данных и составные (интегрированные, композитные, сложные). Элементарными называются такие структуры данных, которые не могут быть расчленены на составные части, большие, чем биты. С точки зрения физической структуры важным является то обстоятельство, что в конкретной машинной архитектуре, в конкретной системе программирования всегда можно заранее сказать, каков будет размер элементарного данного и каково его размещение в памяти. С логической точки зрения элементарные данные являются неделимыми единицами. Составными называются такие структуры данных, составными частями которых являются другие структуры данных - элементарные или в свою очередь составные. Составные структуры данных конструируются программистом с использованием средств интеграции данных, предоставляемых языками программирования.
Важный признак составной структуры данных – характер упорядоченности ее составных частей. По этому признаку структуры можно делить на линейные и нелинейные структуры.
Классификация структур данных по вышеназванным признакам приведена ниже (см. Рисунок 1).
Весьма важный признак структуры данных – ее изменчивость, то есть изменение числа элементов и/или связей между составными частями структуры. В определении изменчивости структуры не отражен факт изменения значений элементов данных, поскольку в этом случае все структуры данных имели бы свойство изменчивости. По признаку изменчивости различают структуры статические и динамические.
В языках программирования понятие «структуры данных» тесно связано с понятием «типы данных». Любые данные, то есть константы, переменные, значения функций или выражения, характеризуются своими типами.
Информация по каждому типу однозначно определяет:
-
структуру хранения данных указанного типа, то есть выделение памяти, представление данных в ней и метод доступа к данным;
-
множество допустимых значений, которые может иметь тот или иной объект описываемого типа;
-
набор допустимых операций, которые применимы к объекту описываемого типа.
Рисунок 1. Классификация структур данных
В последующих разделах рассматриваются структуры данных и соответствующие им типы данных. Базы данных детально изучаются в рамках отдельных дисциплин, и здесь рассматриваться не будут.
При описании элементарных типов и при конструировании составных типов использовался в основном на язык Паскаль. Этот язык используется и во всех примерах, поскольку он был создан специально для иллюстрирования структур данных и алгоритмов и традиционно используется для этих целей. В любом другом процедурном языке программирования высокого уровня (Си, Фортран и т.д.) без труда можно найти аналогичные средства.