- •Глава 9 Физические модели баз данных
- •Файловые структуры, используемые для хранения информации в базах данных
- •Стратегия разрешения коллизий с областью переполнения
- •Организация стратегии свободного замещения
- •Индексные файлы
- •Файлы с плотным индексом, или индексно-прямые файлы
- •Файлы с неплотным индексом, или индексно-последовательные файлы
- •Организация индексов в виде в-tree (в-деревьев)
- •Моделирование отношений «один-ко-многим» на файловых структурах
- •Моделирование отношения 1:м с использованием однонаправленных указателей
- •Алгоритм нахождения нужных записей «подчиненного» файла
- •Алгоритм удаления записи из цепочки «подчиненного» файла
- •Инвертированные списки
- •Модели физической организации данных при бесфайловой организации
- •Структура хранения данных для ms sql 6.5
- •Структуры хранения данных в sql Server 7.0
- •Карты распределения блоков
- •Карты свободного пространства
- •Карты размещения
- •Страницы данных
- •Строки данных
- •Текстовые страницы
- •Страницы журнала транзакций
- •Архитектура разделяемой памяти
- •Глава 10 Распределенная обработка данных
- •Терминология
- •Модели «клиент—сервер» в технологии баз данных
- •Двухуровневые модели
- •Модель удаленного управления данными. Модель файлового сервера
- •Модель удаленного доступа к данным
- •Модель сервера баз данных
- •Модель сервера приложений
- •Модели серверов баз данных
- •Типы параллелизма
- •Глава 11 Модели транзакций
- •Свойства транзакций. Способы завершения транзакций
- •Журнал транзакций
- •Журнализация и буферизация
- •Индивидуальный откат транзакции
- •Восстановление после мягкого сбоя
- •Физическая согласованность базы данных
- •Восстановление после жесткого сбоя
- •Параллельное выполнение транзакций
- •Уровни изолированности пользователей
- •Гранулированные синхронизационные захваты
- •Предикатные синхронизационные захваты
- •Метод временных меток
- •Глава 12 Встроенный sql
- •Операторы, связанные с многострочными запросами
- •Оператор определения курсора
- •Оператор открытия курсора
- •Оператор чтения очередной строки курсора
- •Оператор закрытия курсора
- •Удаление и обновление данных с использованием курсора
- •Хранимые процедуры
- •Триггеры
- •Динамический sql
- •Глава 6. Проектирование реляционных бд на основе
- •Глава 7. Мифологическое моделирование . . .............. 121
- •Глава 8. Принципы поддержки целостности
- •Глава 9. Физические модели баз данных................. 162
Строки данных
Строки данных претерпели существенное изменение. Отметим наиболее важные моменты.
Q Номера строки больше нет — строка идентифицируется номером слота, который ее определяет, либо значением кластерного ключа.
Q В версии 6.5 поля, допускающие NULL, хранятся точно так же, как поля переменной длины. В версии 7.0 поля фиксированной длины всегда занимают свою полную длину, значение NULL задается специальным флагом. Это облегчает замену неопределенного значения на некоторое конкретное без перемещения строк на странице.
Q Фиксированные поля вместе с описателями хранятся до полей переменной длины, так же как и в 6.5.
Q В каждой строке хранится общая длина строки и текущие длины полей переменной длины. Отсутствуют таблицы смещений и подстройки смещений. Данные считываются последовательно с начального адреса.
Q Максимальное количество полей в строке 1024, в версии 6.5 только 256.
Текстовые страницы
В версии 7.0 изменены принципы хранения текстовых полей. Строки данных по-прежнему содержат 16-байтные указатели на текстовые данные. Однако хранение самих текстовых данных производится иначе.
Текстовая страница теперь может содержать несколько текстовых полей. Собственно данные хранятся в виде сбалансированного дерева (B-tree). Строка данных содержит указатель на корневую структуру (Root structure) размером 84 байта.
Данные длиной менее 64 байт хранятся в корневой структуре. Для данных до 32 Кбайт корневая структура (Root structure) может адресовать 4 блока данных (это не блоки страниц) до 8 Кбайт каждый. Блоки наращиваются до 8 Кбайт (реально на одной текстовой странице может быть размещено 8080 байт). Например, если первая порция данных составляет 4 Кбайта, то отводится один блок. Если в дальнейшем данные увеличиваются до 6 Кбайт, то первый блок увеличивается до 6 Кбайт, а второй блок имеет размер всего 2 Кбайта.
Если же длина текстового поля более 32 Кбайт, то строятся промежуточные узлы.
В версии 7.0 текстовая страница может содержать данные нескольких текстовых полей (рис. 9.18).
Страницы журнала транзакций
В отличие от версии 6.5 в новой версии под журнал транзакций отводится всегда отдельный файл. В предыдущей версии журнал транзакций являлся системной таблицей и хранился в системном сегменте LOG. Несмотря на настоятельные рекомендации располагать журнал транзакций и файлы базы данных на разных физических устройствах, СУБД автоматически не контролировала этот факт. В новой версии журнал транзакций всегда хранится в отдельном файле.
Архитектура разделяемой памяти
По причинам объективно существующей разницы в скорости работы процессоров, оперативной памяти и устройств внешней памяти (эта разница в скорости существовала, существует и будет существовать всегда) буферизация страниц базы данных в оперативной памяти — единственный реальный способ достижения удовлетворительной эффективности СУБД.
Операционные системы создают специальные системные буферы, которые служат для кэширования пользовательских процессов. Однако стратегия буферизации, применяемая в операционных средах, не соответствует целям и задачам СУБД, поэтому для оптимизации обработки данных одной из главных задач СУБД является создание эффективной системы управления процессом буферизации.
Разделяемая память, управляемая СУБД, состоит из нескольких типов буферов:
Q Буферы страниц данных, которые содержат копии страниц данных, с которыми работает СУБД.
Q Буферы страниц журнала транзакций, которые отражают процесс выполнения транзакции — последовательности операций над БД, переводящей БД из одного непротиворечивого состояния в другое непротиворечивое состояние.
Q Системные буферы, которые содержат общую информацию о БД, о пользователях, о физической структуре БД, о базе метаданных.
Информация в буферах взаимосвязана, и требуется эффективная система поддержки единой работы всех частей разделяемой памяти.
Если бы запись об изменении базы данных реально немедленно записывалась во внешнюю память, это привело бы к существенному замедлению работы системы.
Поэтому записи в журнал тоже буферизуются: при нормальной работе очередная страница выталкивается во внешнюю память журнала только при полном заполнении записями.
Но реальная ситуация является более сложной. Имеются два вида буферов — буфер журнала и буфер страниц оперативной памяти, которые содержат связанную информацию. И те и другие буферы могут выталкиваться во внешнюю память. Проблема состоит в выработке некоторой общей политики выталкивания, которая обеспечивала бы возможности восстановления состояния базы данных после сбоев.
Буфера не выделяются для каждого пользовательского процесса, они выделяются для всех процессов сервера БД. Это позволяет увеличить степень параллелизма при исполнении клиентских процессов.
Разделяемая память наиболее эффективно используется вспомогательными процессами сервера, иногда называемыми демонами, которые используются для синхронизации взаимодействующих процессов на сервере.
На этом мы закончили рассмотрение физических моделей, применяемых в базах данных. Физические модели большей частью скрыты от пользователей. Однако в SQL существует команда создания индексных файлов. При этом по умолчанию стандартно создаются индексные файлы для первичных ключей, для вторичных ключей индексные файлы создаются дополнительной командой CREATE INDEX, которая имеет следующий формат:
CREATE [UNIQUE] INDEX <имя_индекса> ON <имя_таблицы> ( <имя_столбца>[<признак упорядочения^ |
[,<имя_столбца>[<признак упорядочения>...]) <имя_индекса > - уникальный идентификатор в системе. <Признак упорядочениям>::={ASC | DESC}
Здесь ASC — признак упорядочения по возрастанию, DESC — признак упорядочения по убыванию значений соответствующего столбца в индексе.
Индекс может быть удален командой DROP, которая имеет следующий формат:
DROP INDEX <имя индекса>