- •61. Аномалии модификации реляционных таблиц. Нормализация реляционных отношений.
- •62. Организация файлов на физическом уровне и способы их адресации. Статистические хэш функции.
- •64. Концептуальный, внутренний и внешний уровни представления данных в базе данных.
- •65. Инвертированный файл. Технология доступа к данным по вторичному ключу.
- •10. Предметная область банка данных, подходы к определению границ предметной области. Системный анализ предметной области, его задачи.
- •11. Понятие отображения и ассоциации в модели «Сущность-связь», их сходство и различие. Привести пример.
- •22. Сетевая модель данных. Язык описания данных (ddl) в сетевой модели.
- •20. Реляционная модель данных. Операции реляционной алгебры, выполняемые над отношениями.
- •32. Физическая организация данных. Списковые структуры, связное распределение памяти.
- •34.Сетевая модель данных. Язык манипулирования данными (dml) сетевой модели.
- •35. Организация данных в памяти. Связанное распределение памяти. Адресная функция.
- •37. Определение бд, требования, предъявляемые к бд.
- •38. Представление древовидных структур связанными линейными списками.
- •40. Реляционные отношения. Операции выполняемые над реляционными отношениями. Операция естественного соединения реляционных таблиц, пример.
- •41. Физическая организация сетевых структур данных.
- •42.Команда select языка запросов к бд sql. Формат и назначение команды.
- •43. Двухуровневая архитектура банка данных (БнД). Процесс прохождения пользовательского запроса в БнД с двухуровневой архитектурой.
- •55. База данных, определение, классификация бд, требования, предъявляемые к бд.
- •56. Транзитивная зависимость атрибутов реляционных отношений. Третья нормальная форма. Привести пример приведения отношения к 3нф.
- •57.Установить тип функциональной связи между сущностями:
- •58.Структура даталогической модели данных, определенная стандартом codasyl. Определение и назначение структурных компонентов этой модели.
- •52.Первая и вторая нормальные формы реляционных отношений. Привести пример приведения отношения ко второй нормальной форме.
- •44.Физическая организация данных. Бинарное дерево. Поиск записи по бинарному дереву.
- •46.Трехуровневая архитектура банка данных (БнД).
- •47. Неплотный индекс. Технология поиска записей в основном файле внешней памяти с использованием неплотного индекса.
- •49.Функциональная зависимость атрибутов реляционных отношений. Нормализация отношений.
- •53.Инвертированный файл.
- •89. Плотный индекс. Технология поиска записей базы данных в основном файле внешней памяти с использованием плотного индекса.
- •86.Корректирующие запросы в субд access. Команды sql, реализующие эти запросы.
- •83.Схема описания полей, входящих в тип сегмента иерархической модели данных.
- •82.Агрегированные объекты в модели «Сущность-связь». Определение, пример, графическая интерпретация.
- •80.Схема описания полей, входящих в тип сегмента иерархической модели данных.
- •79.Подтипы сущностей в модели «Сущность-связь». Определение, пример, графическая интерпретация.
- •77.Схема описания типов сегментов иерархической модели данных в соответствии с иерархией.
- •74.Операции поиска в сетевой модели данных.
- •73.Реляционные таблицы. Первичные и внешние ключи отношений. Назначение этих ключей.
- •71.Методы обработки файлов на физическом уровне. Алгоритм поиска по бинарному дереву.
- •70.Слабые сущности в инфологической модели «Сущность-связь». Определение, пример, графическая интерпретация.
- •85.Реляционная схема таблиц. Логический и физический ключ реляционных отношений. Определение, назначение, пример.
- •88. Язык описания данных реляционных таблиц (ddl). Структура этого языка.
- •76.Идентификационно-зависимые сущности в модели «Сущность-связь». Определение, пример, графическая интерпретация.
- •59 Списковые структуры данных
- •1.Понятие информации и данных, их сходство и различие.
- •2. Инфологическая модель данных "Сущность-связь"
- •4.Сущность инфологического и даталогического подходов к проектированию баз данных. Задачи, решаемые на этапе инфологического проектирования информационной модели базы данных.
- •5.Тип связи «1:1» между объектами предметной области, определение, пример. Графическая интерпретация.
- •7.Понятие банка данных. Компоненты банка данных и их назначение. Задачи, выполняемые банком данных.
- •8.Агрегация и обобщение в модели «Сущность-связь» определение, сходство и различие. Примеры агрегации и обобщения.
- •13. Нормализация реляционных отношений. Нормальная форма Бойса-Кодда.
- •14. Древовидная иерархическая структура базы данных. Рекурсивное дерево.
- •16. Архитектура базы данных. Физическая и логическая независимость данных.
- •17.Сетевая модель данных. Ограничения целостности сетевой модели. Сетевой подход к организации данных является расширением иерархического подхода.
- •19.Пользователи БнД. Основные функции группы администратора бд
- •23 Дерево – это нелинейная структура данных, используемая для представления иерархических связей, имеющих отношение «один ко многим».
- •26.Представление древовидных структур связанными линейными списками. Метод указателей на порожденные записи.
- •29.Физическая организация данных. Списковые структуры, последовательное распределение памяти.
- •31.Классификация баз данных. Документальные базы данных.
- •50.Плотный индекс. Технология поиска записей базы данных в основном файле внешней памяти с использованием плотного индекса.
- •73.Реляционные таблицы. Первичные и внешние ключи отношений. Назначение этих ключей.
50.Плотный индекс. Технология поиска записей базы данных в основном файле внешней памяти с использованием плотного индекса.
Рассмотрим файлы с плотным индексом. В этих файлах основная область содержит последовательность записей одинаковой длины, расположенных в произвольном порядке, а структура индексной записи в них имеет следующий вид:
Значение ключа |
Номер записи |
Здесь значение ключа — это значение первичного ключа, а номер записи — это порядковый номер записи в основной области, которая имеет данное значение первичного ключа.
Так как индексные файлы строятся для первичных ключей, однозначно определяющих запись, то в них не может быть двух записей, имеющих одинаковые значения первичного ключа. В индексных файлах с плотным индексом для каждой записи в основной области существует одна запись из индексной области. Все записи в индексной области упорядочены по значению ключа, поэтому можно применить более эффективные способы поиска в упорядоченном пространстве.
Длина доступа к произвольной записи оценивается не в абсолютных значениях, а в количестве обращений к устройству внешней памяти, которым обычно является диск. Именно обращение к диску является наиболее длительной операцией по сравнению со всеми обработками в оперативной памяти.
Наиболее эффективным алгоритмом поиска на упорядоченном массиве является логарифмический, или бинарный, поиск. При этом все пространство поиска разбивается пополам, и так как оно строго упорядочено, то определяется сначала, не является ли элемент искомым, а если нет, то в какой половине его надо искать. Следующим шагом мы определенную половину также делим пополам и производим аналогичные сравнения, и т. д., пока не обнаружим искомый элемент. Максимальное количество шагов поиска определяется двоичным логарифмом от общего числа элементов в искомом пространстве поиска:
Tn = log2N,
где N — число элементов.
Однако в нашем случае является существенным только число обращений к диску при поиске записи по заданному значению первичного ключа. Поиск происходит в индексной области, где применяется двоичный алгоритм поиска индексной записи, а потом путем прямой адресации мы обращаемся к основной области уже по конкретному номеру записи. Для того чтобы оценить максимальное время доступа, нам надо определить количество обращений к диску для поиска произвольной записи.
На диске записи файлов хранятся в блоках. Размер блока определяется физическими особенностями дискового контроллера и операционной системой. В одном блоке могут размещаться несколько записей. Поэтому нам надо определить количество индексных блоков, которое потребуется для размещения всех требуемых индексных записей, а потому максимальное число обращений к диску будет равно двоичному логарифму от заданного числа блоков плюс единица. Зачем нужна единица? После поиска номера записи в индексной области мы должны еще обратиться к основной области файла. Поэтому формула для вычисления максимального времени доступа в количестве обращений к диску выглядит следующим образом:
Tn = log2Nбл. инд. + 1