- •61. Аномалии модификации реляционных таблиц. Нормализация реляционных отношений.
- •62. Организация файлов на физическом уровне и способы их адресации. Статистические хэш функции.
- •64. Концептуальный, внутренний и внешний уровни представления данных в базе данных.
- •65. Инвертированный файл. Технология доступа к данным по вторичному ключу.
- •10. Предметная область банка данных, подходы к определению границ предметной области. Системный анализ предметной области, его задачи.
- •11. Понятие отображения и ассоциации в модели «Сущность-связь», их сходство и различие. Привести пример.
- •22. Сетевая модель данных. Язык описания данных (ddl) в сетевой модели.
- •20. Реляционная модель данных. Операции реляционной алгебры, выполняемые над отношениями.
- •32. Физическая организация данных. Списковые структуры, связное распределение памяти.
- •34.Сетевая модель данных. Язык манипулирования данными (dml) сетевой модели.
- •35. Организация данных в памяти. Связанное распределение памяти. Адресная функция.
- •37. Определение бд, требования, предъявляемые к бд.
- •38. Представление древовидных структур связанными линейными списками.
- •40. Реляционные отношения. Операции выполняемые над реляционными отношениями. Операция естественного соединения реляционных таблиц, пример.
- •41. Физическая организация сетевых структур данных.
- •42.Команда select языка запросов к бд sql. Формат и назначение команды.
- •43. Двухуровневая архитектура банка данных (БнД). Процесс прохождения пользовательского запроса в БнД с двухуровневой архитектурой.
- •55. База данных, определение, классификация бд, требования, предъявляемые к бд.
- •56. Транзитивная зависимость атрибутов реляционных отношений. Третья нормальная форма. Привести пример приведения отношения к 3нф.
- •57.Установить тип функциональной связи между сущностями:
- •58.Структура даталогической модели данных, определенная стандартом codasyl. Определение и назначение структурных компонентов этой модели.
- •52.Первая и вторая нормальные формы реляционных отношений. Привести пример приведения отношения ко второй нормальной форме.
- •44.Физическая организация данных. Бинарное дерево. Поиск записи по бинарному дереву.
- •46.Трехуровневая архитектура банка данных (БнД).
- •47. Неплотный индекс. Технология поиска записей в основном файле внешней памяти с использованием неплотного индекса.
- •49.Функциональная зависимость атрибутов реляционных отношений. Нормализация отношений.
- •53.Инвертированный файл.
- •89. Плотный индекс. Технология поиска записей базы данных в основном файле внешней памяти с использованием плотного индекса.
- •86.Корректирующие запросы в субд access. Команды sql, реализующие эти запросы.
- •83.Схема описания полей, входящих в тип сегмента иерархической модели данных.
- •82.Агрегированные объекты в модели «Сущность-связь». Определение, пример, графическая интерпретация.
- •80.Схема описания полей, входящих в тип сегмента иерархической модели данных.
- •79.Подтипы сущностей в модели «Сущность-связь». Определение, пример, графическая интерпретация.
- •77.Схема описания типов сегментов иерархической модели данных в соответствии с иерархией.
- •74.Операции поиска в сетевой модели данных.
- •73.Реляционные таблицы. Первичные и внешние ключи отношений. Назначение этих ключей.
- •71.Методы обработки файлов на физическом уровне. Алгоритм поиска по бинарному дереву.
- •70.Слабые сущности в инфологической модели «Сущность-связь». Определение, пример, графическая интерпретация.
- •85.Реляционная схема таблиц. Логический и физический ключ реляционных отношений. Определение, назначение, пример.
- •88. Язык описания данных реляционных таблиц (ddl). Структура этого языка.
- •76.Идентификационно-зависимые сущности в модели «Сущность-связь». Определение, пример, графическая интерпретация.
- •59 Списковые структуры данных
- •1.Понятие информации и данных, их сходство и различие.
- •2. Инфологическая модель данных "Сущность-связь"
- •4.Сущность инфологического и даталогического подходов к проектированию баз данных. Задачи, решаемые на этапе инфологического проектирования информационной модели базы данных.
- •5.Тип связи «1:1» между объектами предметной области, определение, пример. Графическая интерпретация.
- •7.Понятие банка данных. Компоненты банка данных и их назначение. Задачи, выполняемые банком данных.
- •8.Агрегация и обобщение в модели «Сущность-связь» определение, сходство и различие. Примеры агрегации и обобщения.
- •13. Нормализация реляционных отношений. Нормальная форма Бойса-Кодда.
- •14. Древовидная иерархическая структура базы данных. Рекурсивное дерево.
- •16. Архитектура базы данных. Физическая и логическая независимость данных.
- •17.Сетевая модель данных. Ограничения целостности сетевой модели. Сетевой подход к организации данных является расширением иерархического подхода.
- •19.Пользователи БнД. Основные функции группы администратора бд
- •23 Дерево – это нелинейная структура данных, используемая для представления иерархических связей, имеющих отношение «один ко многим».
- •26.Представление древовидных структур связанными линейными списками. Метод указателей на порожденные записи.
- •29.Физическая организация данных. Списковые структуры, последовательное распределение памяти.
- •31.Классификация баз данных. Документальные базы данных.
- •50.Плотный индекс. Технология поиска записей базы данных в основном файле внешней памяти с использованием плотного индекса.
- •73.Реляционные таблицы. Первичные и внешние ключи отношений. Назначение этих ключей.
53.Инвертированный файл.
Инвертированный файл - в информационных технологиях рассматривается как структурированная индексная информация, в которой хранятся данные о местонахождении каждого элемента контента во всех местах, к примеру, слова или числа, и их расположение в документе или базе данных. Инвертированный файл позволяет осуществлять эффективный поиск нужного элемента данных поисковой системой. Инверсный файл является наиболее распространенной структурой данных, применимых в системах поиска документов и информации.
Широко распространены на практике методы многоаспекторного поиска по инвертированным файлам. Пусть имеется основной файл F, упорядоченный либо не упорядоченный по значениям вторичного ключа Ki. Построим дополнительный файл Fdiпо правилу:1)записи файла FDi имеют формат Fdi(Ki,P), где Ki-поле, принимающее значение вторичного ключа Ki записиосновного файла; P- указатели на записи основного файла f, имеющие данное значение вторичного ключа Ki; 2)записи файла Fdi упорядочены по полю Ki.
Построенный дополнительный файл Fdi называется инвертированным. В этом случае об основном файле F говорят, что он инвертирован по полю Ki. Количество записей в инвертированном файле FDi определяется количеством значений вторичного ключа Ki в записях основного файла F. Пример инвертированного файла по полю K2 для основного файла F.
Рассмотренный способ организации инвертированного файла предполагает использование записей переменной длины. Инвертированный файл можно оргнанизовать и с помощью записей фиксированной длины, если в каждой записи инвертированного файла выделять фиксированное число полей для указателей P. Если фиксированного числа полей для некоторых записей окажется недостаточно, то организуется еще дополнительный служебный файл для хранения неуместившихся цепочек указателей.
Поскольку записи инвертированного файла упорядочены, но значению ключа, то для поиска записей можно использовать любой из рассмотренных выше методов поиска в упорядоченном файле (например, бинарный поиск или В -дерево). Чтобы выполнить многоаспектный поиск по n ключам, необходимо построить n инвертированных файлов.
89. Плотный индекс. Технология поиска записей базы данных в основном файле внешней памяти с использованием плотного индекса.
Рассмотрим файлы с плотным индексом. В этих файлах основная область содержит последовательность записей одинаковой длины, расположенных в произвольном порядке, а структура индексной записи в них имеет следующий вид:
Значение ключа |
Номер записи |
Здесь значение ключа — это значение первичного ключа, а номер записи — это порядковый номер записи в основной области, которая имеет данное значение первичного ключа.
Так как индексные файлы строятся для первичных ключей, однозначно определяющих запись, то в них не может быть двух записей, имеющих одинаковые значения первичного ключа. В индексных файлах с плотным индексом для каждой записи в основной области существует одна запись из индексной области. Все записи в индексной области упорядочены по значению ключа, поэтому можно применить более эффективные способы поиска в упорядоченном пространстве.
Длина доступа к произвольной записи оценивается не в абсолютных значениях, а в количестве обращений к устройству внешней памяти, которым обычно является диск. Именно обращение к диску является наиболее длительной операцией по сравнению со всеми обработками в оперативной памяти.
Наиболее эффективным алгоритмом поиска на упорядоченном массиве является логарифмический, или бинарный, поиск. При этом все пространство поиска разбивается пополам, и так как оно строго упорядочено, то определяется сначала, не является ли элемент искомым, а если нет, то в какой половине его надо искать. Следующим шагом мы определенную половину также делим пополам и производим аналогичные сравнения, и т. д., пока не обнаружим искомый элемент. Максимальное количество шагов поиска определяется двоичным логарифмом от общего числа элементов в искомом пространстве поиска:
Tn = log2N,
где N — число элементов.
Однако в нашем случае является существенным только число обращений к диску при поиске записи по заданному значению первичного ключа. Поиск происходит в индексной области, где применяется двоичный алгоритм поиска индексной записи, а потом путем прямой адресации мы обращаемся к основной области уже по конкретному номеру записи. Для того чтобы оценить максимальное время доступа, нам надо определить количество обращений к диску для поиска произвольной записи.
На диске записи файлов хранятся в блоках. Размер блока определяется физическими особенностями дискового контроллера и операционной системой. В одном блоке могут размещаться несколько записей. Поэтому нам надо определить количество индексных блоков, которое потребуется для размещения всех требуемых индексных записей, а потому максимальное число обращений к диску будет равно двоичному логарифму от заданного числа блоков плюс единица. Зачем нужна единица? После поиска номера записи в индексной области мы должны еще обратиться к основной области файла. Поэтому формула для вычисления максимального времени доступа в количестве обращений к диску выглядит следующим образом:
Tn = log2Nбл. инд. + 1.