Добавил:

inrad Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский государственный университет информатики и радиоэлектроники

Предмет:

Основы и лингвистическое обеспечение баз данных

Файл:

Дейтл Введ в БД / Часть 1.doc

Скачиваний:

Добавлен:

01.04.2014

Размер:

657.92 Кб

Скачать

☆

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2618 19 20 21 22 23 24 25 26 > Следующая >>>

Глава 3.

Введение

в реляционные

базы данных

3.1. Введение

Как отмечалось в главе 1, основное внимание в книге концентрируется на реляционном подходе. В части II подробно описаны теоретические основы этого подхода, а точнее, реляционная модель. Эта глава является лишь предварительным и весьма неформальным введением в материал части II (и в некоторой степени в материал последующих глав), которое послужит основой для лучшего понимания следующих частей книги. Большинство тем, затронутых в этой главе, рассматривается в дальнейшем более формально и гораздо детальнее.

3.2. Реляционные системы

Реляционная система управления базами данных (или просто реляционная система) — это такая система, в которой, выполняются как минимум два условия.

1. Данные воспринимаются пользователем как таблицы (и никак иначе).

2. В распоряжении пользователя имеются операторы (например, для выборки данных), которые генерируют новые таблицы из старых и среди которых, по крайней мере, есть операторы SELECT (также известный как RESTRICT), PROJECT и JOIN.

Хотя это определение все еще довольно поверхностно, оно точнее данного в главе 1. На рис. 3.1 показан простой пример реляционной базы данных отделов и служащих. Как видите, эта база данных действительно "воспринимается как таблицы" (мы полагаем, что значение этих таблиц не требует пояснений).

DEPT

DEPT#

DNAME

BUDGET

Marketing

Development

Research

10M

12M

EMP

EMP#

ENAME

DEPT#

SALARY

Lopez

Cheng

Finzi

Saito

40K

42K

30K

35K

Рис. 3.1. База данных отделов и служащих (значения взяты для примера)

На рис. 3.2 показаны некоторые примеры операций SELECT, PROJECT и JOIN для этой базы данных. Ниже приведены (очень нестрогие!) определения этих операций.

• Операция SELECT (или RESTRICT) предназначена для извлечения определенных строк из таблицы.

• Операция PROJECT предназначена для извлечения определенных столбцов из таблицы.

• Операция JOIN предназначена для соединения двух таблиц на основе общих значений в общих столбцах.

SELECT (RESTRICT) : Результат:

Выборка строк из DEPT, где BUDGET > 8М

DEPT#

DNAME

BUDGET

Marketing

Development

10M

12M

PROJECT: Pезультат

Извлечение столбцов DEPT#, BUDGET

DEPT#

BUDGET

10M

12M

JOIN:

Результат:

Соединение DEPT и EMP на основе столбца DEPT#

DEPT#

DNAME

BUDGET

EMP#

ENAME

SALARY

Marketing

Development

10M

12M

Lopez

Cheng

Finzi

Saito

4OK

42K

30K

35K

Рис. 3.2. Примеры операций SELECT, PROJECT и JOIN

Из трех приведенных примеров комментарии, по-видимому, необходимы только к операции JOIN. Прежде всего, обратите внимание на то, что в таблицах DEPT и ЕМР есть общий столбец DEPT#, а следовательно, эти таблицы можно соединить на основе общих значений в этом столбце.

Это значит, что строка таблицы DEPT соединяется со строкой таблицы ЕМР, при этом образуется более длинная строка, но это происходит тогда и только тогда, когда у этих двух строк общее значение поля DEPT#. Например, следующие строки таблиц DEPT и ЕМР

DEPT#	DNAME	BUDGET
D1	Marketing	10M

EMP#

ENAME

DEPT#

SALARY

Lopez

40K

(названия столбцов приведены для наглядности) можно соединить в результирующую строку

DEPT#

DNAME

BUDGET

ЕМР#

ENAME

SALARY

Marketing

10M

Lopez

40K

(так как в общем столбце у этих строк одно и то же значение Dl). Общий результат состоит из множества всех таких соединенных строк. Обратите внимание, что столбец DEPT# в каждой результирующей строке встречается один раз, а не два. Обратите также внимание на то, что поскольку в таблице ЕМР нет значения D3 в поле DEPT# (т.е. нет служащих, работающих в отделе D3), то нет и результирующих строк со значением D3 в этом поле, хотя и есть строка со значением D3 в таблице DEPT.

Необходимо отметить один важный момент, очевидный из рис. 3.2: результат каждой из трех операций— это еще одна таблица. Это реляционное свойство замкнутости. Оно имеет очень большое значение главным образом потому, что результатом операции является объект того же рода, что и объект, над которым производилась операция, — а именно таблица. А это значит, что над результатом операции можно вновь проделать какую-либо другую операцию. Например, можно выбрать столбцы (операция PROJECT) из соединенной (операция JOIN) таблицы или соединить два результата операции SELECT и т.д. Другими словами, можно использовать вложенные выражения, т.е. выражения, в которых операнды представлены выражениями, а не простыми именами таблиц. В данной и последующих главах вы увидите, что этот факт имеет, в свою очередь, множество важных следствий.

Замечание. Отмечая, что результатом каждой операции является таблица, мы имеем в виду, что это таблица с концептуальной точки зрения. Мы не хотим сказать, что система обязательно должна полностью материализовать результат каждой отдельной операции. Предположим, например, что нам понадобилось выбрать строки (операция SELECT) из соединения таблиц. Тогда, как только данная строка соединения будет сформирована, система может немедленно применять ограничение к такой строке, чтобы проверить, будет ли она принадлежать конечному результату, и немедленно отбросить ее, если нет. Иначе говоря, промежуточный результат, который выводится операцией соединения, может никогда и не будет существовать в виде полной материализованной таблицы как таковой. На практике, как правило, система весьма упорно пытается не материализовать полностью промежуточные результаты по вполне понятной причине — чтобы не терять производительность.

Другой момент, который тоже недвусмысленно проиллюстрирован на рис. 3.2, заключается в том, что операции применяются сразу ко всему множеству строк, а не к отдельной строке за один раз, т.е. операндами и результатами являются не отдельные строки, а целые таблицы, которые содержат множество строк. Например, операция JOIN на рис. 3.2 применяется к двум таблицам из трех и четырех строк соответственно, а возвращает в результате таблицу из четырех строк. Такая возможность обработки множества— главная отличительная характеристика реляционных систем. И наоборот, операционные и нереляционные системы обычно за одно обращение выполняют обработку на уровне строки или записи.

Давайте вновь вернемся к рис. 3.1. Есть несколько замечаний, которые можно сделать, используя пример базы данных на этом рисунке.

• Во-первых, обратите внимание, что определение "реляционной системы" требует, чтобы база данных воспринималась пользователем только как таблицы. Таблицы в реляционной системе являются логическими, а не физическими структурами. На самом деле, на физическом уровне система может использовать любую или все применяемые структуры памяти — последовательные файлы, индексирование, хэширование, цепочки указателей, сжатие и т.п. — лишь бы обеспечивалась возможность отображать эти структуры в таблицы на логическом уровне. Это можно сказать и по-другому: таблицы представляют абстракцию способа физического хранения данных, в которой множество деталей на уровне памяти — размещение хранимой записи, последовательность хранимых записей, кодировка хранимых данных, префиксы хранимых записей, хранимые структуры доступа, такие как индексы, и т.д. — скрыто от пользователя.

В данном случае термин "логическая структура" в терминологии ANSI/SPARC относится как к концептуальному, так и к внешнему уровню. Дело в том, что, как объяснялось в главе 2, концептуальный и внешний уровни в реляционной системе являются реляционными, а внутренний, или физический уровень — нет. На самом деле реляционная теория ничего не может сказать о внутреннем уровне вообще; она, как уже отмечалось, "заботится" о том, как база данных представлена пользователю.

• Во-вторых, у реляционных баз данных, подобных изображенной на рис. З.1, есть одно замечательное свойство: все информационное содержимое базы данных представлено одним и только одним способом, а именно: явным заданием значений данных. Этот метод представления (задание явным образом значений позиций столбцов в строках таблицы) единственно возможный для реляционных баз данных. В частности, нет никаких указателей, связывающих одну таблицу с другой. Например, существует связь между строкой D1 в таблице DEPT и строкой Е1 в таблице ЕМР, так как служащий Е1 работает в отделе D1; но эта информация представлена не указателем, а появлением значения D1 в столбце DEPT# строки Е1 в таблице ЕМР. А в нереляционных системах, напротив, такая информация представлена неким указателем, который пользователь видит явно.

Замечание. Когда мы говорим, что в реляционной системе нет указателей, мы не имеем в виду, что в ней не может быть указателей на физическом уровне — наоборот, они, конечно, могут быть на этом уровне и в действительности наверняка есть. Но, как уже объяснялось, такие детали физического хранения в реляционных системах скрываются от пользователя.

И, наконец, обратите внимание на то, что все значения данных атомарные (или скалярные). Это значит, что в каждой таблице в позиции на пересечении столбца и строки всегда находится только одно значение и никак не группа из нескольких значений. Поэтому, например, в таблице ЕМР (рассматриваются только столбцы, для наглядности размещенные слева направо) мы имеем

DEPT#

EМР#

Е1

Е2

вместо

DEPT#

EMP#

……….

Е1,Е2

………

Столбец ЕМР# во второй версии таблицы — пример того, что обычно называют группой повторения. Группа повторения — это столбец или комбинация столбцов, которая содержит несколько значений данных в каждой строке (в общем случае разное количество значений в разных строках). В реляционных базах данных группы повторения недопустимы, а значит, вторая версия таблицы в реляционной системе недопустима. (Причина такого явного ограничения — упрощение системы.)

В заключение отметим, что данное в начале раздела определение "реляционной системы" представляет собой лишь минимальное определение (оно взято из [3.1] и в основном использовалось в начале 1980-х). Конечно, в этом разделе можно и нужно было бы рассказать о реляционных системах значительно больше. В частности, заметьте, что реляционная модель— это нечто большее, чем просто "таблицы плюс операции SELECT, PROJECT и JOIN".

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2618 19 20 21 22 23 24 25 26 > Следующая >>>

Соседние файлы в папке Дейтл Введ в БД

#
01.04.2014158.72 Кб31Оглавление.doc
#
01.04.2014657.92 Кб54Часть 1.doc
#
01.04.2014627.71 Кб60Часть 2.doc
#
01.04.2014690.69 Кб46Часть 3.doc
#
01.04.2014539.65 Кб37Часть 4.doc
#
01.04.2014418.3 Кб32Часть 5.doc