8.2. Оценка размеров промежуточных отношений

Физический план выбирается таким образом, чтобы свести к минимуму примерную стоимость выполнения запроса. Независимо от метода выполнения плана и способов подсчета его стоимости, на значение стоимости большое влияние оказывают размеры промежуточных отношений, получаемых в процессе обработки операторов плана. В идеале было бы неплохо иметь правила предсказания количества кортежей в промежуточных отношениях,

1) дающие точные оценки;

2) простые в использовании;

3) логически непротиворечивые (в частности, оценка размера промежуточного отношения не должна зависеть от способа его получения: например, прогнозируемое значение объема отношения, получаемого в результате соединения нескольких операндов, не должно определяться порядком обработки этих операндов).

Универсального способа, который позволил бы удовлетворить все три условия, не существует. Мы, тем не менее, предложим вашему вниманию несколько простых правил, приемлемых в большинстве ситуаций. К счастью, целью прогнозирования размеров отношений не является получение сколько-нибудь точных абсолютных оценок — задача сводится к тому, чтобы просто облегчить выбор физического плана запроса. Неточный метод предсказания может восприниматься как вполне терпимый, если он ставит в соответствие наименьшее значение стоимости наилучшему физическому плану, - даже в том случае, когда само это значение расходится с реальным, получаемым в результате выполнения плана.

8.2.1. Оценка размера результата операции объединения

Рассмотрим первый вариант операции объединения

Рис. 8.1 - Операция объединения

В общем случае

Второй вариант операции объединения

Рис. 8.2 - Операция объединения

8.2.2. Оценка размера результата операции пересечения

8.2.3. Оценка размера результата оператора проекции

Оператор проекции (projection) π в контексте обсуждаемой темы отличается от других операторов тем, что объем результата его выполнения может быть вычислен точно. Поскольку в итоговое отношение проекции включается каждый кортеж отношения-аргумента, изменение объема данных обусловлено только трансформацией структуры кортежа. Напомним, что оператор проекции относится, вообще говоря, к категории "мультимножественных" операторов и сам по себе не обеспечивает удаление повторяющихся кортежей; если после проецирования необходимо избавиться от дубликатов, следует прибегнуть к услугам оператора δ, предназначенного именно для такой цели.

Обычно оператор проекции предполагает сокращение длины кортежей за счет изъятия компонентов отдельных атрибутов. Однако оператор расширенной проекции (extended projection), напротив, позволяет формировать новые компоненты на основе существующих, так что в определенных ситуациях размер итогового отношения не только не уменьшается в сравнении с исходным, но даже возрастает.

Пример. Обратимся к отношению R(a, b, с), атрибуты а и b которого относятся к целочисленному четырехбайтовому типу, а компоненты атрибута с являются строками длиной в 100 байт. Допустим, что под заголовок кортежа R отводится 12 байт. Тогда для хранения каждого кортежа потребуются 120 байт. Предположим также, что объем блока составляет 1024 байт, причем длина заголовка блока равна 24 байт. Таким образом, в один блок способны уместиться 8 кортежей. Будем считать, что T(R)= 10000, т.е. R содержит 10000 кортежей. Тогда B(R) = 1250.

Рассмотрим оператор S = π_a₊_b_,_c(R), предусматривающий замену компонентов а и b каждого кортежа R их суммой. Длина кортежа S составляет 116 байт: 12 для заголовка, 4 для суммы и 100 для строки. Хотя кортежи S несколько короче кортежей R, в один блок можно уместить по-прежнему только 8 кортежей, так что T(S)= 10000 и B(S)=1250.

Теперь воспользуемся оператором U = π_а,_b (R), который предполагает изъятие строкового компонента с. Длина кортежа U равна всего 20 байт, a T(U) = 10000. Сейчас в один блок удается упаковать уже 50 кортежей, поэтому B(U) = 200, и в результате секции объем исходного отношения уменьшится в шесть с небольшим раз.

<<< < Предыдущая 1 2 3 4 5 6 78 / 198 9 10 11 12 13 14 15 16 17 18 19 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
28.08.2019273.41 Кб5методичка курсовая_статистика.doc
#
20.09.2019227.84 Кб1методичка по диплому (михелёв савотченко хачатр...doc
#
15.03.2016239.1 Кб32Методичка по ландшафтоведению.doc
#
24.11.2019683.52 Кб253Методичка по мед генетике 2004 г..doc
#
11.11.201986.02 Кб2методичка по произв. практике 3 курс_2012г..doc
#
17.09.20191.4 Mб7Методичка по ТОБД.doc
#
10.11.20197.48 Mб69Методичка по фармхимии.doc
#
20.09.2019705.54 Кб2Методичка РЦБ заочное_Пособие и прктикум.doc
#
19.11.2019103.94 Кб5Методичка С++№3.doc
#
11.11.20191.77 Mб37Методичка соционика №1 (Doc).doc
#
13.04.2015289.28 Кб17методичка ТЭО.doc