Листинг 3.5
Алгоритм вложенного цикла для соединения
FOR row1 IN table1 LOOP
FOR row2 IN table2 LOOP
IF match(row1,row2) THEN
output (row)
END IF
END LOOP
END LOOP
Обратите внимание, что соединение вложенными циклами является прос-
той реализацией абстрактного определения соединения как декартова про-
изведения, за которым следует фильтр. Поскольку вложенный цикл обраба-
тывает все пары входных строк, стоимость остается той же, хотя количество
выходных строк меньше, чем в случае декартова произведения.
На практике одна или обе входные таблицы являются хранимыми табли-
цами, а не результатом предыдущей операции. В таком случае алгоритм со-
единения можно комбинировать с алгоритмом доступа к данным.
Хотя стоимость обработки остается прежней, варианты алгоритма вло-
женного цикла в сочетании с полным сканированием выполняют вложенные
Сочетание отношений
53
циклы по блокам входных таблиц и еще один уровень вложенных циклов по
строкам, содержащимся в этих блоках. Более сложные алгоритмы миними-
зируют количество обращений к диску, загружая несколько блоков первой
таблицы (внешний цикл) и обрабатывая все строки этих блоков за один про-
ход по таблице
S
.
Рис. 3.8
Алгоритм вложенного цикла
Вышеупомянутые алгоритмы могут работать с любыми условиями соеди-
нения. Тем не менее большинство соединений, которые нужны на практике,
являются естественными (natural): их условие соединения требует, чтобы
некоторые атрибуты таблицы
R
были равны соответствующим атрибутам
таблицы
S
.
Алгоритм соединения вложенными циклами также можно комбинировать
с индексным доступом к данным, если в таблице
S
есть индекс по атрибутам,
используемым в условии соединения. Для естественных соединений внут-
ренний цикл такого алгоритма сокращается до нескольких строк таблицы
S
для каждой строки таблицы
R
. Внутренний цикл может даже полностью ис-
чезнуть, если индекс по таблице
S
уникален, например атрибут соединения
таблицы
S
является его первичным ключом.
Алгоритм вложенного цикла с индексным доступом обычно предпочтите-
лен, если количество строк в таблице
R
тоже мало. Однако доступ на основе
индекса становится неэффективным, когда количество строк, подлежащих
обработке, увеличивается, как описано в главе 2.
Можно формально доказать, что для декартова произведения и соеди-
нений с произвольными условиями не существует более производительно-
го алгоритма, чем вложенные циклы. Однако важный вопрос заключается
в том, имеется ли более подходящий алгоритм для каждого конкретного типа
условий соединения. В следующем разделе показано, что для естественных
соединений такой алгоритм есть.
Do'stlaringiz bilan baham: |