Руководство по созданию эффективных запросов


 Еще больше теории: алгоритмы Алгоритмы на основе хеширования



Download 17,08 Mb.
Pdf ko'rish
bet45/210
Sana25.06.2022
Hajmi17,08 Mb.
#704548
TuriРуководство
1   ...   41   42   43   44   45   46   47   48   ...   210
Bog'liq
OptimizZaprvPostgreSQL

54

Еще больше теории: алгоритмы
Алгоритмы на основе хеширования
Результат естественного соединения состоит из пар строк из таблиц 
R
и 
S

которые имеют равные значения атрибутов, по которым выполняется со-
единение. Идея алгоритма соединения хешированием проста: если значения 
равны, то и хеш-значения тоже равны.
Алгоритм разбивает обе входные таблицы по корзинам в соответствии со 
значениями хеш-функции, а затем независимо соединяет строки в каждой 
корзине. Схема этого алгоритма показана на рис. 3.9.
Корзины 
Рис. 3.9 

Алгоритм соединения хешированием
Базовая версия алгоритма соединения хешированием включает две фазы:
1) на этапе 
построения
все кортежи таблицы 
R
сохраняются в корзинах 
согласно значениям хеш-функции;
2) на этапе 
проверки
каждая строка таблицы 
S
направляется в соответ-
ствующую ей корзину. Если подходящие строки таблицы 
R
находятся 
в этой корзине, порождаются выходные строки.
Самый простой способ найти подходящие строки в корзине – использовать 
вложенные циклы (фактически нужно перебирать все строки в корзине для 
каждой строки таблицы 
S
).
Две фазы алгоритма на основе хеширования показаны как отдельные фи-
зические операции в плане выполнения.
Стоимость соединения хешированием приблизительно можно оценить по 
следующей формуле, где 
JA
– атрибут, по которому выполняется соединение:
cost(hash,R,S) = size(R) + size(S) + size(R)*size(S)/size(JA)
Первое и второе слагаемые в этой формуле приблизительно равны стоимо-
сти одного прохода по всем строкам таблиц 
R
и 
S
. Последнее слагаемое обо-
значает размер порождаемого результата соединения. Конечно, стоимость 
вывода одинакова для всех алгоритмов соединения, но нам не нужно было 
включать его в оценку стоимости алгоритма вложенного цикла, потому что 
она меньше, чем стоимость вложенных циклов.


Сочетание отношений 

55
Эта формула показывает, что алгоритм на основе хеширования значитель-
но лучше вложенных циклов подходит для больших таблиц и большого коли-
чества различных значений атрибута соединения. Например, если атрибут 
соединения в одной из входных таблиц уникален, то последнее слагаемое 
всего лишь будет равно размеру другой таблицы.
Базовый алгоритм соединения хешированием работает, если все корзины, 
созданные на этапе построения хеш-таблицы, помещаются в оперативную 
память. Другой вариант, называемый гибридным соединением хеширова-
нием, соединяет таблицы, которые не могут поместиться в оперативную 
память. Гибридное соединение хешированием разделяет обе таблицы так, 
чтобы отдельные разделы помещались в память, а затем выполняет базовый 
алгоритм для каждой пары соответствующих разделов. Стоимость гибридно-
го соединения хешированием выше, потому что разделы временно хранятся 
на жестком диске и обе таблицы сканируются дважды. Однако стоимость по-
прежнему пропорциональна сумме размеров таблиц, а не их произведению.

Download 17,08 Mb.

Do'stlaringiz bilan baham:
1   ...   41   42   43   44   45   46   47   48   ...   210




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish