Print indd



Download 18,42 Mb.
Pdf ko'rish
bet139/366
Sana31.12.2021
Hajmi18,42 Mb.
#276933
1   ...   135   136   137   138   139   140   141   142   ...   366
Bog'liq
(Lecture Notes in Computer Science 10793) Mladen Berekovic, Rainer Buchty, Heiko Hamann, Dirk Koch, Thilo Pionteck - Architecture of Computing Systems – ARCS

5.2
Execution Times
We executed several programs where four nodes work together, e.g. for exchang-
ing data. In the following, we compare software versus hardware implementation
of ready synchronization. Both are implemented in the way we described in the
previous sections. Our programs are (i) four nodes meeting at a barrier and a
(ii) broadcast of 1280 values from one node to three other nodes.
6
Furthermore,
we have a (iii) All-to-All broadcast, i.e. all nodes broadcast one 64-bit value to
all other nodes. Finally, we have (iv) a global reduce operation, where a global
sum is computed from values coming from all nodes.
These programs are small building blocks used in distributed memory pro-
grams. The more these building blocks are employed in programs, the bigger is
the effect. All numbers are dependent on the hardware as well as the application
and its implementation.
Table 2. Overview on benchmarks and their results
Name
Software ready [cycles] Hardware ready [cycles] Saving
Barrier
237
116
51%
Broadcast
29 764
18 124
39%
All-to-All broadcast
1 167
1 007
14%
Reduce, global sum
1 208
1 055
13%
Table
2
gives an overview of our results. Compared to the software imple-
mentation, the execution time of all programs is reduced in the hardware imple-
mentation. The savings reach from 10% to 50%. As Code examples 1 and 2
6
A broadcast operation with one flit would result in numbers similar to the Barrier
and All-to-All broadcast. Therefore, we took a larger broadcast to give an idea about
what happens when lots of data is transmitted.


Lightweight Hardware Synchronization for Avoiding Buffer Overflows in NoC
123
already illustrate, less code is executed. It should be noted that no ready flits
from non-participating nodes interfere these executions. When there would be
some, they would interrupt the software ready implementation and increase its
execution times. However, they would have no impact on the hardware ready
execution times, because they are handled by specialized hardware.

Download 18,42 Mb.

Do'stlaringiz bilan baham:
1   ...   135   136   137   138   139   140   141   142   ...   366




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2025
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish