Print indd


Impact on Hardware Costs



Download 18,42 Mb.
Pdf ko'rish
bet140/366
Sana31.12.2021
Hajmi18,42 Mb.
#276933
1   ...   136   137   138   139   140   141   142   143   ...   366
Bog'liq
(Lecture Notes in Computer Science 10793) Mladen Berekovic, Rainer Buchty, Heiko Hamann, Dirk Koch, Thilo Pionteck - Architecture of Computing Systems – ARCS

5.3
Impact on Hardware Costs
Now, we check how many slots in the receive buffer would be needed to avoid
overflows. For this, we execute the above programs in the simulator and decrease
the receive buffer size until a buffer overflow occurs. The results can be seen in
Table
3
. Thereby, the numbers at No Synchronization represent the buffer space
needed in the worst case when there is no synchronization present. It results
from the maximum number of flits sent by other nodes to one node. Thereby, it
is assumed that all nodes send all their flits at the same time and the receiving
node is not yet ready to process them.
Table 3. Overview on required receive buffer slots
Name
No Synchronization
[buffer slots]
Software Ready
[buffer slots]
Hardware Ready
[buffer slots]
Saving
Barrier
2
1
1
0%
Broadcast
1280
251
1
>99%
All-to-All broadcast
3
2
2
0%
Reduce, global sum
2
2
1
50%
Hardware ready flits do not occupy receive buffer slots. Therefore, less or
in the worst case equal receive buffer slots are required. As before, there are no
other nodes sending interfering ready flits. Otherwise, more buffer slots would
be required in the software implementation. At the barrier and reduce program,
only two buffer slots are occupied without synchronization. This is because of the
implementation of these programs, where tree-based algorithms are realized. At
the broadcast implementation, 1280 64-bit values are to be broadcasted, which
are 1280 flits. As can be seen in Table
3
, a lot of buffer slots can be saved. The
reason is the implementation: it is not one node sending flits to all other nodes.
Instead, the broadcast operation is distributed in the network. Thus, there are
intermediate nodes having to receive data and forward it to other nodes. In the
software ready implementation, they need too much time to process flits. New
flits arrive faster than the old ones are processed. Therefore, more and more flits
retain at the intermediate nodes. In the hardware ready implementation, code
Download 18,42 Mb.

Do'stlaringiz bilan baham:
1   ...   136   137   138   139   140   141   142   143   ...   366




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish