Kompyuterning arxitekturasini bilish uchun uning eng yuqori ko'rsatkichini
tezligidan manfaatdor ekanligimiz sababli, biz haqiqiy arifmetika uchun funktsional
qurilmalarni imkon qadar ko'proq yuklashimiz kerak. Balandlikning teskari
tomonidagi operatsiya kamdan-kam qo'llaniladi va bo'linish jarayonida qo'shimcha
ravishda ko'paytirish ishi talab etiladi. Shuning uchun, kompyuterning eng yuqori
ko'rsatkichini aniqlash uchun faqat ko'paytirish va qo'shimcha qurilmalarni
ishlatamiz. Maksimal ishlash uchun ular birlashtirilgan rejimda ishlatilishi kerak. D-
= B, + Cr-x d shakllarining ishlashini amalga oshirishga kelganimizda shunga
o'xshash narsalarni qildik. Agar qo'shimcha ravishda har bir bunday qurilma vektorli
ishni bajarish uchun ikkita ichki konveyerdan foydalanishni hisoblasak, ikkita
qurilmaning tizimi soat bo'yicha to'rtta operatsiya natijasini beradi. Kompyuterning
aylanish vaqti 4.1 n, shuning uchun bitta Cray C90 protsessorining eng yuqori
ko'rsatkichi deyarli 1 gflops yoki sekundiga 109 operatsiya bo'ladi. Agar
kompyuterning barcha 16 ta protsessori bir vaqtning o'zida ishlayotgan bo'lsa, unda
eng yuqori ko'rsatkich 16 gflopsgacha ko'tariladi.
Biz ushbu kompyuterning arxitekturasining asosiy xususiyatlarini buzib
tashladik, undan nega bu qadar tez o'ylab topilgani aniqlandi. Biroq, u uchun
samarali dasturlarni qanday yozishni bilish uchun siz uning boshqa tomonini
o'rganishingiz kerak. Haqiqiy dasturlarda ishlashini kamaytiradigan omillarni
ta'kidlash kerak. Ushbu qadam holda, hosildorlikni oshirish uchun dasturda nimani
o'zgartirish kerakligini tushunish qiyin bo'ladi. Paragrafning qolgan qismi ushbu
kompyuterda dasturlarni bajarish samaradorligini tahlil qilishga bag'ishlanadi.
Birinchidan, biz terminologiya haqida qaror qabul qilishimiz kerak.
Kompyuterda vektor-konveyer arxitekturasi mavjud. Vektorli ishlov berish rejimi
yordamida vaqtning asosiy daromadini olish mumkin. Kompyuterning buyruq
tizimidagi vektor buyruqlari uni bajarish uchun ishlatilsa, ba'zi dastur qismlari
vektor rejimida ishlov berilishi mumkin. Dasturning barcha qismini vektorli
buyruqlar bilan almashtirsak, u holda uning to'liq vektorizatsiyasi haqida gapiramiz.
Aks holda, biz qisman vektorizatsiya yoki umuman bir qismni vektor qilish
imkonsizligi bilan ishlaymiz. Dasturda tegishli qismlarni topish va ularni vektorli
buyruqlar bilan almashtirish jarayoni dasturning vektorizatsiyasi deb ataladi.
Nazariy jihatdan, spinning chuqurligi oshgani sayin, unumdorlik, chegarada
ma'lum bir qiymatga yaqinlashadi. Biroq, amalda, maksimal ta'sir birinchi
qadamlarda bir joyga yetib boriladi va natijada ishlash deyarli bir xil yoki kamayib
boradi. Ushbu nazariya va amaliyot o'rtasidagi farqning asosiy sababi Cray C90
kompyuterlarning juda cheklangan vektor registriga ega bo'lishidir: ularning har biri
128 so'zdan iborat 8 ta registr. Odatda, spinning chuqurligini oshirish kirish
vektorlarining sonini ko'payishiga olib keladi. Demak, bizda ham shunday bo'ldi.
Asl shakldagi fragment tashqi aylananing har bir itarishida uchta kirish vektorini
talab qildi. Chuqurlik 2 ning targ'iboti to'rtta vektorni o'rnatish zaruriyatini tug'dirdi,
3 5 vektor chuqurlikka ko'tarish uchun talab qilinadi va hokazo. Har bir qo'shimcha
vektor ilgarigi rag'batlantiruvchi chuqurlikni oshirib, tor joyga aylanadi.
Hewlett-Packard
Superdome
hisoblash
tizimi
misolida
bu
sinf
kompyuterlarining arxitekturasini o'rganamiz. Kompyuter 2000-yilda paydo bo'lgan
va Tor500 2001-yil noyabr nashrlarida ular 147 vazifani egallagan.
HP Superdome kompyuteri standart komplektda 2 dan 64 gacha bo'lgan
protsessorlarni birlashtirishi va keyinchalik tizimning kengayishi mumkin. Barcha
protsessorlar ccNUMA arxitekturasiga muvofiq tashkil etilgan umumiy xotiraga
ega. Bu, birinchi navbatda, barcha jarayonlarning bir manzil maydonida ishlashi,
odatdagi o'qish / yozish operatsiyalari orqali xotiraning har qanday baytiga murojaat
qilish deganidir. Ikkinchidan, tizimdagi mahalliy xotiraga kirish masofaviy xotiraga
kirishdan ko'ra biroz tezroq bo'ladi. Uchinchidan, protsessorlarning kesh xotirasi
sababli yuzaga kelishi mumkin bo'lgan ma'lumotlar kelishmovchiligi muammolari
apparat darajasida hal qilinadi.
Do'stlaringiz bilan baham: