3. O'rnatilgan ko'p yadroli protsessorlarning ishlash tamoyillari
5
Parallel o'rnatilgan hisoblash arxitekturalari
3
3.1 O'rnatilgan tizimlarda ko'p yadroli protsessorlar
3.2 Tanlangan ko'p yadroli arxitekturalarning qisqacha ko'rinishi
Parallel o'rnatilgan hisoblash arxitekturalari
Ushbu kichik bo'limda biz standart protsessorlardan ma'lum bo'lgan protsessor tamoyillarini o'rnatilgan
protsessorlarga bosqichma-bosqich integratsiyalashuvidan iborat bo'lgan evolyutsion rivojlanish turini
qisqacha ko'rsatamiz. Ushbu rivojlanish jarayonining so'nggi bosqichi ko'milgan protsessorlarda ko'p
yadroli texnologiyani joriy etishdir. Turli xil o'rnatilgan protsessorlar uchun vakil,
biz ushbu bobda
(Stallings, 2006) tasvirlanganidek, ARM protsessorlari oilasining rivojlanishini tanlaymiz. Ehtimol, ARM
protsessorlarining eng xarakterli jihati ularning kichik chip o'lchamlari va kam quvvat talablaridir. Har
ikkala xususiyat, albatta, o'rnatilgan muhitdagi ilovalar uchun katta ahamiyatga ega. ARM ARM Inc.,
Kembrij, Angliya mahsulotidir. ARM fabless kompaniyasi sifatida ishlaydi, ya'ni ular chiplar ishlab
chiqarmaydi, bundan tashqari ular mikroprotsessorlar va mikrokontrollerlarni loyihalashtiradilar va bu
dizaynlarni litsenziya ostida boshqa kompaniyalarga sotadilar. O'rnatilgan ARM arxitekturasini ko'plab
qo'l va iste'mol mahsulotlarida, masalan, Apple'ning iPod va iPhone qurilmalarida topish mumkin.
Shuning uchun, ARM protsessorlari, ehtimol, o'rnatilgan dizayndagi eng ko'p ishlatiladigan
protsessorlardan
biri emas, balki butun dunyoda eng ko'p ishlatiladigan protsessorlardan biridir.
ARM1 sifatida belgilangan birinchi ARM protsessori 32-bitli RISC (Reduced Instruction Set Computer)
protsessori edi. U 1985 yilda Britaniya radioeshittirish korporatsiyasida (BBC) ishlatiladigan kompyuter
uchun protsessor sifatida birinchi tijorat RISC protsessorini, Acorn RISC Machine (ARM) ni ishlab
chiqqan Acorn kompaniyasining mahsuloti sifatida paydo bo'lgan. ARM1 integratsiyalashgan xotira
boshqaruv bloki, grafik va kiritish-chiqarish protsessor bloki hamda ko‘paytirish va almashtirish
ko‘rsatmalari kabi kengaytirilgan ko‘rsatmalar to‘plamiga kengaytirildi va o‘sha yili ARM2 sifatida chiqarildi.
ARM Cortex A9 protsessori (ARM, 2007) ARM ko'p yadroli protsessor texnologiyasining ikkinchi
avlodini bildiradi.
Shuningdek, u mobil qurilmalardan tortib to netbuklargacha bo'lgan kompyuter
qurilmalarida umumiy maqsadli hisoblash vazifalarini qayta ishlash uchun mo'ljallangan.
ARM Cortex
A9 protsessorining har bir yadrosi superskalar tartibsiz protsessor sifatida ishlaydi (1-rasmga qarang).
Bu shuni anglatadiki, protsessor bir nechta parallel ishlaydigan quvurlardan iborat. Ushbu quvurlarda
olingan ko'rsatmalar bir-biridan oshib ketishi mumkin, shuning uchun ular chiqarilgan buyruqqa zid
ravishda bajarilishi mumkin. Yadrolarda ikki darajali kesh tizimi mavjud. Har bir L1 keshini 16 dan 64
KB gacha sozlash mumkin, bu o'rnatilgan protsessor uchun juda katta. Bunday katta keshdan
foydalanish 2 gigagertsli yuqori chastotali dizaynni qo'llab-quvvatlaydi
To'rt yil o'tgach, 1989 yilda protsessor ARM3 kabi birlashtirilgan ma'lumotlar va birinchi darajali
ko'rsatmalar keshi (L1) bilan jihozlangan. Bu 32-bitli manzillarni qo'llab-quvvatlash va ARM6-da
suzuvchi nuqta blokining integratsiyasi, ARM6-da tizim-on-chip (SoC) kabi
boshqa komponentlarning
integratsiyasi va statik tarmoqni bashorat qilish birliklari, chuqurroq quvur bosqichlari va
takomillashtirilgan DSP (Raqamli signalni qayta ishlash) imkoniyatlari. ARM6 dizayni, shuningdek,
Acorn, VLSI va Apple Computer tomonidan tashkil etilgan yangi kompaniyaning birinchi mahsuloti edi.
2009 yilda ARM Cortex-A5 MPCore protsessori bilan mobil qurilmalarda foydalanish uchun
mo'ljallangan birinchi ko'p yadroli protsessorini chiqardi. Maqsad smartfonlarda zarur bo'lgan
unumdorlikka erishish uchun eng kichik va energiya tejamkor ko'p yadroli protsessorlardan birini
taqdim etish va arzon chip ishlab chiqarish uchun arzon narxlarni taklif qilish edi. Xuddi ARM-dan
boshqa ko'p yadroli protsessor bo'lgan ARM11 MP Core kabi, uni bitta protsessor matritsasida 4
tagacha yadroli qurilma sifatida sozlash mumkin.
Machine Translated by Google
O'rnatilgan tizimlar
- Yuqori samarali tizimlar, ilovalar va loyihalar
bitta ipning bajarilishini tezlashtirish uchun. Kesh tarkibi va xotira o'rtasidagi muvofiqlikni saqlash
uchun translyatsiyani o'zaro bog'lash tizimi qo'llaniladi. Yadrolar soni hali ham kichik bo'lgani uchun,
tizimning qiyinchiliklarda ishlashi xavfi past. Bunday ARM Cortex A9 protsessorlaridan ikkitasi C64x
DSP (Digital Signal Processor) yadrosi va boshqa boshqaruvchi yadrolari bilan TI OMAP 4430 (Tex,
2009) deb nomlangan heterojen ko'p yadroli tizim-chip yechimida birlashtirilgan. Ushbu tizim
smartfonlar va mobil Internet qurilmalari (MID) uchun umumiy maqsadli protsessor sifatida ham
mo'ljallangan. Oddiy ma'lumotlar parallel ilovalari bunday protsessorlar uchun unchalik samarali emas.
Shu ma'noda, ARM Cortex A9 va TI OMAP 4430 protsessorlari parallel o'rnatilgan ilovalar uchun
ko'proq mos keladi.
1-rasm. ARM Cortex-A9 MP blok diagrammasi, qayta chizilgan (Blake va boshq., 2009)
Ushbu protsessorlardan farqli o'laroq, ECA (Elemental Computing Array) (Ele, 2008) protsessorlari
oilasi o'rnatilgan ma'lumotlarni parallel vazifalarni, masalan, yuqori aniqlikdagi
videoni qayta ishlash
yoki dasturiy ta'minot bilan aniqlangan signalni sozlashda juda kam quvvat bilan ishlov berishga
mo'ljallangan. Ushbu yechimda amalga oshirilgan arxitektura kontseptsiyasi biz yuqorida tavsiflangan
ko'p yadroli echimlarda topadigan sxemalardan juda farq qiladi. Ehtimol, bu kelajakda HPC tizimlari
ham harakat qiladigan yo'nalishga ishora qiladi (5-bobga qarang). Ushbu arxitekturaning yuragi nozik
taneli heterojen ixtisoslashgan va dasturlashtiriladigan protsessor yadrolari to'plamidir (2-rasmga
qarang). O'rnatilgan ECA-64 protsessori shunday yadrolarning to'rtta klasteridan iborat bo'lib, har bir
klaster RISC tamoyillari asosida ishlaydigan bitta protsessor yadrosini va maxsus vazifalarni bajarish
uchun mo'ljallangan yana oddiyroq 15 ALUni birlashtiradi. Ushbu ALU-larni dasturlash xuddi Field-
Programmable-Gate-Arrays (FPGA) da bajarilganidek sodir bo'ladi.
Protsessorlarning kam quvvatli xarakteristikalari uchun muhim cheklov ALU larning ma'lumotlarga
asoslangan ishlash rejimidir, ya'ni ALU'lar faqat ularning kirishlarida ma'lumotlar mavjud bo'lganda
yoqiladi. Shuningdek, xotira quyi tizimi kam quvvatni qo'llab-quvvatlash uchun mo'ljallangan. Bitta
klasterdagi barcha protsessor yadrolari 32 kB mahalliy xotiraga ega. Mahalliy xotiraga kirish to'liq
dasturiy ta'minot orqali amalga oshirilishi kerak, bu esa murakkab va quvvat sarflaydigan apparat
boshqaruv resurslarini birlashtirishdan qochadi. Bu bir vaqtning o'zida muvofiqlashtirishning murakkabligini o'zgartiradi
!
IN-TECH tomonidan o'rnatiladi
4
6
Machine Translated by Google
7
O'rnatilgan tizimda ko'p yadroli yoki ko'p yadroli protsessorlarga ega ilovalarni samarali amalga oshirish katta
muammodir. Ilovaga xos arxitekturalar yordamida amalga oshirilgan operatsiyalarga muvofiq energiyani tejash,
kechikishni kamaytirish yoki o'tkazish qobiliyatini oshirish mumkin.
Bundan tashqari, bunday tashkilot taqdim etadigan imtiyozlardan foydalanish uchun ular ierarxik xotira tizimiga
yaxshi moslashtirilgan bo'lishi kerak. Bu ma'lumotlarni qayta ishlash va ma'lumotlarni uzatishning
kechikish vaqtini
yashirish va quvurli arxitekturalarda ma'lumotlarni buferlash orqali o'tkazish qobiliyatini oshirish uchun bir-biriga
mos keladigan vaqt. Bunga erishish uchun biz ma'lumotlarga kirish uchun maxsus shablonlarni ishlab chiqdik, biz
keyingi bo'limda batafsil bayon qilamiz.
2-rasm. CXI ECA-64 elementi blok diagrammasi, qayta chizilgan (Blake va boshq., 2009)
Ierarxik va heterojen tarzda tashkil etilgan protsessor, xotira va o'zaro bog'lanish tizimlari, biz buni ECA
protsessorida topamiz, bizning fikrimizcha, yuqori hisoblash unumdorligiga va past quvvatli ishlov berishga erishish
uchun kelajakda o'rnatilgan ko'p yadroli arxitekturalar uchun kashshof bo'ladi.
Biroq, ma'lumotlar parallelligining alohida ilovalari bunday ilovalarda berilgan ma'lumotlar oqimlarining 2D yoki 3D
tabiatini hisobga oladigan qo'shimcha murakkab ma'lumotlarga kirish modellarini talab qiladi.
xotira dasturiy ta'minotga kirish imkonini beradi. O'zaro bog'liqlik ierarxikdir. Protsessor
yadrolarining ierarxik
arxitekturasini tashkil qilishdan so'ng, o'zaro bog'lanish tizimi ham ierarxik tarzda tuzilishi kerak. To'rtta protsessor
yadrosi shpal orqali mahkam bog'langan. Bitta klasterda bu o'zaro bog'langan to'rtta yadro navbat tizimi yordamida
nuqtadan nuqtaga bog'langan. Eng yuqori ierarxik darajada to'rtta klaster avtobus va avtobusdagi klasterlarga
kirishni hakamlik qiluvchi avtobus menejeri orqali birlashtiriladi.
Do'stlaringiz bilan baham: