Superskalyar bilan ishlash
Konveyer g‘oyasini amalga oshirishda ishlatilgan yondoshishlardan yana biri bu – ko‘p sonli funksional bloklarga ega bo‘lgan bitta koveyerdan foydalangan holda hisoblashlarni tashkil etish bo‘ldi
2.4-rasm. Beshta funksional blokka ega superskalyar protsessor
Ushbu yondoshish asosida qurilgan arxitektura – superskalyar arxitektura deb ataldi. 2.4-rasmda beshta funksional blokka ega bo‘lgan superskalyar protsessorning tuzilishi keltirilgan. Unda buyruqlarni bajarish bloki bo‘lgan C4 bloki tarkibiga qo‘shimcha funksional bloklar kiritish amalga oshirilgan. Bunday arxitekturadan avval Pentium II, keyinchalik esa Pentium 4 protsessorini qurishda foydalanilgan.
O‘ttiz ikki razryadli kompyuter protsessorining tuzilishi va qanday ishlashiga oid muhim jihatlarini Pentium 4 protsessori misolida ko‘rib chiqamiz. Pentium 4 protsessorining ichki registrlari 2.5-rasmda keltirilgan.
2.5-rasm. Pentium 4 protsessorining ichki registrlari.
Pentium 4 protsessor tarkibida ham, 16-razryadli Intel 8088 protsessori tarkibida bo‘lgan barcha registrlar guruhlari mavjuddir. Ushbu registrlarning uzunliklari 16 va 32-razryadga ega. Pentium 4 protsessorining umumiy tayinlanadigan registrlari EAX, EVX, ESX va EDXlar - 8, 16 va 32-razryadli registrlar sifatida ham ishlatilishi mumkin . ESI, EDI, EBP va ESPlar – barchasi 32-razryadli ko‘rsatgich registrlari to‘plamidir. CS, SS, DS, ES, FS va GS lar – barchasi 16-razryadli segment registrlari to‘plami. EIP – 32-razryadli buyruqlar ko‘rsatgichi registri. EFLAGS - 32-razryadli bayroqlar registridir.
Pentium 4 protsessori mikroarxitektura sathida, undan oldin ishlab chiqarilgan protsessorlardan anchagina farq qiladi. Pentium II, Pentium Pro va Pentium III protsessorlari P6 mikroarxitekturasi asosida qurilgan bo‘lib ular bir-biridan asosan unumdorligi va qator ikkinchi darajali ko‘rsatgichlari bilan farqlanganlar. Pentium 4 protsessori NetBurst deb atalgan va P6 mikroarxitekturasidan keskin farq qiladigan mikroarxitekturaga ega (2.6-rasm).
NetBurst mikroarxitekturasi ko‘proq bosqichli konveyerga va ikkita arifmetik-mantiqiy qurilmaga ega bo‘lib, giperoqimli texnologiyani amalga oshira oladi. Giperoqimli texnologiya deganda - ikkita registrlar to‘plamiga va qator boshqa resurslar to‘plamiga ega bo‘lgan qurilma tushuniladi. Bu texnologiya Pentium 4 protsessorida, ikkita dastur orasida biridan boshqasiga o‘tishni juda yuqori tezlikda ta’minlab beradi, ya’ni bunda bitta emas balki bir vaqtda ikkita protsessor ishlayotgandek bo‘lib tuyuladi. Pentium 4 protsessori bitta sikl davomida bir nechta buyruqlarni bajarish imkoniyatiga ega, shuning uchun u superskalyar protsessor deb ataladi.
Pentium 4 protsessorida uning modeliga qarab ikki yoki uch sathli kesh xotiralardan foydalanilgan. Barcha modellar 8 Kbayt hajmli SRAM turidagi birinchi sath kesh xotirasi L1-ga ega. L2 - 1 Mbayt, L3 esa - 2 Mbayt hajmli kesh xotiralardan iboratdir. Ushbu xotiralar yordamida konveyerlar ishini tezlatish amalga oshiriladi. Pentium 4 protsessori ma’lumotlar traktining soddalashtirilgan ko‘rinishi 2.7-rasmda keltirilgan.
Pentium 4 protsessori 42 000 000-ta tranzistorga ega, «qatorining kengli-gi» 0,18 mkm va taktli generatorining chastotasi esa 1,5 GGs-ga tengdir. «Qatorining kengligi» deganda tranzistorlar orasidagi o‘tkazgichlarning kengligi tushuniladi. Odam sochining diametri 20-100 mkm-ni tashkil qiladi. 1 mkm = 10-6 metr yoki 1 mkm = 10-3 mm ga teng degani. Bunda 0,18 ≈ 0,2 =2*10-4 mm ga to‘g‘ri keladi.
2.6-rasm. Pentium 4 protsessorining mikroarxitekturasi - NetBurst.
Pentium 4 mikrosxemasi 35 mm uzunlikka ega kvadrat shaklida ishlangan. Mikrosxema uning past qismida matritsa shaklida joylashgan 478-ta chiqish oyoqchalariga ega. Bu oyoqchalarning 85-tasi mikroprotsessorni kuchlanish bilan ta’minlash uchun, 180-tasi shovqinni kamaytirish uchun erga ulangan, 198-ta chiqish signallar uchun ishlatilgan, 10-ta chiqish esa zahira uchun qoldirilgan (2.8 va 2.9-rasmlar).
2.7-rasm. Pentium 4 ma’lumotlar traktining soddalashtirilgan ko‘rinishi.
2.8-rasm. Pentium 4 protsessori chiqish oyoqchalarining nomlanishlari.
2.9-rasm. Pentium 4 protsessorining mikrosxemasi
Superskalyar protsessoriga ma'lum bir ish sinflarini bajarish uchun javobgar bo'lgan bir nechta mustaqil ma'lumotlarni qayta ishlash bloklari kiradi. "Skalalar" atamasi ushbu protsessorlar va vektor ma'lumotlari bilan ishlaydigan kalkulyatorlar o'rtasidagi tub farqni ta'kidlash uchun ishlatiladi . Bunday tashkilot protsessorga bir vaqtning o'zida skalyar ma'lumotlarga bir nechta buyruqlarni bajarishga imkon beradi. Umuman olganda, superskalalar qayta ishlash turli xil protsessor quvurlarida parallel ravishda amalga oshiriladi (2.10-rasm). Bu erda, CLCM-ning 1-bosqichida bir nechta buyruqlarni tanlash kerak, ularning har biri o'z trubkasiga ishlov berish uchun yuborilgan va buyruqlarni bajarish uchun birlik. Buyruqlar va ma'lumotlarning bir nechta tanlanishini ta'minlash uchun maxsus xotira tashkiloti talab qilinadi.
2.10-rasm. Ko'p konveyerli superskalalar protsessorining tuzilishi
Ko'p sonli ishlov berish birliklari bo'lgan bitta konveyerdan foydalanib, superskalyar protsessorini boshqarish murakkabligini kamaytirish mumkin (2.11-rasm). Odatda, 1-3 bosqichlarda bajarilgan operatsiyalar, mashina buyrug'ining haqiqiy bajarilishiga qaraganda ancha kam vaqt talab qiladi. Shunday qilib, 1-3 bosqichlar jamoani tegishli ishlaydigan moslamani qayta ishlash va yuklashga tayyorlashni ta'minlaydi. Agar keyingi buyruqning dastlabki ma'lumotlari avvalgi buyruqning natijasiga bog'liq bo'lsa, unda avvalgisiga ishlov berish tugaguncha bunday buyruq bajarilmaydi. Umumiy holda, superskalyar protsessori dasturning manba kodida ko'rsatilgan mashina ko'rsatmalarining ishlash tartibini uning ishlash mantig'ini buzmasdan o'zgartirishi mumkin.
Qoida tariqasida, supersalar protsessorida har bir mashina ko'rsatmasi uchun mustaqil ishlov berish birligi, ba'zan esa bir nechta amalga oshiriladi. Masalan, ALU raqamlarni suzuvchi-nuqta formatida, ALU qayta ishlangan raqamlarni sobit nuqtali formatda, ma'lumotlarni yuklash va saqlash bloklari va boshqalar.
Superskalyar protsessorlarining ishlash ko'rsatkichlari mashina ko'rsatmalarining tabiiy ketma-ketligida super konveyer kompyuterlarning ishlashiga to'g'ri keladi. Shartli o'tishlar mavjud bo'lganda, superskalyar protsessori o'tishning prognozi xatosi uchun jarimaga olib keladigan kamroq kechikishlarni ta'minlaydi. 2.12-rasmda bir xil mashina dasturlarini bajarishda super konveyer va superskalalar protsessorlarining ishlashining qiyosiy diagrammalari ko'rsatilgan.
2.12-rasm. Protsessorning vaqt diagrammasi: super quvur (a) va superskalalar (b).
Supersalar protsessorlarining ishlashi ko'p jihatdan har bir aniq dasturda buyruqlarning parallel ravishda bajarilishi imkoniyatiga bog'liq. Bu imkoniyat o'qitish darajasidagi parallelizm tushunchasi bilan bog'liq. Protsessorda operatsiyalarni parallellashtirish bir qator cheklovlar bilan bog'liq, ularning asosiylari
• ma'lumotlarga bog'liqlik,
• protsessual bog'liqlik,
• resurslardan foydalanish ziddiyati,
• mahsulotga bog'liqlik,
• teskari munosabatlar.
Agar qo'shni dastur buyruqlarida ma'lumotlarga bog'liqlik bo'lmasa, ularni ikkita mustaqil operatsion birlikda bir vaqtning o'zida ajratib olish va qayta ishlash mumkin. Aks holda, keyingi buyruq bajarilishi uchun barcha dastlabki ma'lumotlar paydo bo'lmaguncha, ko'p sonli tsikllar kechiktirilishi kerak.
Protsedura bog'liqligi ikkita holat bilan bog'liq: shartli filial ko'rsatmalarining mavjudligi, ushbu yo'riqnoma bajarilishidan oldin keyingi yo'riqnomaning manzilini aniqlashning iloji bo'lmaganda va oldingi buyruq to'liq yoki qisman dekodlanmaguncha keyingi yo'riqnomani chiqarib olish mumkin bo'lmaganda o'zgaruvchan uzunlikdagi ko'rsatmalardan foydalanish.
Resurslardan foydalanishdagi ziddiyat, turli xil mashina ko'rsatmalarini bajarish uchun protsessorning bir xil funktsional tugunlari - xotira, avtobus, registr va boshqalar zarur bo'lganda paydo bo'ladi.
Chiqarilgan bog'liqlik qo'shni bo'lmagan mashina ko'rsatmalarini ularni bajarish natijalarining boshqa buyruqlarni bajarishda noto'g'ri natijalarni olishiga ta'siri tufayli qo'shma ijro etish (guruhlash) mumkin emasligini ta'minlaydi. Boshqacha qilib aytganda, mahsulotga bog'liqlik dasturda ko'rsatilgandek, mashina ko'rsatmalarini bajarish tartibini buzishni taqiqlaydi.
Keyingi buyruq oldingi buyruqni bajarish uchun ishlatiladigan ma'lumotni o'zgartirganda teskari munosabatlar yuzaga keladi. Bunday holda, oldingi buyruq ishga tushmaguncha va tegishli ma'lumotlar olinmaguncha keyingi buyruq bajarilmaydi.
Dasturda ishlatiladigan buyruqlarga ilg'or qarashni amalga oshiradigan bepul boshlang'ich buyurtma yoki buyruqlarni bepul buyurtma qilish texnologiyasidan foydalanishda oxirgi ikkita cheklov paydo bo'ladi. Bunday tashkilot yordamida dekodlashdan keyin buyruq buferga kiradi, u erda kerakli funktsional tugunning chiqarilishini kutadi. Kerakli resurs buyruqni bajarish uchun bo'sh bo'lganda, buyruq buferdan olinadi va quvur liniyasi bajarilgan joyga keladi. Shu bilan birga, har qanday birinchi buyruqni buferdan olish mumkin, buning uchun bepul tugun zarur va bu hech qanday nizo yoki qaramlikka xalaqit bermaydi.
Shunday qilib, superskalyar protsessorining apparat va dasturiy resurslariga quyidagi talablar qo'yiladi [7]:
• bir nechta buyruqlarni parallel o'qish va shartli filial buyruqlaridan keyin bo'limni bashorat qilish;
• buyruqlarni bajarish tartibini o'zgartiradigan mexanizmni ularning dastur mantig'ini o'zgartirmasdan dasturda joylashish ketma-ketligi bilan taqqoslash;
• ma'lumotlardan bog'liqlikni aniqlash mantiqini va buyruqlarni to'g'ri bajarish uchun ularni almashish mexanizmini yaratish;
• bir vaqtning o'zida bir nechta xotiraga kirish imkoniga ega bo'lgan bir nechta mashina yo'riqlarini parallel bajarish mexanizmini amalga oshirish;
• dasturda tasvirlangan dastlabki buyruq oqimiga mos keladigan tartibda individual buyruqlar natijalarini aniqlashni boshqaruvchi mexanizmni amalga oshirish.
XULOSA
Ushbu Individual loyiha 1 ishida Multitasking va koʼpoqimli tizimlar, superskalyar protsessorlar o’rganish masalasi qo'yilgan bo'lib, ishni bajarish davomida quyidagi natijalarga erishildi:
Multikasting va uning xususiyatlari, multikastingni tashkil qilish masalalari haqida ma’lumot berildi.
Ko’p oqimli tizimlar haqida ma’lumotlar berildi
Superskalyar protsessorlarning ishlash prinsiplari yoritib berildi
Pentium 4 protsessorining tuzilishi va arxitekturasi haqida ma’lumotlar berildi.
Do'stlaringiz bilan baham: |