TATU SF KI 20-01 Guruh talabasi
Muhitdinov Asatbek Mavzu: Intel Core Nehalem mikroarxitekturasining xususiyatlari. To'rt yadroli Intel Nehalem mikroprotsessorlari "standart" server arxitekturalari uchun ish stoli va server ilovalarida ishlashning etakchisiga aylandi.
Yuqori unumdor universal mikroprotsessorlar bozorida faqat uchta asosiy o'yinchi qoldi - IBM, AMD va Intel. Eng keng tarqalgan 64-bitli arxitektura x86-64/EM64T endi ishlash jihatidan IBM Power6/Power6+ dan kam emas va hatto undan ham ustun emas IBM platformasi asosidagi kompyuterlarning narxi esa ancha yuqori. Shu sababli, ishlash bo'yicha etakchiga aylangan Intel Nehalem mikroarxitekturasi va unga asoslangan protsessorlarning paydo bo'lishi butun kompyuter bozori uchun hal qiluvchi voqea bo'ldi.
Nehalemda Intel muhandislari ilgari ishlatilgan keng tarqalgan FSB avtobusidan voz kechishdi va protsessorga o'rnatilgan RAM kontrolleri bilan yanada samaraliroq yechimga qo'shilishdi; shunga o'xshash yondashuv IBM va AMD protsessorlarida qo'llaniladi. Nehalem shuningdek, AMD Opteron-da qo'llab-quvvatlanadigan yechimga - HyperTransport avtobusiga kontseptual jihatdan o'xshash Quick Path Interconnect (QPI) seriyali avtobusini taqdim etdi. Natijada, AMD ga so'nggi besh-olti yil ichida bozor ulushini sezilarli darajada oshirish imkonini beruvchi ko'p protsessorli serverlarni qurishda Opteronning me'moriy afzalliklari tenglashtirildi.
Nehalem mikroarxitekturasining professional tahlili va unga asoslangan protsessorlarning ishlashi ushbu protsessorlar bozorga rasman chiqarilishidan oldin ham boshlangan [1]. Nehalem ish stoli (Core i7) va server (Xeon 5500) protsessorlarida qo'llaniladi. Ushbu protsessorlarning mikroarxitekturasi bir xil
Nehalem mikroarxitekturasi X86 Intel protsessorlarining zamonaviy mikroarxitekturasi modulli asosda qurilgan va uni Lego kabi “yig'ish” mumkin Oldingi Core 2 mikroarxitekturasi bilan taqqoslaganda, Nehalemning eng katta o'zgarishlari QPI va integratsiyalangan xotira kontrollerining joriy etilishi bilan birga keladi. Quvurning umumiy uzunligi Core 2 bilan solishtirganda atigi ikki bosqichga, 16 bosqichga ko'tarildi
Nexalemning old qismi. Core 2 bilan solishtirganda, protsessorning old qismi, mikroarxitekturaning boshqa bloklari singari, tub o'zgarishlarga duch kelmadi. Avvalgidek, uchta oddiy dekoder (bitta mikro-opda dekodlangan x86 ko'rsatmalari uchun) va bitta murakkab (oddiy va murakkab ko'rsatmalarni dekodlaydi) mavjud bo'lib, ular soatiga to'rtta mikro-ops dekodlash tezligini beradi. Chipdagi µ-xotira o‘tkazish qobiliyati to‘rt mk-dan ortiq dekodlangan ko‘rsatmalar uchun oshirildi: bu tarmoqli kengligi ham soatiga to‘rt mk-opsga teng.
Kodni dekodlash bosqichida Core2 [2, 3] kabi mikrooperatsiyalar birlashmasi (mikro termoyadroviy) va makrooperatsiyalar birlashmasi (makro sintez) qo'llab-quvvatlanadi. Nehalemda makro birlashtirish juda yaxshilandi: birinchidan, u 64-bitli rejimda mavjud (ilgari u 32-bitli rejim bilan cheklangan); ikkinchidan, u CMP solishtirish buyrug'ining ko'proq kombinatsiyalarini o'z ichiga boshladi va sakrash (hozirda JL/JNGE, JGE/JNL, JLE/JNG, JG/JNLE bilan). Bunday so'l kombinatsiyani bitta ko'rsatma sifatida dekodlash va bajarish ishlashni yaxshilaydi.
Loop Sream Detector bloki takomillashtirildi, sikllarni tanib oladi va ba'zi quvur liniyasi bloklarini o'chirishga imkon beradi. Blok quvur liniyasi bo'ylab oldinga siljiydi - dekodlash bosqichi orqasida, bu sizga quvur liniyasining uchta oldingi bloklarini - tarmoqni bashorat qilish, olish va dekodlashni o'chirishga imkon beradi. Loop Stream Detector endi dekodlangan ko'rsatmalarni o'z ichiga oladi (uning sig'imi 18 x86 ko'rsatmalardan 28 mikroopga ko'tarildi) va Pentium 4 NetBurst arxitekturasidagi Trace Cache-ga o'xshaydi.
Zamonaviy protsessorlarning mikroarxitekturasini takomillashtirishning an'anaviy usuli bo'lgan filiallarni bashorat qilish ancha aniqroq bo'ldi. Endi bashorat ikki darajali bo'lib, tarix jadvallarining umumiy hajmi oshirildi [2]. Intel muhandislarining maqsadi ma'lumotlar bazasini boshqarish kabi katta kodlarda ishlashni oshirish edi.
Protseduralardan qaytish manzillarini bashorat qilish uchun foydalaniladigan Qaytish stack buferi (RSB) uchun taniqli registr nomini o'zgartirish texnikasiga o'xshash nomni o'zgartirish texnikasi qo'llanilgan, bu ko'p hollarda spekulyativ tanlangan rejimda bajarilganda RSB "buzilishi" ning oldini oladi.