Gdt tizimdagi barcha vazifalar uchun mavjud bo'lgan tavsiflovchi mavjud. Gdt har qanday turdagi deskriptorlarni o'z ichiga olishi mumkin: segment deskriptorlari va tizim deskriptorlari (uzilish shlyuzlari va tuzoqlaridan tashqari). Birinchi element Gdt (nol indeks bilan) ishlatilmaydi. Bu "bo'sh" ko'rsatgichni bildiradigan nol selektorga mos keladi.
LDT dastur segmentlari va bajariladigan vazifa ma'lumotlarini boshqa vazifalardan ajratish usulini ta'minlang. LDT ma'lum bir vazifa bilan bog'liq va faqat segment tavsiflovchi, qo'ng'iroq va shlyuzlarni o'z ichiga olishi mumkin.
Agar joriy jadvalda uning dastasi bo'lmasa, segmentga vazifa uchun kirish imkoni mavjud emas LDTna jadvalda Gdt. Ikkitadan foydalanish deskriptor jadvallari bir tomondan bajariladigan vazifaning segmentlarini ajratish va himoya qilish imkonini beradi, boshqa tomondan esa global vazifalar va kodlarni turli vazifalar o'rtasida baham ko'rishga imkon beradi.
IDT faqat vazifa shlyuzlari, uzilish shlyuzlari yoki tuzoq shlyuzlarini o'z ichiga olishi mumkin.
MP chiziqli manzilini hisoblash uchun quyidagi amallarni bajaradi ( anjir 4.1):
MP segment tavsifini topish uchun segment selektoridan foydalanadi. Selektor deskriptorlar jadvalidagi (Index) deskriptor indeksini o'z ichiga oladi, bu TI biti qaysi deskriptorlar jadvaliga kirishni aniqlaydi ( LDT yoki Gdt), shuningdek segmentga kirish huquqini so'ralgan ( RPL) Agar selektor segment registrida saqlangan bo'lsa, unda deskriptistlar jadvallariga kirish faqat segment registriga kiritilganda amalga oshiriladi, chunki har bir segment registri mos deskrittorni dasturiy ta'minot mavjud bo'lmagan ("soyali") kesh registrida saqlaydi.
MP kirish huquqlarini boshqaruvchi segment deskriptorini tahlil qiladi (segmentga joriy kirish mumkin imtiyoz darajasi) va segment chegarasi (ofset chegaradan oshmaydi);
MP segmentning asosiy manziliga ofset qo'shadi va chiziqli manzilni oladi.
Agar plaging o'chirilgan bo'lsa, hosil bo'lgan chiziqli manzil jismoniy deb hisoblanadi va o'qish yoki yozish xotirasining tsiklini bajarish uchun protsessor avtobusiga qo'yiladi.
Mexanizm segmentatsiya a'lo darajada himoya qiladi, ammo virtual xotirani (almashtirish) amalga oshirish juda qulay emas. Segment tavsifi mavjud mavjudligi bit, unga ko'ra, protsessor ushbu segmentning jismoniy xotirada yoki yo'qligini aniqlaydi tashqi xotira qurilmasi (yoqilgan) vinchester) Ikkinchi holda, segmentni xotiraga yuklashi mumkin bo'lgan 11-sonli istisno yaratiladi. Kamchilik shundaki, turli xil segmentlar turli xil uzunliklarga ega bo'lishi mumkin. Agar almashtirish mexanizmi shunga asoslangan holda amalga oshirilsa, buning oldini olish mumkin sahifani o'zgartirish. Ushbu transformatsiyaning o'ziga xos xususiyati shundaki, protsessor bu holatda teng uzunlikdagi (4 Kbayt) jismoniy xotiralar bloklari bilan ishlaydi. Sahifalar dasturning mantiqiy tuzilishi bilan bevosita bog'liq emas. Bundan tashqari, P6 subfamily MP-da sahifa tarjimasi 36-bitli jismoniy xotirani (64 Gb) manzilga yo'naltirishni ta'minlaydi. Sahifani o'zgartirish faqat himoyalangan rejimda amal qiladi va CR0 registrida 1 bit PG belgilash orqali yoqiladi.
33. Sahifani tashkil etish - virtual xotirani amalga oshirish.
Virtual xotiraga ega har bir kompyuterda virtual manzillarni jismoniy manzillarga solishtirish uchun moslama mavjud. Ushbu qurilma chaqiriladi xotirani boshqarish kontrolleri (MMU - Memory Management Unit).U protsessor chipida yoki protsessor yonidagi alohida chipda bo'lishi mumkin.Prosessor yonidagi yangi chip.
H
x otirani boshqarish nazorati qanday ishlashini tushunish uchun o'ylab ko'ring
fig. o'lchovlar. 6.4. 32-bitli virus xotirani boshqarish boshqaruvchisiga kirganda
haqiqiy manzil, u ushbu manzilni 20 bitli virtual sahifa raqamiga ajratadi
ushbu sahifada Tsy va 12 bitli siljish (bizdagi sahifalar kabi)
4 K misol). Virtual sahifa raqami indeks sifatida ishlatiladi.
kerakli sahifani topish uchun sahifalar jadvalidan. Shaklda 6.4 virtual raqam
sahifa raqami 3, shuning uchun jadvaldan 3 element tanlangan.
Birinchidan, xotirani boshqarish nazorati kerakli mamlakat ekanligini tekshiradi
n
i tza hozirda xotirada. Bizda 220 ta virtual sahifalar mavjud va
faqat 8 sahifadan iborat freymlar, hamma virtual sahifalar ham bo'la olmaydi
bir vaqtning o'zida yalpiz. Xotirani boshqarish nazorati tekshiruvi birozmavjudligi
ushbu sahifadagi jadval elementida. Bizning misolimizda bu bit 1. Bu degani
sahifa hozir xotirada ekanligini aldash.
Shakl 6.4. Virtual xotira manzilidan asosiy xotira manzilini yaratish
(bizning misolimizda - 6) va uni 15 bitli chiqishning yuqori uch qismiga nusxalash
ro'yxatdan o'ting. Sizga uchta aniq bit kerak, chunki jismoniy xotirada
8 varaq freymlari. Ushbu operatsiyaga parallel ravishda virtual 12-bitning pastki qismi
chi manzil (sahifa ofset) chiqish registrining pastki 12 bitiga ko'chiriladi. Keyin olingan 15 bitli manzil qidirish uchun kesh yoki asosiy xotiraga yuboriladi.
6.5-rasmda virtual sahifalarni jismoniy sahifalar freymlariga tushirish xaritasi ko'rsatilgan. Virtual sahifa 0 1-freymda joylashgan.
Virtual 1-sahifa 0-sahifa ramkasida.
GECID.com saytiga xush kelibsiz! Ma'lumki, soat chastotasi va protsessor yadrolari soni, ayniqsa ko'p marotaba o'qish uchun optimallashtirilgan loyihalarda ishlash darajasiga bevosita ta'sir qiladi. Ammo biz L3 keshining bu qanday rol o'ynashini tekshirishga qaror qildik?
Ushbu muammoni o'rganish uchun bizga pcshop.ua onlayn-do'konida 3,7 gigagertsli nominal ish chastotasi va 12 MB assotsiativlik kanali 3 MB L3 keshli protsessor taqdim etildi. 4 yadroli yadro raqib sifatida harakat qildi, bunda ikkita yadro o'chirildi va soat chastotasi 3,7 gigagertsgacha tushirildi. L3 keshining hajmi 8 MB ni tashkil qiladi va 16 assotsiativ kanalga ega. Ya'ni, ular orasidagi asosiy farq aniq oxirgi darajadagi keshda joylashgan: Core i7-da 5 MB ko'proq.
Agar bu ishlashga sezilarli darajada ta'sir qilsa, unda bortida 6 MB L3 keshga ega bo'lgan Core i5 seriyali vakili bilan yana bir sinov o'tkazish mumkin bo'ladi.
Ammo hozircha, hozirgi sinovga qaytish. Ishtirokchilarga video karta va 16 Gb yordam beradi operativ xotira DDR4-2400 MGts. Biz ushbu tizimlarni Full HD piksellar sonida taqqoslaymiz.
Boshlash uchun, jonli o'yinlarni sinxronlashdan boshlaylik, bunda g'olibni aniqlab bo'lmaydi. Ichida O'layotgan yorug'lik maksimal sifat sozlamalarida ikkala tizim ham qulay FPS darajasini ko'rsatadi, ammo protsessor va video kartalarning yuki o'rtacha hisobda yuqori bo'lsa ham Intel Core i7.
Arma 3 U aniq protsessorga bog'liq bo'lib, kattaroq kesh, hatto ultra yuqori grafik sozlamalarida ham ijobiy rol o'ynashi kerakligini anglatadi. Bundan tashqari, har ikkala holatda ham video kartadagi yuklanish maksimal 60% ga etdi.
O'yin Qiyomat ultra yuqori grafik sozlamalarida faqat dastlabki bir necha freymlar sinxronlashtirildi, bu erda Core i7 ning afzalligi taxminan 10 FPS. Keyingi o'yinni desinxronizatsiya qilish keshning video ketma-ketligi tezligiga ta'sir qilish darajasini aniqlashga imkon bermaydi. Qanday bo'lmasin, chastota 120 kvadrat / s dan yuqori, shuning uchun hatto 10 FPS o'tishning qulayligiga alohida ta'sir ko'rsatmaydi.
Jonli o'yinning mini-seriyasini yakunlaydi 2-bosqichni rivojlantiring. Bu erda, ehtimol, tizimlar orasidagi farqni ko'ramiz, chunki ikkala holatda ham video karta taxminan yarmiga yuklangan. Shuning uchun, Core i7 holatida FPS darajasi yuqoriroq bo'lib tuyuladi, ammo sahnalar bir-biriga o'xshash emasligi sababli aniq aytish mumkin emas.
Namunaviy ko'rsatkichlar ko'proq ma'lumot beradi. Masalan, ichida GTA V Videokarta yuklamasining ko'pligi sababli shahar tashqarisida 8 MB keshning afzalligi 5-6 kadr / s gacha, shaharda esa 10 FPSgacha bo'lishini ko'rishingiz mumkin. Shu bilan birga, ikkala holatda ham video tezlatgichning o'zi maksimal darajada yuklanmagan va barchasi CPUga bog'liq.
Uchinchi sehrgar biz juda ajoyib grafik sozlamalari va yuqori darajadagi post-profillarni ishga tushirdik. Skriptlangan sahnalardan birida, Core i7 afzalliklari joylarda 6-8 FPSga keskin burilish va yangi ma'lumotlarni yuklash zarurati bilan erishiladi. Protsessor va video kartadagi yuk yana 100% ga yetganda, farq 2-3 kvadratgacha kamayadi.
Maksimal grafik sozlamalari o'rnatilgan Xcom 2 ikkala tizim uchun ham jiddiy sinovga aylanmadi va ramka tezligi 100 FPS mintaqasida edi. Ammo bu erda kattaroq kesh xotirasi tezlikni 2 dan 12 kvadrat / s gacha oshirishga aylantirildi. Ikkala protsessor ham video kartani maksimal darajada yuklay olmagan bo'lsa-da, 8 MB versiyasi ham ushbu masala bo'yicha ba'zi joylarda yaxshiroq muvaffaqiyatga erishdi.
O'yinni eng hayratda qoldiradigan narsa Kirli mitingbiz oldindan sozlash bilan ishga tushirilgan juda yuqori. Muayyan nuqtalarda farq L3 keshining kattaroqligi tufayli 25 kvadrat / s ga etdi. Bu video kartani 10-15% yaxshi yuklashga imkon berdi. Biroq, o'rtacha ko'rsatkichlar Core i7 uchun biroz kam g'alabani ko'rsatdi - atigi 11 FPS.
Bu bilan qiziq bir holat yuz berdi Kamalak oltita qamal: ko'chada, benchmarkning birinchi freymlarida Core i7-ning afzalligi 10-15 FPS edi. Ichkarida, protsessorlar va video kartalarning yuki ikkala holatda ham 100% ga etdi, shuning uchun farq 3-6 FPSgacha kamaydi. Ammo oxirida, kamera uydan tashqariga chiqqanda, ba'zi joylarda Core i3 lag yana 10 kvadrat / s dan oshib ketdi. O'rtacha ko'rsatkich 8 MB kesh foydasiga 7 FPS darajasida edi.
Bo'linish maksimal grafik sifatida u kesh hajmining oshishiga ham yaxshi javob beradi. Oldingi ko'rsatkichlarning birinchi ramkalari Core i3 ning barcha iplarini to'liq to'ldirgan, ammo Core i7-ning umumiy yuklanishi 70-80% bo'lgan. Biroq, ushbu daqiqalarda tezlikning farqi faqat 2-3 FPS edi. Bir oz vaqt o'tgach, har ikkala protsessorning yuklanishi 100% ga etdi va ma'lum nuqtalardagi farq Core i3-dan orqada qoldi, ammo faqatgina 1-2 kvadrat / s ga teng. O'rtacha, bu Core i7 foydasiga taxminan 1 FPS edi.
O'z navbatida qiyoslashMaqbara chavandozining ko'tarilishi Yuqoridagi uchta sinov sahnasida yuqori grafik sozlamalar bilan, bu sezilarli darajada katta hajmdagi kesh xotiraga ega protsessorning afzalligini namoyish etdi. Uning o'rtacha ishlash ko'rsatkichi 5-6 FPS yaxshiroq, lekin agar siz har bir sahnaga diqqat bilan qarasangiz, u holda Core i3-ning ortda qolishi 10 kvadrat / s dan oshadi.
Ammo juda yuqori sozlamalarga ega oldindan o'rnatishni tanlayotganda, video karta va protsessorlarga yuk ortadi, shuning uchun ko'p hollarda tizimlar orasidagi farq bir necha kadrgacha kamayadi. Va faqat qisqacha Core i7 yanada muhim natijalarni namoyish qilishi mumkin. Benchmark natijalariga ko'ra uning foydalarining o'rtacha ko'rsatkichi 3-4 FPS gacha tushdi.
Xitman L3 keshidan kamroq ta'sirlangan. Garchi bu erda juda yuqori tafsilotli profilga ega bo'lsa ham, qo'shimcha 5 MB video kartani eng yaxshi yuklashni ta'minlab, uni qo'shimcha 3-4 kvadrat / s ga aylantiradi. Ular ishlashga juda muhim ta'sir ko'rsatmaydilar, ammo sport qiziqishlaridan kelib chiqib, g'olib borligi yoqimli.
Yuqori grafik sozlamalari Deus ex: insoniyat ikkiga bo'lingan ular darhol ikkala tizimdan maksimal darajada ishlov berish quvvatini talab qilishdi, shuning uchun eng yaxshi holatda farq Core i7 foydasiga 1-2 kvadrat edi, bu o'rtacha ko'rsatkich bilan ham ko'rsatiladi.
Ultra yuqori oldindan o'rnatilgan dastur bilan qayta yuklash video kartani yanada ko'proq yukladi, shuning uchun protsessorning umumiy tezlikka ta'siri yanada kamaydi. Shunga ko'ra, L3 keshidagi farq deyarli vaziyatga ta'sir ko'rsatmadi va o'rtacha FPS yarim kadrdan kam farq qildi.
Sinov natijalariga ko'ra shuni ta'kidlash kerakki, L3 keshining o'yin ko'rsatkichlariga ta'siri haqiqatan ham ro'y beradi, ammo bu video karta to'liq quvvat bilan ishlamaganidagina paydo bo'ladi. Bunday hollarda, agar kesh 2,5 baravar ko'paygan bo'lsa, 5-10 FPS o'sishiga erishish mumkin. Ya'ni, taxminan, ma'lum bo'ladiki, ceteris paribus, har bir qo'shimcha MB L3 keshi video ko'rsatish tezligiga atigi 1-2 FPS qo'shadi.
Shunday qilib, agar biz qo'shni chiziqlarni, masalan, Celeron va Pentium yoki Core i3 seriyali L3 kesh o'lchamiga ega modellarni taqqoslasak, asosiy ish samaradorligi yuqori chastotalar va keyin qo'shimcha protsessor iplari va yadrolari mavjudligi tufayli erishiladi. Shuning uchun, protsessorni tanlashda, birinchi navbatda, asosiy xususiyatlarga e'tibor qaratish kerak va shundan keyingina kesh-xotira hajmiga e'tibor berish kerak.
Bu hammasi. E'tiboringiz uchun tashakkur. Ushbu material foydali va qiziqarli edi deb umid qilamiz.
Ko'pgina zamonaviy ish stoli kompyuterlaridagi chiplar to'rtta yadroga ega, ammo chip ishlab chiqaruvchilari olti yadrogacha ko'tarish rejalari haqida e'lon qilishdi va 16 yadroli protsessorlar yuqori samarali serverlar uchun juda kam.
Qancha ko'p yadrolar bo'lsa, birgalikda ishlash paytida barcha yadrolar o'rtasida xotira ajratish muammosi shunchalik katta bo'ladi. Yadro sonining ko'payishi bilan ma'lumotlarni qayta ishlash jarayonida yadrolarni boshqarishda vaqt yo'qotilishini minimallashtirish tobora foydaliroq bo'lib bormoqda, chunki ma'lumotlar almashinuvi tezligi protsessor va xotirada ma'lumotlarni qayta ishlash tezligidan orqada qolmoqda. Siz boshqa birovning tez keshiga jismonan murojaat qilishingiz mumkin yoki o'zingizning sekin foydalanishingiz mumkin, ammo ma'lumot uzatish vaqtini tejashingiz mumkin. Vazifalar dasturlar tomonidan talab qilingan xotira hajmi har bir turdagi kesh hajmiga aniq mos kelmasligi bilan murakkablashadi.
Protsessorga faqat juda cheklangan xotirani jismonan joylashtirish mumkin - protsessor keshi L1 darajasida, uning miqdori juda kichik. Massachusets Texnologiya Institutining Kompyuter fanlari va sun'iy intellekt laboratoriyasining tadqiqotchilari Daniel Sanches, Po-An Tsay va Natan Bekmann kompyuterga dasturlarning moslashuvchan ierarxiyasini moslashtirish uchun turli xil xotiralarni qanday sozlashni o'rgatdilar. real vaqt. Yangi tizimJenga nomli, dasturlarning xotiraga kirishining hajmli ehtiyojlari va chastotasini tahlil qiladi va har xil 3 xil protsessor keshlarining quvvatini samaradorlikni va energiya tejashni ta'minlaydigan kombinatsiyalarda qayta taqsimlaydi.
Avvaliga, tadqiqotchilar bir yadroli protsessor uchun dasturlarni ishlashda statik va dinamik xotiraning kombinatsiyasi bilan ishlash samaradorligini sinab ko'rdilar va birlamchi ierarxiyani qo'lga kiritdilar - qaysi kombinatsiyani qo'llash yaxshiroq. Ikkita turdagi xotiradan yoki bittadan. Ikki parametr baholandi - har bir dasturning ishlashi paytida signalning kechikishi (kutish vaqti) va energiya sarfi. Dasturlarning 40 foizga yaqini yomonroq ishlashni boshladilar, qolganlari yaxshiroq. Tadqiqotchilar qaysi dasturlarning aralash ishlashini "yoqtirishini" va qaysi xotira hajmi bilan aniqlab, o'zlarining Jenga tizimini yaratdilar.
Ular 36 yadroli virtual kompyuterda 4 turdagi dasturlarni deyarli sinovdan o'tkazdilar. Dastur sinovdan o'tgan:
omnet - Ob'ektiv modulli tarmoq testbedi, C modellashtirish kutubxonasi va tarmoq modellashtirish vositalarining platformasi (rasmda ko'k)
mcf - Meta tarkib doirasi (qizil)
astar - virtual haqiqatni namoyish qilish uchun dasturiy ta'minot (yashil)
bzip2 - arxivchi (binafsha rang)
Rasmda har bir dasturning ma'lumotlari qayerda va qanday ishlov berilganligi ko'rsatilgan. Harflar har bir dastur ishlayotgan joyni ko'rsatadi (har kvadrantga bitta), ranglar uning ma'lumotlari qayerda joylashganligini, hatching esa virtual ierarxiyaning ikkinchi darajasini ko'rsatadi.
Kesh darajasi
Kesh markaziy protsessor bir necha darajalarga bo'lingan. Universal protsessorlar uchun - 3 tagacha tezkor xotira birinchi darajali kesh - L1-kesh, chunki u protsessor bilan bitta chipda joylashgan. Buyruqlar keshi va ma'lumotlar keshidan iborat. L1 keshi bo'lmagan ba'zi protsessorlar ishlay olmaydi. L1 keshi protsessor chastotasida ishlaydi va unga har soatda aylanish mumkin. Ko'pincha bir vaqtning o'zida bir nechta o'qish / yozish operatsiyalarini bajarish mumkin. Hajmi odatda kichik - 128 KB dan oshmaydi.
L1 keshi ikkinchi darajali kesh bilan o'zaro ta'sir qiladi - L2. Bu ikkinchi eng tez. Odatda u L1 singari chipda yoki yadroga yaqin joyda, masalan, protsessor kartridjida joylashgan. Eski protsessorlarda, anakartdagi chip chip. L2 keshining hajmi 128 Kb dan 12 MB gacha. Zamonaviy ko'p yadroli protsessorlarda, xuddi shu chipda joylashgan ikkinchi darajali kesh, umumiy xotiraga ega - har bir yadro uchun jami 8 MB, 2 MB hajm talab qilinadi. Odatda, yadroda joylashgan L2 keshining kechikish vaqti 8 dan 20 soatgacha. Cheklangan xotira zonasiga, masalan, MBBTga ko'p kirish bilan bog'liq bo'lgan vazifalarda, uni to'liq ishlatish unumdorlikni o'n baravar oshirishga imkon beradi.
L3 keshi odatda kattaroqdir, garchi L2-ga nisbatan sekinroq bo'lsa (L2 va L3 o'rtasidagi avtobus L1 va L2 orasidagi avtobusga qaraganda torroq bo'lsa). L3 odatda CPU yadrosidan alohida joylashgan, ammo katta bo'lishi mumkin - 32 MB. L3 keshi avvalgi keshlarga qaraganda sekinroq, ammo operativ xotiradan tezroq. Ko'p protsessor tizimlarida keng foydalaniladi. Uchinchi darajali keshdan foydalanish vazifalarning juda tor doiralarida oqlanadi va nafaqat ish unumdorligini oshirishi, balki aksincha tizim ishining umumiy pasayishiga olib kelishi mumkin.
Ikkinchi va uchinchi darajalarning keshini o'chirib qo'yish, ma'lumotlar miqdori ko'payganda, matematik muammolarda eng foydali hisoblanadi kichikroq o'lchamda kesh. Bunday holda, siz barcha ma'lumotlarni darhol L1 keshiga yuklab olishingiz va keyin qayta ishlashingiz mumkin.
Vaqti-vaqti bilan, OS darajasidagi Jenga ma'lumotlar cheklovlari va dasturlarning xatti-harakatlarini hisobga olgan holda, ma'lumotlar almashinuvini minimallashtirish uchun virtual ierarxiyalarni qayta tuzadi. Har bir konfiguratsiya to'rt bosqichdan iborat.
Jenga ma'lumotlarni nafaqat qaysi dasturlar yuborilganiga qarab - katta tezlikda ishlaydigan xotirani sevish yoki aralash keshlarning ishini sevish bilan bir qatorda, xotira xujayralarining qayta ishlangan ma'lumotlarga jismoniy yaqinligiga ham bog'liq. Dastur sukut bo'yicha yoki ierarxiya bo'yicha qanday keshni talab qiladi. Asosiysi, signal uzatilishini va energiya sarfini minimallashtirish. Dastur "sevadi" qancha xotira turiga qarab, Jenga har bir virtual ierarxiyaning bir yoki ikki darajali kechikish modelini yaratadi. Ikki darajali ierarxiyalar sirt hosil qiladi, bitta darajali ierarxiyalar egri chiziq hosil qiladi. Keyin Jenga VL1 o'lchamlarining minimal kechikishini loyihalashtiradi, bu ikkita egri chiziqni beradi. Va nihoyat, Jenga ushbu egri chiziqlardan eng yaxshi ierarxiyani (ya'ni VL1 o'lchamini) tanlash uchun ishlatadi.
Jenga-dan foydalanish sezilarli samara berdi. 36 yadroli virtual chip 30 foizga tezroq bo'lgan va 85 foiz kam quvvat sarflagan. Albatta, Jenga shunchaki ishlaydigan kompyuterning simulyatsiyasi bo'lsa-da, ushbu keshning haqiqiy misollarini ko'rishingiz va texnologiyani yoqadigan chip ishlab chiqaruvchilari uni qabul qilishidan oldin biroz vaqt talab etiladi.
Shartli 36 yadro mashinasi konfiguratsiyasi
Protsessorlar. 36 yadro, x86-64 ISA, 2,4 Gigagertsli, Silvermontga o'xshash OOO: 8B kengligi
ifetch; 512 × 10-bitli BHSR-lar bilan 2-darajali bpred + 1024 × 2-bitli PHT, ikki tomonlama dekodlash / chiqarish / nomini o'zgartirish / kiritish, 32-kirishli IQ va ROB, 10-kirishli LQ, 16-kirish SQ; 371 pJ / yo'riqnoma, 163 mVt / yadro statik quvvat
L1 keshlari. 32 KB, 8 yo'nalishli assotsiativ, ajratilgan ma'lumotlar va o'qitish keshlari,
3 tsiklning kechikishi; Har bir zarba / sog'inish uchun 15/33 pJ
Prefetchers Prefetch xizmati. 16-kirish oqimi prefetcherlari keyin modellashtirilgan va qarshi tasdiqlangan
Nehalem
L2 keshlari. Har bir yadroli 128 Kbotli, 8 yo'nalishli assotsiatsion, inklyuziv, 6 tsiklli kechikish; Har bir zarba / sog'inish uchun 46/93 pJ
Uyg'unlik rejimi. Jenga uchun 16 tomonlama, 6 tsiklli kechikish katalogi banklari; boshqalar uchun in-cache L3 kataloglari
Global noc. 6 × 6 to'r, 128-bitli naychalar va ulanishlar, X-Y marshrutizator, 2-tsiklli quvurli marshrutizatorlar, 1-tsiklli ulanishlar; Har bir marshrutizator / ulanish uchun 63/71 pJ, 12 / 4mW router / link statik kuchi
SRAM Statik bloklari. 18 MB, bitta plitka uchun bitta 512 KB, 52 martalik 52 o'rinli zachechka, 9 siklli bankka kechikish, Vantage partition; Har bir zarba / sog'inish uchun 240/500 pJ, 28 mVt / bankning statik kuchi
Yig'ilgan DRAM ko'p qatlamli dinamik xotira. 1152MB, 4 ta plitka uchun bittadan 128MB valentli MAP-I DDR3-3200 (1600MHz) qotishma, 128 bitli avtobus, 16 o'rin, 8 bank / daraja, 2 Kb qatorli bufer; Har bir zarbaga 4,4 / 6,2 nJ, 88 mVt / tonna statik quvvat
Asosiy xotira. 4 DDR3-1600 kanal, 64 bitli avtobus, 2-darajali / kanal, 8 bank / daraja, 8 KB qatorli bufer; 20 nJ / kirish, 4W statik quvvat
DRAM vaqtlari. tCAS \u003d 8, tRCD \u003d 8, tRTP \u003d 4, tRAS \u003d 24, tRP \u003d 8, tRRD \u003d 4, tWTR \u003d 4, tWR \u003d 8, tFAW \u003d 18 (tCK-dagi barcha vaqtlar; to'plangan DRAM asosiy xotira sifatida tCK ning yarmiga ega. )
Barcha foydalanuvchilar ma'lumotlarni qayta ishlash uchun javobgar bo'lgan protsessor, shuningdek ularni saqlash uchun javobgar bo'lgan tasodifiy kirish xotirasi (RAM yoki RAM) kabi kompyuter elementlarini yaxshi bilishadi. Ammo hamma ham, ehtimol, protsessor keshi (Cache CPU), ya'ni protsessorning o'zi ham (super-RAM deb ataladigan) RAM mavjudligini bilmaydi.
Kompyuter ishlab chiquvchilarini protsessor uchun maxsus xotiradan foydalanishga undagan sabab nima? Kompyuter uchun RAM etarli emasmi?
Darhaqiqat, uzoq vaqt davomida shaxsiy kompyuterlar har qanday kesh bilan tarqatilgan. Ammo, bilasizki, protsessor eng tezkor shaxsiy kompyuter bo'lib, uning tezligi har bir yangi avlod protsessorida o'sdi. Hozirgi vaqtda uning tezligi sekundiga milliardlab operatsiyalar bilan o'lchanmoqda. Shu bilan birga, standart tasodifiy kirish xotirasi evolyutsiya paytida uning tezligini sezilarli darajada oshirmadi.
Umuman olganda, xotira chiplari uchun ikkita asosiy texnologiya mavjud - statik xotira va dinamik xotira. Ularning qurilmalari tafsilotlariga kirmasdan, biz shuni aytishimiz mumkinki, statik xotira, dinamik xotiradan farqli o'laroq, yangilanishni talab qilmaydi; bundan tashqari, statik xotirada bir bit ma'lumot uchun 4-8 tranzistorlar, dinamik xotirada esa 1-2 tranzistorlar ishlatiladi. Shunga ko'ra, dinamik xotira statikka qaraganda ancha arzon, ammo ayni paytda ancha sekin. Hozirgi vaqtda RAM chiplari dinamik xotira asosida ishlab chiqarilmoqda.
Protsessorlar va RAM tezligining nisbati taxminiy evolyutsiyasi:
Shunday qilib, agar protsessor har doim operativ xotiradan ma'lumot olgan bo'lsa, unda u sekin dinamik xotirani kutishi kerak edi va u doimo harakatsiz qoladi. Xuddi shu holatda, agar statik xotira RAM sifatida ishlatilgan bo'lsa, unda kompyuter narxi bir necha baravar ko'payadi.
Shuning uchun oqilona murosaga erishildi. Operativ xotiraning asosiy qismi dinamik bo'lib qoldi, protsessor esa statik xotira chiplariga asoslangan tezkor kesh xotirasiga ega. Uning o'lchamlari nisbatan kichikdir - masalan, ikkinchi darajadagi kesh hajmi atigi bir necha megabayt. Shu bilan birga, birinchi IBM PC kompyuterlarining barcha RAM hajmi 1 MB dan kam bo'lganini eslash kerak.
Bundan tashqari, keshlash texnologiyasini joriy qilishning maqsadga muvofiqligi, shuningdek, operativ xotirada joylashgan turli xil dasturlar protsessorni boshqacha yuklashi va natijada boshqalar bilan taqqoslaganda ustuvor ishlov berishni talab qiladigan ko'plab ma'lumotlar mavjud.
Kesh tarixi
Qat'iy aytganda, kesh shaxsiy kompyuterlarga o'tmasdan, u bir necha o'n yillar davomida superkompyuterlarda muvaffaqiyatli ishlatilgan.
I80386 protsessoriga asoslangan kompyuterda birinchi marta atigi 16 Kbayt kesh paydo bo'ldi. Bugungi kunda zamonaviy protsessorlar har xil kesh sathlaridan foydalanadilar, birinchi darajadan (eng kichik hajmdagi tezkor kesh - odatda 128 Kb), uchinchi darajagacha (eng katta hajmdagi eng sekin kesh - o'nlab MB gacha).
Birinchidan, protsessorning tashqi keshi alohida chipda joylashgan edi. Vaqt o'tishi bilan, bu kesh va protsessor o'rtasida joylashgan avtobus, ma'lumotlar almashinuvini sekinlashtiradigan muammoga olib keldi. Zamonaviy mikroprotsessorlarda, ham kesh xotirasining birinchi, ham ikkinchi darajalari protsessor yadrosida joylashgan.
Uzoq vaqt davomida protsessorlarda faqat ikkita kesh darajasi mavjud edi, ammo birinchi darajali kesh barcha protsessor yadrolari uchun umumiy bo'lgan Intel Itanium CPUlarda paydo bo'ldi. To'rt darajali keshga ega protsessorlarning ishlanmalari ham mavjud.
Kesh me'morchiligi va tamoyillari
Bugungi kunda kibernetika sohasidagi dastlabki nazariy ishlanmalar - Prinston va Garvard arxitekturasidan kelib chiqadigan keshlarni tashkil qilishning ikkita asosiy turi ma'lum. Princeton arxitekturasi ma'lumotlar va buyruqlarni saqlash uchun bitta xotira maydonini anglatadi, Garvard arxitekturasi esa alohida joyni anglatadi. Ko'pgina protsessorlar shaxsiy kompyuterlar X86 qatorida alohida kesh turidan foydalaniladi. Bundan tashqari, zamonaviy protsessorlarda kesh xotirasining yangi turi paydo bo'ldi - virtual xotira manzillarini tarjima qilishni tezlashtirish uchun mo'ljallangan assotsiativ tarjima buferi deb nomlangan. operatsion tizim jismoniy xotira manzillariga.
Soddalashtirilgan, kesh xotirasi va protsessor o'rtasidagi o'zaro ta'sirni quyidagicha tasvirlash mumkin. Avval mavjudligini tekshiring kerakli protsessor tezkor ma'lumotlar - birinchi darajali keshda, so'ngra - ikkinchi darajali keshda va boshqalar. Agar kerakli ma'lumotlar keshning biron bir darajasida topilmagan bo'lsa, unda ular xato yoki keshning yo'qligi haqida gapirishadi. Agar keshda umuman ma'lumot bo'lmasa, protsessor uni RAMdan yoki hatto tashqi xotiradan (qattiq diskdan) olishi kerak.
Protsessor xotirada ma'lumot qidirish tartibi:
Protsessor ma'lumotni shunday izlaydi.
Kesh xotirasining ishlashini va uning protsessorning hisoblash birliklari, shuningdek, operativ xotirasi bilan o'zaro ta'sirini boshqarish uchun maxsus boshqaruvchi mavjud.
Protsessor yadrosi, kesh va operativ xotiraning o'zaro ta'sirini tashkil qilish sxemasi:
Kesh boshqaruvchisi protsessor, RAM va kesh aloqasining asosiy elementidir.
Shuni ta'kidlash kerakki, ma'lumotlarni keshlash murakkab jarayon bo'lib, uning davomida ko'plab texnologiyalar va matematik algoritmlar qo'llaniladi. Keshlashda ishlatiladigan asosiy tushunchalar orasida kesh yozish usullari va kesh assotsiativligi arxitekturasini ajratib ko'rsatishimiz mumkin.
Do'stlaringiz bilan baham: |