Ularning yadrolari yoki yadrolariga ko'ra: biz bir yadroli yoki bitta yadroli protsessorlardan bir nechtasiga o'tdik, ammo bir nechta mikroprotsessorlar ichida quyidagilarni ajratib ko'rsatishimiz mumkin:
Ko'p yadroli: bu biz tez-tez ishlatib turadigan an'anaviy multicores, masalan dualcore, quadcore, octacore va boshqalar. Ular odatda 2, 4, 8, 12, 16, 32, ... yadrolari yoki yadrolari, bir xil chipda yoki bir xil qadoqdagi, ammo har xil chiplarga ega.
Ko'pchilik: yuqoridagilarga o'xshash, lekin ular odatda yuzlab yoki minglab yadrolardan iborat bo'lib, buning uchun integral yadrolar Intel va AMD dizaynlaridan sodda va kichikroq bo'lishi kerak, masalan, shuningdek energiya tejamkorligi. Shuning uchun ular odatda plitkalar shaklida joylashtirilgan ARM yadrolariga asoslangan. Ularning ko'pini birlashtirib, juda yuqori hisoblash imkoniyatlariga erishish mumkin. Intel bu odam bilan, ularning Xeon Phi bilan ham ishqibozlik qildi, ular juda oddiy yadrolardan foydalangan holda juda ko'p sonli x86-larga ega, ammo ba'zi bir superkompyuterlarni quvvatlantirish uchun ko'p sonli (57 dan 72 gacha).
Uning ishlatilishiga ko'ra: Bu holda bizni faqat bitta tur qiziqtiradi, bu MP yoki ko'p protsessorli tizimlar. Ish stolida yoki noutbukda sizning anakartingizda mikroprotsessorni o'rnatish uchun faqat bitta rozetka borligini ko'rasiz, aksincha, server anakartlarning har birida 2, 4, ... soketlari bor, bu men MP degani.
Ammo mikroprotsessorlar asta-sekin boshqa aniq protsessorlar foydasiga siljiydi, ular yordamida hisoblash qobiliyatlari yaxshilanadi, ya'ni yaxshiroq har bir Vt uchun FLOPS o'rtasidagi samaradorlik keyingi bobda ko'rib turganimizdek erishildi.
Boshqa ishlov berish usullari:
Aytganimdek, mikroprotsessorlar asta-sekin harakatlanmoqda, garchi ular hali ham bozor ulushiga ega bo'lsa-da, lekin so'nggi paytlarda kuchli kirib kelayotgan boshqa protsessorlar mavjud, masalan. GPGPU yoki umumiy maqsadli grafik protsessorlar. Va shuning uchun grafik kartalarning chiplari odatda SIMD yoki vektor turiga ega bo'lib, ular bir xil ma'lumotni bir vaqtning o'zida ko'plab ma'lumotlarga qo'llashi mumkin, bu esa ishlashning oshishi bilan bog'liq.
Va eng yaxshisi, tekshirgichni o'zgartirish va dasturiy jihatdanUskunani o'zgartirmasdan, ushbu GPU'lar ma'lumotlarni qayta ishlash uchun xuddi protsessor kabi ishlatilishi mumkin, ya'ni umumiy ishlov berish uchun va nafaqat maxsus GPU'lar kabi grafikalar uchun, balki ularning ulkan hisoblash imkoniyatlaridan foydalanishga imkon beradi, chunki Grafik karta orqali erishilgan FLOPS protsessorga qaraganda ancha yuqori.
Bunday ulkan hisoblash ko'rsatkichlariga erishishning sababi shundaki, ular grafikalar bilan ishlashga yaroqlidir va bu ularni aylantirish uchun juda ko'p matematik hisoblashni talab qiladi. Aytganimdek SIMD bo'lishdan tashqari, ular odatda parallel dasturlash paradigmasi turiga amal qilishadi SIMT (bitta ko'rsatma - bir nechta iplar), xotira kechikishi yuqori bo'lsa ham yaxshi ishlash tezligiga erishish.
E'tibor bering 3D grafigini yaratish uchun, tekislikdagi W, X, Y va Z koordinatalari bilan bir qator uchburchaklarni birlashtirib, so'ngra rangni (R, G, B, A) qo'llash va sirtlarni yaratish, yorug'lik berish, yuzalarni tekstura qilish bilan boshlanadigan modellashtirish kerak. , aralash va boshqalar. Ushbu ma'lumotlar va rang koordinatalari ularni qayta ishlash uchun konfiguratsiya qilinadigan protsessorlarni o'z ichiga olganligini anglatadi va bu koordinatalar GPU protsessorlari ishlaydigan vektorlarni aniq shakllantiradi va maqsadli hisob-kitoblarni amalga oshirishda foydalaniladi. Masalan, protsessor X4X1X2X3 + Y4Y1Y2Y3, ya'ni X4 + Y1, keyin X1 + Y2 va boshqalarni qo'shish uchun 2 ta qo'shimcha ko'rsatmalarini bajarishi kerak bo'lsa, GPU buni birdaniga bajarishi mumkin edi.
Shu tufayli bizda juda past soat chastotalarida ishlaydigan, protsessorlardan 5 yoki 6 baravar pastroq bo'lgan va juda yuqori FLOPS tezligiga ega bo'lgan GPU mavjud, bu degani yuqori FLOPS / W nisbati. Masalan, Intel Core i7 3960X 141 GFLOPS hisoblash ko'rsatkichiga etadi, AMD Radeon R9 290X esa har bir GFLOPning taxminiy narxi 5.632 evro bo'lgan 0,08 GFLOPS ga erishishi mumkin, 2004 yilda esa NEC Earth deb nomlangan yapon superkompyuteri Simulyator vektorli protsessorlar bilan ish boshladi va jami 41.000 TFLOPS ishlashga muvaffaq bo'ldi, ularning har bir GFLOPS uchun narxi 10.000 8 evroni tashkil etdi, chunki u har biri XNUMX ta GFLOPSga ega bo'lgan minglab protsessorlardan iborat edi.
Ko'rib turganingizdek, bu erda yaratishga qiziqish yotadi hozirgi GPU-ga asoslangan superkompyuterlar protsessorlarni ishlatish o'rniga NVIDIA yoki AMD-dan. Va heterojen hisoblash ham muhim ahamiyat kasb etmoqda, ya'ni har xil turdagi ishlov berish birliklarini birlashtirish va har bir operatsiyani uni kamroq vaqt ichida yoki samaraliroq qayta ishlaydigan birlikka ishonib topshirish. Bu bir xil hisoblash paradigmasi bilan to'qnashadi, bu erda CPU mantiq bilan ishlaydi, GPU grafikalar bilan ishlaydi, raqamli signallar uchun DSP-lar va boshqalar.
Buning o'rniga, nega barchasini taklif qilinganidek ishlatmaslik kerak heterojen hisoblash ishlashni optimallashtirish uchun. Ushbu mikrosxemalarning har biri bir narsaga qodir, ularning afzalliklari va kamchiliklari bor, shuning uchun har bir kishi eng yaxshi ishlarini qilsin ...
Parallellik:
Va men hech bo'lmaganda foyda keltirmoqchi bo'lmasam ham superkompyuter disklariHa, men parallellikning oxiriga qaytib, biroz ko'proq tushuntirmoqchiman. Demak, hisoblashning deyarli boshidanoq, parallellik u yoki bu ma'noda kuchayib bormoqda:
Do'stlaringiz bilan baham: |