6. Xulosa
O'rnatilgan tizimlar - Yuqori samarali tizimlar, ilovalar va loyihalar
14
IN-TECH tomonidan o'rnatiladi
5.3 Konvergentsiya qanday davom etadi?
16
(Reichenbach va boshq., 2011) da keltirilgan ma'lum ilovalar sinfi uchun model o'rnatilgan tizim
uchun parametrlar to'plamini optimallashtirishga yordam beradi.
Biroq, xotirani samarali boshqarish orqali o'rnatilgan tizimlar uchun ma'lumotlarga parallel ilovalarni
qo'llab-quvvatlash qiyin. Bir tomondan, standart ko'p yadroli arxitekturalardan foydalanish mumkin.
Ammo ular mavjud tashqi xotira o'tkazish qobiliyatiga va shuning uchun erishish mumkin bo'lgan
o'tkazish qobiliyatiga nisbatan optimal bo'lishi shart emas. Ilovaga
xos arxitekturalardan
foydalangan holda, o'rnatilgan ko'p yadroli tizimni optimallashtirish mumkin, masalan, o'tkazish
qobiliyati uchun. Buning kamchiligi - tizimni ishlab chiqish vaqtining ko'payishi. Qo'llash sohasi
sifatida tasvirni qayta ishlash uchun ko'rsatilgandek, ko'plab cheklovlarni hisobga olish kerak.
Qayta ishlash zanjirida to'siqlarga yo'l qo'ymaslik uchun tizim parametrlarini diqqat bilan tanlash kerak.
Bundan tashqari, taqdim etilgan xotira boshqaruv tizimidan HPC-da xotiraga bog'langan
ma'lumotlarga parallel ilovalar uchun ham foydalanish mumkin. Qanday bo'lmasin, ikkala dunyo
ham bir-biridan o'rganganini kuzatish kerak va biz bu tendentsiya davom etishini kutamiz. Ushbu
bayonotni mustahkamlash uchun biz turli misollar keltirdik.
birliklar va ularning konstruktsiyalarida tartibsiz ishlov berish. Bu tendentsiya davom etmoqda.
Odatda HPC ilovalari uchun mo'ljallangan ommaviy parallel tushunchalar asosiy o'rnatilgan
ilovalarga kiritilgan. Shalf bu kontekstda Cisco CRS-1 routerining yuragi bo'lgan Metro chipini
eslatib o'tadi. Ushbu routerda 188 ta umumiy maqsadli Tensilica yadrolari mavjud (Ten, 2009).
Ushbu dasturlashtiriladigan qurilmalar ilgari foydalanilgan ushbu routerda bo'lgan Ilovaga
O'rnatilgan Integral Circuits (ASIC) o'rnini egalladi (Eatherton, 2005).
Ba'zi ekspertlar kelajakdagi HPC tizimlarida tobora ko'proq
protsessorlar maxsus sxemalar,
masalan, xotira kontrollerlari, suzuvchi nuqta bloklari va aniq vazifalarni tezlashtirish uchun DSP
yadrolari bilan birlashtirilgan o'rnatilgan dasturlashtiriladigan yadrolardan iborat bo'lishini
kutishmoqda. To'rt yil oldin Shalf biz 2011 yilda bitta chipda 2000 ta yadro ishlab chiqarishimizni
bashorat qilgan edi, bu birinchi Intel CPU 4004 dagi tranzistorlar soniga yaqin. Bu sodir bo'lmaganini endi bilamiz.
Ehtimol, ushbu bashorat qilingan taraqqiyot uchun vaqt ko'p yadroli/ko'p yadroli davr boshlangan
birinchi yillarda paydo bo'lgan eyforiyada kutilganidan ko'ra uzoqroqdir. Dizayn jarayonlari keskin
o'zgarishi mumkin, chunki Tensilica kompaniyasining texnik direktori Kris Rouen "Protsessor - bu
yangi tranzistor" deganda haqdir. Shubhasiz,
ikki dunyo, o'rnatilgan parallel hisoblash va o'tmishda
ajratilgan HPC birlashdi va kelajakda sayohat qayerda tugashini ko'rish juda hayajonli.
Ushbu bobda biz o'rnatilgan hisoblash tizimlarida ko'p yadroli ishlov berishning muhimligini
ta'kidladik. Biz parallel ilovalarni vazifa va ma'lumotlarga parallel ilovalar o'rtasida ajratdik.
O'rnatilgan tizimlarda ko'proq vazifalar parallel ilovalarini topish mumkin bo'lsa ham, agar biz
tasvirni qayta ishlash vazifalari haqida o'ylayotgan bo'lsak, ma'lumotlar parallelligi juda qimmatli
dastur maydonidir. Biz o'rnatilgan ARM protsessorlari oilalari va ECA-64 arxitekturasini ishlab
chiqish orqali ta'kidladik, bu ayniqsa ma'lumotlarga parallel ilovalar uchun mos keladi, ierarxik va
heterojen protsessorlar kelajakdagi parallel o'rnatilgan protsessorlar uchun kashshof hisoblanadi.
Geterogen protsessorlar kelajakni boshqaradi, chunki ular energiyadan
xabardor hisoblash bilan
maxsus dastur uchun yaxshi moslashtirilgan ishlash yadrolarini birlashtiradi.
Machine Translated by Google
17
15
Parallel o'rnatilgan hisoblash arxitekturalari
Borkar, S. (2007). Ming yadroli chiplar: texnologiya istiqboli, 44-yillik Dizaynni avtomatlashtirish konferentsiyasi
materiallari, DAC '07, ACM, Nyu-York, NY, AQSh, 746–749-betlar.
Mattson, T., Sanders, B. & Massingill, B. (2004). Parallel dasturlash uchun naqshlar, 1-nashr,
Addison-Wesley
Professional.
URL: http://dx.doi.org/10.1109/MSP.2009.934110
URL: http://dl.acm.org/citation.cfm?id=1586640.1587482 Loos, A.,
Reichenbach, M. & Fey, D. (2011). Asic arxitekturasi, o'tish piksellari yordamida kulrang o'lchovli tasvirlardan ob'ekt
markazlarini aniqlash, Simsiz, mobil tarmoqlar va ilovalar bo'yicha xalqaro konferentsiyani qayta ishlash,
Dubay, 234-249-betlar.
Ele (2008). Element CXI mahsuloti haqida qisqacha ECA-64 elementar hisoblash massivi.
Ezerton, U. (2005). Tarmoqni qayta ishlashni piramidaning eng yuqori qismiga surish: ACM/IEEE Tarmoq va Aloqa
Tizimlari Arxitekturasi Simpoziumida (ANCS), Prinston, NJ Proceedings da asosiy taqdimot.
Pollak, F. (nd). Pollakning mikroprotsessor unumdorligi va maydoni uchun asosiy qoidasi.
URL: http://doi.acm.org/10.1145/1278480.1278667 Bräunl,
T. (2001). Parallel tasvirni qayta ishlash, Springer-Verlag Berlin Heidelberg Nyu-York.
Nguyen, A., Satish, N., Chhugani, J., Kim, C. & Dubey, P. (2010). Zamonaviy protsessor
va gpus-da trafaret hisob-
kitoblari uchun 3,5 o'lchamli blokirovkalash optimallashtirish, 2010 yil ACM/IEEE xalqaro yuqori unumli
hisoblash, tarmoqlar, saqlash va tahlil
konferentsiyasi materiallari, SC '10, IEEE Kompyuter jamiyati,
Vashington, AQSh, s. 1–13.
Amdahl, GM (1967). Katta miqyosdagi hisoblash imkoniyatlariga erishish uchun yagona protsessorli yondashuvning
amal qilish muddati, 1967 yil 18-20 aprel, bahorgi qo'shma kompyuter konferentsiyasi materiallari, AFIPS '67
(bahor), ACM, Nyu-York, NY, AQSh, 483–485-betlar.
Fey
va boshqalar, D. (2010). O'zgaruvchan piksel algoritmlari bilan bir nechta ob'ektlarni real vaqt rejimida
markazlashtirilgan aniqlashni amalga oshirish, Ob'ekt/komponent/xizmatga yo'naltirilgan real vaqt rejimida
taqsimlangan hisoblash bo'yicha IEEE xalqaro simpoziumi 98-107-betlar.
URL: http://www.elementcxi.com/downloads/ECA64ProductBrief.doc Fey, D. &
Schmidt, D. (2005). Yurish piksellari: Yuqori tezlikdagi cmos kamera chiplari uchun yangi organik hisoblash printsipi,
ACM jarayoni, 1–9-betlar.
URL: http://en.wikipedia.org/wiki/Pollack's_Rule
Reichenbach va boshqalar, M. (2010). Smart kamera chiplari uchun uyali avtomatlar asosida tasvirni qayta ishlash
uchun dasturlashtiriladigan arxitekturani loyihalash, ADPC materiallari, A58–A63-betlar.
URL: http://ieeexplore.ieee.org/lpdocs/epic03/wrapper.htm?arnumber=5388794 Goodhue, J.
(2009). Sicortex yuqori mahsuldor, kam quvvatli kompyuterlar, 2009 yil Parallel va taqsimlangan ishlov berish bo'yicha
IEEE xalqaro simpoziumi materiallari, IEEE Kompyuter jamiyati, Vashington, AQSh, 1-bet.
URL: http://www.arm.com/pdfs/ARMCortexA-9Processor.pdf Bleyk, G.,
Dreslinski, RG & Mudge, T. (2009). Ko'p yadroli protsessorlarning so'rovi, Signal Processing Magazine, IEEE 26(6): 26–
37.
URL: http://doi.acm.org/10.1145/1465482.1465560 ARM
(2007). ARM Cortex-A9 protsessorlari.
Gara, A., Blumrich, MA, Chen, D., Chiu, GLT, Koteus, P., Giampapa, ME, Haring, RA, Heidelberger, P., Hoenicke, D.,
Kopcsay, GV & boshq. (2005). Moviy gen/l tizim arxitekturasining umumiy ko'rinishi, IBM Journal of Research
and Development 49(2): 195–212.
Parallel o'rnatilgan hisoblash arxitekturalari
Do'stlaringiz bilan baham: