11
Iloji bo'lsa, mahalliy tasvirni qayta ishlash operatsiyalarini qayta ishlash uchun tasvir ma'lumotlarining
oqimiga ustunlik berish kerak. Buning sababi shundaki, oqimli yondashuv talab qilinadigan tashqi xotiraga
kirish uchun maqbuldir. Kontseptsiya 5-rasmda keltirilgan.
Xulosa qilib aytganda, agar tasvirni ko'p yadroli arxitekturaning ichki xotirasida to'liq saqlash imkoni
bo'lmasa, bo'linishdan foydalanish mumkin. Arvoh zonasi tufayli, agar tasvir qayta ishlash uchun bo'lingan
bo'lsa, ma'lumotlarni almashish talab qilinadi. Agar protsessor yadrolari bir-biri bilan chambarchas
bog'langan bo'lsa, bo'lim bir nechta yadrolar tomonidan parallel ravishda qayta ishlanishi kerak. Aks holda,
protsessor yadrolariga qo'shimcha sharpali piksellar bilan bir nechta kichik bo'limlar taqsimlanishi kerak.
trafaret halqalari (ISL). Ushbu algoritmlar uchun sharpa zonasi kengligini oshirish orqali bitta yuklangan
bo'lim uchun bir nechta iteratsiyalarni qayta ishlash mumkin. Bu shuni anglatadiki, yuklangan baytdagi
operatsiyalarni oshirish mumkin. Yuqori ish intensivligi tashqi xotira tarmoqli kengligidan yaxshiroq
foydalanishga olib keladi. Shunday qilib, parallelizatsiya darajasini teng yuk muvozanatiga erishilgunga
qadar oshirish mumkin, bu esa unumdorlikning oshishiga olib keladi.
5-rasm. Streaming yondashuvi
Rasm, masalan, yuqori chapdan pastki o'ng burchakka ishlov beriladi. Ichki xotira bir nechta tasvir
satrlarini saqlash uchun katta siljish registrlari sifatida joylashtirilgan. Protsessor yadrosi niqobning kerakli
piksellariga kirish huquqiga ega. Shift registrining o'lchami tasvirga bog'liq
Bizning Moslashtirilgan Roofline Modelimiz kabi analitik modellar nafaqat yangi ilovalarga xos
arxitekturalarni optimallashtirilgan ishlab chiqishga qodir. Ular, shuningdek, qayta ishlash zanjiridagi
qiyinchiliklarni topish uchun mavjud tizimlarni tahlil qilish uchun ishlatilishi mumkin. Oldingi ishda biz
ParCA deb nomlangan ISL algoritmlarini echish uchun ko'p yadroli SoC ishlab chiqdik (Reichenbach va
boshq., 2010). Moslashtirilgan tom chizig'i modeli bilan biz ushbu arxitekturani qayta ishlash zanjirida
to'siqni aniqladik, chunki arxitekturani ishlab chiqishda sharpa zonasining kengligi hisobga olinmagan.
Ilovaning cheklovlariga asoslangan analitik modeldan foydalangan holda, tizim parametrlarini
parallellashtirish darajasi dasturga xos arxitektura ishlab chiqilishidan oldin optimal tarzda aniqlash mumkin.
Bo'lim hajmi mavjud ichki xotira va ishlatilgan bo'lim yondashuvi yordamida tanlanishi kerak. Agar dastur
uchun maxsus ko'p yadroli tizim ishlab chiqilsa, tashqi xotira tarmoqli kengligi bilan bog'liq holda
parallellashtirish darajasi kabi optimal tizim parametrlarini aniqlash uchun dastur cheklovlariga asoslangan
analitik modeldan foydalanish kerak.
Do'stlaringiz bilan baham: