4.3.2. MPEG-1 standartining ovozli qismi
1993 yil nashr etilgan ISO/IEC 11172-3 MPEG-1 standartining algoritmi yuqori sifatli stereo ovozni kodlashga yo‘naltirilgan va kodlashning 3ta bosqichidan iborat:
«Layer-1» (1-qatlam) professional ovoz yozish uchun bo‘lib, studiya sifatiga ega va uncha murakkab bo‘lmagan algoritm hamda siqishning katta bo‘lmagan koeffitsienti bilan xarakteralanadi. Asosiy parametrlari: 15 kGsga teng ovoz signali chastota polosasidagi raqamli oqimni uzatish tezligi 192 kbit/s; kompressiya koeffitsienti 4 ga teng; ishlov berishdagi signal kechikishi (ushlab qolinish) 20 msekundni tashkil qiladi.
Siqish algoritmi - sekin (asosan akustik model va koeffitsientlarni iterativ kesishishini hisoblashlardagi xatoga yo‘l qo'yilishi sababli). Dekoderlash algoritmi-tez (real vaqt davrida qo‘llanishi mumkin) amalga oshiriladi.
«Layer-2» (2-qatlam) iste'mol sohasi (yuqori sifatli radioeshittirishda o‘rta murakkablikdagi signallarni uzatishda va audioma’lumotlar koeffitsientlarini o‘rtacha kompressiyalashda qo‘llaniladi). Layer 2 tizim Layer 1ga nisbatan uchlik taroqsimon (grebenchatiy) filtr va Furye tez o‘zgartirishi amali kiritilishi, shuningdek, ko‘pgina maxsus aniqlantirish jadvallari qo‘llanishi bilan farq qiladi. Natijada siqish koeffitsienti qiymati oshdi, lekin ovoz signali kompressiyasi tezligi kamaydi, garchi teskari o‘zgartirish tezligi sekinlashmagan bo‘lsa ham. Asosiy parametrlari: 15 kGsga teng ovoz signali chastota polosasidagi raqamli oqimning uzatishdagi tezligi 128 Kbit/s; kompressiya koeffitsienti 6 ga teng; signal kechikishi 40...50 msekundni tashkil qiladi.
«Layer-3» (3-qatlam), nutqni ISDN tarmoqlaridagi kichik polosali kanallarda, professional radioeshittirishda va o‘rta sifatli hamda kam hajmli xotiraga ega yozish tizimlarida uzatish uchun foydalaniladi. Algoritmning yuqori murakkablikka egaligi bilan farqlanadi va quyidagi parametrlar bilan xarakterlanadi: 15 kGsga teng chastota polosasidagi raqamli oqimning uzatishdagi tezligi 64 Kbit/s; signal kechikishi 50 msekundni tashkil qiladi.
Modomiki, hozirgi vaqtda MPEG-1 standarti videokuzatuv tizimlarida chekli ravishda bo‘lsa ham qo‘llanar ekan, faqat Layer-3 formatini ko‘rib chiqish bilan cheklanamiz. Format hozirgi kunda kompyuterlarda musiqani saqlash va audioma’lumotlarni eshitish uchun eng ommalashgan format hisoblanadi. Qisqartirilgan variantda uni «MP3» deb nomlashadi va kengaytmasi «.mp3».
Hozirgi vaqtda MP3, ovozli axborotni yo‘qotishlar bilan kodlashning formatlaridan, eng keng tarqalgani va ommabopi hisoblanadi. U fayllar almashinuv tizimlarida musiqa asarlarini baholash uchun keng qo‘llaniladi. Format deyarli barcha ommabop operatsion tizimlarda, mavjud portativ audio-pleerlarda, shuningdek, zamonaviy musiqa markazlari va DVD -pleerlarning barcha modellarida qo‘llanadi.
Avvalgi qatlamlardan farqli Layer-3 da modifikatsiyalangan DKO‘ (MDKO‘) ishlatilgan. Bu ovoz signallarini, siqilmagan raqamli signal kabi,sifatni saqlab qolgan holda 6-8 barobar siqish imkonini berdi. Bunda siqish tezligi Layer 2ga nisbatan 24 barobarga va ma’lumotlarni paketlash tezligi esa 8 marta kamaygan.
MP3 formatida yo‘qotishlar bilan siqish algoritmi qo‘llaniladi, u originalga yaqin tiklanishlar sifatini ta’minlash va yozuvni, eshittirishdagi zarur bo‘lgan ma’lumotlar hajmini, sezilarli kamaytirish uchun ishlab chiqilgan. Bunda o‘rta bitreyt 128 kbit/s bo‘lganda taxminan 10 marta siqish ta’minlanadi. Siqish omili ovoz oqimining ko‘pgina odamlarning eshitish qobiliyati farqlamaydigan ayrim qismlarining tashlab ketishga asoslangan. Bu usul qabul qilishni (eshitishni) kodlash deyiladi. Bunda birinchi bosqichda qisqa vaqt oraliqlari uchun ketma-ketlik ko‘rinishida ovoz diagrammasi tuziladi, undan so‘ng inson qulog‘i farqlamaydigan ma’lumotlar o‘chirib tashlanadi va qolgan ma’lumotlar jamlangan kichik (kompakt) holda saqlanadi. Ushbu yondashuv rasmlarni JPEG formatida siqishda qo‘llaniladigan siqish usuliga o‘xshaydi.
4.14- rasmda ko‘rsatilgan kodekning umumlashtirilgan ishlash tuzilmasini ko‘rib chiqamiz.
4.14-rasm. MP3 koderining umumiy tashkiliy chizmasi
Chastota diskretizatsiyasi 48 kGs bo‘lgan ovoz signalining 16 razryadli kirish sanog‘i audiokodek kirishga kelib tushadi va bu yerda ular 32 subpolosali tashkil etuvchilarga bo‘linadi. Ishlov berish ovozli signalning 1152 sanog‘iga ega audiokadrlar orqali amalga oshiriladi. Har bir audiokadr 24 ms davom etadi. Barcha 32 subpolosalarning o‘zgarmas kengligi F = fd /(2n) ga ega bo‘ladi, bu yerda fd - ovoz signalining diskretizatsiya chastotasi, n - 750Gs teng bo‘lgan subpolosalar soni.
Filtrlashdan so‘ng, har bir subpolosadagi ovoz signallari sanoqlari bloklarga yig‘iladi, masshtablanadi(normallashtiriladi) va modifikatsiyalashgan diskret-kosinus o‘zgartirish (MDKO‘) bilan ishlov beriladi. Ushbu o‘zgartirish natijasida signal vaqt birligidan chastota birligiga o‘tadi. Natijada signal energiyasining spektral tashkil etuvchilari bo‘yicha taqsimlanishini xarakterlovchi MDKO‘ koeffitsientlari shakllantiriladi. MDKO‘ spektrining xususiyati shuki, uning asosiy energiyasi yuqori bo‘lmagan past chastotali xududda guruhlanadi, qolgan oraliqlarda koeffitsientlar kichik yoki 0 ga teng. Undan so‘ng ushbu koeffitsientlar kodek siqish koeffitsientini oshirish uchun kvantlanadi (ma’lum qiymatlarga bo‘linadilar va yaqin songacha yaxlitlanadilar) va so‘ngra kodlanadi. Har bir subpolosadagi masshtablashda 18ta sanoqdan ovoz signalining maksimal qiymatligi olinadi va u subpolosali tanlovning masshtabli koeffitsienti SCF (Scale Factor) deb nomlanadi. Kodekda 32 ta masshtabli koeffitsient ishlatiladi va har biri 36ta sanoqdan iborat ovoz signali bloki yana o‘z navbatida uchta mayda blokchalarga bo‘linadi va ular granula deyiladi. 18ta sanog‘i mavjud har bir granulada sanoqning maksimal qiymati aniqlanadi va uning qiymati granulaning masshtabli koeffitsienti SCF hisoblanadi. Kodekda ishlatiladigan subpolosalar 32 ta, shuning uchun Layer-2 da masshtab koeffitsientlar SCF granulalarning umumiy miqdori 3 x 32 = 96ga teng bo‘ladi. Ushbu koeffitsientlar ma’lumotlarning chiqish massivi saqlanadilar va dekoderga tablitsa shaklida beriladi. Shuning uchun granuladagi sanoqlar maksimal qiymati SCF jadvaldagi qiymatlar bilan solishtiriladi va jadvaldagi ko‘p qiymatlardan eng yaqin katta qiymat tanlab olinadi. Shu qiymat keyin granulaning SCFsi deb qabul qilinadi.
Kvantlash va kodlashni modifikatsiyalangan psixoakustik model (Psychoacoustic Model) nazorat qiladi. Ushbu kvantlashning nazoratini amalga oshirish uchun maskirovkalash chegarasini (chegara qiymatini) baholash qo‘llaniladi. Subpolosalardagi bitlarni taqsimlash barcha subpolosalarning signal/maska munosabati asosida hisoblanadi, bunda ushbu maska(shovqin) foydali signal bilan maskirovkalanish chegarasi aniqlanadi. Signalning maksimal qiymati va maskirovkaning minimal chegarasi kirish diskret signalini (FFN transform) Furye tez o‘zgartirishini (FTO‘) qo‘llab olinadi.
Odatda kodeklar ma’lum raqamli oqim tezligidagi (96Kbit/s, 128Kbit/s, 256Kbit/s va h.k.) ma’lumotlarni kodlashni ta’minlaydi va ular bitreytlar deyiladi. Shuning uchun har bir uzatish tezligi (yoki guruh tezligi) uchun o‘zining jadvali mavjud va ularda fd qiymatlari va raqamli ma’lumotlarning uzatish tezligi v asosida kvantlashning qiymatlari aniqlashtiriladi. Ovoz signali sanoqlari kodlashtiriladigan subpolosalarning maksimal raqam nomeri n aniqlaydi va tizimning qabul qiluvchi tomoniga uzatiladi.
Ko‘p hisoblashlar natijasida, “ buzilishlarni nazorati” blokining chiqishida ovozli kadr shakllantiriladi va dastlab uzun seriyali statistik compressor (RLE) yordamida siqiladi hamda Xaffman jadvali asosida entropiya koderiga asosan kayta kodlanadi. Entropik kodlash, ovoz signalining xususiyatlarini nazarda tutadi va ko‘p takrorlanuvchi kodli kombinatsiyalar qisqa kodli kombinatsiyalar bilan, kam uchraydiganlari esa uzun kombinatsiyalar bilan uzatiladi. Kodlashning ushbu usuli kodek siqish samarasini 20-25% oshiradi.
Siqilgan audio ma’lumotlarni dekodlash, psixoakustikani hisobga olmagan holda, teskarisiga, ya’ni tiklangan subpolosa tarkibiy qismlarining yig‘indisini olib amalga oshiriladi.
Do'stlaringiz bilan baham: |