Audiokadr - bu paketlangan oqimdagi ma’lum qiymatli uzunliklardagi axborotlar jamlamasi (paketi). Har bir paket umumiy holda 4608 bitga ega. U “sinxronizatsiya” so‘zidan boshlanadi va keyingi sinxronizatsiya so‘zi oldidagi bayt bilan yakunlanadi.
Har bir audiokadr 4 ta mustaqil qismdan iborat:
Sarlavha (Header). U o‘zida audiokadrning birinchi 32 ta bitida (4ta baytida) mavjud axborotni ifoda etadi va sinxronizatsiya qilish hamda oqim dekodlanishi uchun zarur ma’lumotni uzatilishini ta’minlaydi.
Error_check (xatolarni tekshirish) - bu oqimning opsional (bo‘laklangan) qismi bo‘lib, ortiqchalikni siklik tekshirishdan (Cyclical Redundancy Check, crc_cheek) iborat. U o‘zida juft sanoqlilikka tekshirish uchun 16 bitli so‘zni ifoda etadi va kodlangan oqimdagi xatolarni topishni ta’minlaydi
Audio_data (audioma’lumotlar) - ovozli ma’lumot bo‘lib, o‘zida dekodlanish uchun zarur bo‘lgan axborot va kodlangan sanoqlarni saqlaydi.
Ancillary_data (qo'shimcha ma’lumotlar) o‘zida foydalanuvchi tomonidan qo'shilishi mumkin bo‘lgan bitlarni saqlaydi. Foydalaniladigan qo'shimcha bitlar miqdori (no_of_ancillary_bits) kadrdagi bitlar umumiy miqdoridan ayrilib chiqarilishi kerak. Kadr davom etish vaqti o‘zgarmas bo‘lganligi bois, ushbu hisoblashlar audio sanoqlarini kodlashga va audio sifatiga ta’sir qilishi mumkin.
Undan tashqari, MPEG-2 standarti 1997 yilda ovozni kodlashning takomillashtirilgan tizimi AAC (Advanced Audio Coding) bilan to‘ldirilgan. U ISO/1EC 11172-3 va 13818-3 standartlarining Layer-3 siqish algoritmini ishlab chiqishda yig‘ilgan tajribaga asoslangan va barcha tanish ovoz formatlari: mono, oddiy stereo, Dolby tizimining turli ko‘rinishlari, besh kanalli 5.1 ovoz formatini qo‘llaydi. Biroq MPEG-1 dekoderlari MPEG-2 AAC formatini tushunmaydi, garchi oddiy MPEG-2ning ISO/IEC 13818-3 standartini qabul qilsa ham. AAC formati MP3 formatining kelajakdagi o‘rnini bosishga qodir vorisidir. MP3 ga nisbatan AACda siqilishning samarasi sezilarli oshirilgan, diskretizatsiyalash mumkin bo‘lgan chastotalar to'plami kengaytirilgan: 8, 11,025, 16, 22, 24, 32, 44,1, 48, 64, 88,2 va 96 KGs. Zamonaviy koder tomonidan yaratilgan AAC faylning yangrash sifati 128 Kbit/s bitreytda MP3 faylning 192 Kbit/sdagi sifati bilan mos keladi. Undan tashqari AAC ko‘p kanalli fayllar yaratish imkonini beradi, bu esa uni filmlarning saundtreklarini saqlashga imkon yaratadi. Past bitreytlarda kodlaganda SBR (spectral band replication, chastotalarni spektral tiklash) texnologiyasidan foydalanib AAC HE (high efficiency, yuqori samaradorlik) fayllarini yaratish imkonini beradi. Undan tashqari AAC fayllar (profil)ni yaratishning 3 ta rejimiga ega:
Main - asosiy (oriqcha xotira bo‘lmaganda ishlatiladi);
Low Complexity (LC) - past murakkablik;
Scalable Sampling Rate (SSR) - masshtablanadigan
diskretizatsiya, buning uchun ma’lumotlarni qabul qilish tezligining o‘zgarishiga moslashgan dekoder talab etiladi.
Ulardan eng mashhuri LC bo‘lib, unda ovoz signallari siqishining nisbatan past murakkabligi ishlatiladi, bu esa AAC LC fayllarni AAC pleerlar yordamida tasvirlash imkonini beradi (masalan: Apple iPod yoki Nokia telefonlarida).
AAC koderining ish prinsipini 4.22-rasmda ko‘rsatilgan tashkiliy chizma yordamida ko‘rib chiqamiz. MPEG-2 AAC da MDKO‘ koeffitsientlari kodlanadi, biroq notekis kvantlashda siqish egri chizig‘i shakli birmuncha o‘zgartirilgan va Xaffman kodlarining boshqacha jadvali qo‘llanilgan. Layer-3 dagi kabi kvantlash buzilishlari qiymatini boshqarish ikkita: ichki va tashqi iteratsion (yaqinlashish) sikl yordamida amalga oshiriladi. Raqamli audioma’lumotlar siqish algoritmining sifatini oshirish uchun, AAC koderda buzilishlarni minimallashtirish maxsus amaliyotlaridan foydalaniladi. Aniqroq aytganda, kvantlash xatoliklari mikrotuzilmasi har bir subpolosa ichidan minimallashtirilishi (TNS-Temporal Noise Shaping - deb nomlanuvchi)texnika bilan boshqariladi. Subpolosali signallarni birlashtirishda va kodlashda (Coupling) avvalgidek M/S (mono/stereo) kodlash rejimida ishlay olish imkoniyati yaratilgan. Alohida subpolosalarda kodlashda L va R stereo juftlik signallari emas, balki ularning yig‘indisi M = (L + R)va farqi S = (L - R) qo‘llaniladi. Chiziqli bashoratda faqat ko‘pkanalli signal sanog‘i orasidagi korrelyatsiya (bog‘lanish) emas, balki kvantlanish shovqini spektrining shakli va uning vaqt bo‘yicha o‘zgarishi ham hisobga olinadi. AAC koderi psixoakustik modeli maskirovkasining global pog‘onasini(yuqori chegarasini) hisoblashda qo'shimcha amaliyotlar va aniqlashtirishlar kiritiladi. Biroq bu yerda ham Layer-3dagi kabi 2- modifikatsiyalangan psixoakustik model asos hisoblanadi.
AAC algoritmi ovoz signalini kodlashda nisbatan yuqori sifatga erishishni ta’minlaydi, masalan, 5.1. formatidagi kabi. Siqish hisobiga yuzaga kelgan buzilishlar raqamli oqim yig‘indi tezligi 320...384 Kbit/s bo‘lgandayoq, eshitish sezgisi qiymatining quyi pog‘onasidan pastda bo‘ladi, ya’ni inson sezmaydigan xududda. Tezlik 64 Kbit/s bo‘lganda 48 ta asosoiy kanal, ovozli effektlar uchun 16 ta quyi chastotali kanal, 16 ta ko‘p tilli kanal va 16 ma’lumot kanalidan foydalanish mumkin. 16ta dasturni ovozli elementlar va boshqa ma’lumotlardan istalgan miqdorda foydalanib ifodalash mumkin.
Shunday qilib, MPEG-2ning ovozli qismi, ko‘pkanalli ovozni kodlashni qo‘llagan holda, quyidagi formatlarning ijrosini ta’minlaydi:
· Besh kanalli ovozni;
· Keng ekranli kinoteatrlarda qo‘llaniladigan ikkita qo'shimcha frontal dinamikaga ega 7 kanalli ovozni;
· Ushbu formatlarning past chastotali kanallar bilan kengaytirishlarini.
Ovozli kanal dinamiklarining mos joylashuvi 4.3-jadvalda keltirilgan.
4.22-rasm. ISO/IEC 13818-7 standartining MPEG-2 AAC koderining tashkiliy chizmasi va uning ko‘pkanalli shakli
Ko‘p kanalli ovoz ko‘rinishlaridan biri, ko‘p tilli ovoz ifodasi bo‘lib, har bir til uchun alohida raqamli uzatish oqimi bilan, yoki bir nechta (7tagacha) 64Kbit/s til kanallarini 384 Kbit/s tezlikdagi ko‘p kanalli oqimga bilan amalga oshirish mumkin. Shuningdek, qo'shimcha ovoz kanallarini insonlarning eshitish va ko‘rish qobiliyati pasayganlar uchun (birinchi holatda sahnaning ko‘rinishini tasvirlash kanali, ikkinchi holatda suhbat tekstlarini, dialoglarini alohida berish kanali) ham uzatish mumkin.
4.3-jadval.
BS.775-Tavsiyasidan kelib chiqqan ko‘p kanalli ovozli tizimlar ierarxiyasi.