4.5. Akustik naqshni aniqlash
bunday tarmoqni amalga oshirish ikkita piramidali neyron tarmoqdir
tasvirlar. Eng ko'p qirrali tan oluvchi
o'zaro ta'sir va shuning uchun bir soniyaning mavzusi bo'lib tuyuladi
bitta strukturada, shuningdek ikki o'lchovli fazoviy topologiyani ushlab
turish uchun qabul qiluvchi maydonlardan foydalanish
to'g'ridan-to'g'ri pikselli tasvirlardan vizual naqshni aniqlashning bir
nechta vazifalari. Muayyan misol
taqdim etilgan ob'ekt. Tarmoq odamlarning yuzlarini aniqlash muammosini
muvaffaqiyatli hal qildi.
vizual tasvirlar. Ko'rib chiqilgan neyron tarmoqlar va ayniqsa
qatlamlar va chiqish qatlami, ularning chiqishi keyingisini aniqlaydi
neokognitron, chunki u tasvirlarning joylashuvi, yo'nalishi va miqyosiga
o'zgarmasdir va nafaqat tanib oladi
maksimal ehtimollik printsipi bo'yicha olinishi mumkin. Tarmoq treningi
takroriy minimallashtirishdan iborat
invariant murakkab tasvirlar. Piramidal nerv
aql.
Umuman olganda, shuni ta'kidlash mumkinki, kognitron va yanada
mukammal neokognitron tasviriy ma'lumotni yuqori darajada tanib,
piksel ko'rinishida qayta ishlay oladi.
qo'shilgan Gauss shovqin bilan hammom kiritish funktsiyasi, RMS
neokognitron sun'iy tasvir tizimida turli tabiatdagi tasvirlarni idrok
etishning samarali bioo'xshash vositalaridir.
148
Machine Translated by Google
149
bunday tizimlarda nutqni aniqlash.
Bu erda nutq chegaralarini aniqlash bloki detektorlarni o'z ichiga oladi
bunday o'zaro ta'sir darajasi, shu jumladan nutqni boshqarish;
guruch. 4.4 jarayonning tipik funktsional diagrammasi ko'rsatilgan
va odamlar o'rtasida, rivojlangan aql talab qiladi. Robototexnika sohasida
matn sifatida. Nutqni tushunish ham sezgi, ham uning turli tarkibiy
qismlarini, uning hissiy rangini va, albatta, matnga kelsak, kontekstni
hisobga olishni talab qiladi, ammo bu barcha xususiyatlar bilan. Shu
sababli, robotlar bilan to'laqonli nutq o'zaro ta'siri, kabi
umuman robot.
ovozli signal energiyasi. Nutq so'zlarining xususiyatlarini olish uchun blok
nutqni farqlash, masalan, VAD (Ovozli faoliyat detektori) kabi
sun'iy intellekt darajasining muhim ko'rsatkichidir
turli maqsadlar uchun va turli tillar uchun nutqlar. Ko'pchilik
xususiyatni chiqarish. Nutq signalining segmentlarini qayta ishlashning
ikkita asosiy usuli mavjud: spektral transformatsiya va chiziqli bashorat.
Spektral transformatsiya
Tanish va tushunish tizimlari yaratilgan va ishlab chiqarilmoqda
akustik tasvirlarga dastlabki ishlov berishni amalga oshiradi. Nutq signali
davomiyligi 10-20 ms bo'lgan segmentlarga bo'linadi, ularning har biri
maxsus protseduralar bilan qayta ishlanadi.
og'zaki ma'lumotni tushunishdan ko'ra murakkab va murakkab
bosma matnni saqlash va chiqarish, ovozni boshqarish uchun ishlatiladigan
tizimlar, masalan, robotlar, tarjima tizimlari, savollarga javob berish uchun
dialog tizimlari va boshqalar. Ustida
ular har qanday odamning nutqi uchun mo'ljallangan. Ammo shunday
tizimlar mavjudki, ular "usta"ning ovoziga tanlab javob berishlari kerak. U yerda
bosh to'dasi. Biroq, nutqni tushunish ancha qiyinroq vazifadir.
nutqning akustik signali optimalni hisoblash imkonini beradi
Guruch. 4.4. Nutqni aniqlash jarayonining diagrammasi
Machine Translated by Google
150
nutq. Tanib olishning eng mashhur fonemik usuli, bilan
predistorsiya filtri va og'irlik oynasi protsedurasi orqali nutq signalini qayta
ishlash, shuningdek avtoregressiya tahlili (ARA) va joriy o'qishlarni
yaqinlashtirish usuli bilan asosiy ishlov berish.
Tez furye transformatsiyasiga (FFT) duchor bo'lgan derazalar bir-birining
ustiga chiqadigan filtrlar to'plamidan o'tadi. Hammaning chiqishi
gaplar esa tanib olishning yakuniy bosqichidir
Chiziqli bashorat qilish usuli dastlabki usuldan foydalanadi
Signalning raqamli namunalari og'irlik deb ataladigan narsa yordamida
qayta hisoblangan bashorat filtri tomonidan qayta ishlanadi
koeffitsientlari) (4.5-rasm).
Standart bilan taqqoslash, so'z gipotezalarini qurish va optimallashtirish
nutq signalining har bir segmenti uchun [20].
ushbu signal uchun parametrlar to'plami (sepstral deb ataladigan
qo'shni namunalarning chiziqli birikmasi orqali signal. Natijada fonemalar
yoki so'zlarni tanib olish uchun ishlatiladigan chiziqli bashorat koeffitsientlari
(LPC) topiladi (4.6-rasm).
filtr logarifmik tarzda qabul qilinadi, sin/cos o'zgarishiga duchor bo'ladi,
natijada sepstral koeffitsientlar to'plami paydo bo'ladi.
Guruch. 4.6. Chiziqli bashorat qilish sxemasi
Guruch. 4.5. Nutq segmentini spektral o'zgartirish sxemasi
Machine Translated by Google
Gibrid tanib olish tizimlari ham mavjud, bu erda
so'z chegaralarini ko'pincha faqat bevosita aniqlash mumkin
akustik ma'lumotlarning hajmi, ular asosida stokastik ma'lumotlar
bazalari (akustik korpuslar) yaratiladi. Binolar str
optimalni tanlash orqali tan olish jarayonida
simbio-neyron tarmoqlari va NMMlar. Bu tizimlarda neyron tarmoq
Yashirin Markov modeli (HMM), bu diskret tasodifiy zanjirlar nazariyasiga
asoslanadi [21].
Nutqni aniqlash tizimlarining rivojlanishi juda ko'p narsalarni talab qiladi
Uzluksiz nutqni tanib olish eng qiyin. Bu yerda
tasvirlar juda xilma-xil va murakkab. Biroq, masalan, gibrid tanib olish
tizimlarini yaratishga urinishlar mavjud
maksimal ehtimollik mezoniga ko'ra.
shovqin. Bunday ma'lumotlar bazalarida transkripsiyalar, belgilar mavjud
va pragmatik mezonlar. Katta lug'atlar uchun foydalaning
holatlarning o'tish ehtimolini baholash uchun ishlatiladi
akustik, lingvistikaga ko'ra so'z ketma-ketligi
dinamiklar, uzatish kanali, darajasini hisobga olgan holda hisoblab chiqiladi
HMMga asoslangan statistik yondashuv sezilarli darajada rivojlangan
NMM sxemasida. Neyron tarmog'i neyron ulanishining og'irliklarini
sozlash orqali ehtimollik taqsimotining zichligini taxmin qiladi.
muammoli sohada. Bu erda semantik kontekstni tahlil qilish va tilning
stoxastik modellaridan foydalanish majburiydir.
neyron tarmog'i tasniflashning yakuniy bosqichida qo'llaniladi
fonema, bo'g'in, so'z va iboralar orqali signallar. Foydalanish
ko'p darajali ishlov berish, yuqori darajadagi protseduralar va bilim
ma'ruzachi va lug'at hajmi.
qaysi so'zlarni tuzish mumkin, so'ngra so'zlarning farazlari. Fonema va
so'zlarni tanib olish ko'pincha usul bilan amalga oshiriladi
nutq ma'lumotlarini majoziy tan olish, chunki audio
ga qarab, uning murakkabligiga nisbatan nutqni aniqlash
tan olingan fonemalar haqida qaysi farazlar birinchi bo‘lib tuziladi, dan
HMMlar yordamida nutqni aniqlashga statistik yondashuvni to'liq
og'zaki audio naqshni aniqlash deb atash mumkin. Ishonchli variantlar
mavjud bo'lmasa-da
151
Machine Translated by Google
misollar, umumiy qarorlar qabul qilish imkonini beradi. Amaliyni
ifodalovchi induktiv xulosa chiqarishning rivojlangan nazariyasi mavjud
umumlashtirish asosida qarorlar qabul qilish muammolarini hal qilishga
qiziqish. Uning nuqtai nazaridan induktiv xulosaning kamchiligi
hamma odamlarga, lekin atrof-muhit ta'siri ostida ko'pchilik tomonidan
yo'qoladi. Robototexnika uchun sun'iy ijodkorlik aqlli robotlarni yaratish
uchun zaruriy shartdir. Bu qobiliyatlar, masalan, kiruvchi ma'lumotlarga
bog'liqlikni aniqlash va ular asosida gipotezalarni shakllantirish,
Gipotezalarning nazariy qurilishi induktiv yondashuvga asoslanadi.
Induktiv mantiqiy xulosa, umumlashtiruvchi xususiy boshlanish
Birinchi bobda ta'kidlanganidek, ijodkorlik, ya'ni. fikrlashning ijodiy
yo'nalishi, turli darajada, tug'ma xarakterlidir
Do'stlaringiz bilan baham: |