Bog'liq 10-ma\'ruza. Informativ alomatlarni saralalsh
10-ma’ruza. Informativ alomatlar to‘plamlari
Obrazlarni anglash nazariyasida informativ alomatlar to‘plamini sintez qilish va tanlash usullari farqlanadi. Alomatlar sintezi(features extraction) – berilgan (xom) alomatlar funksiyasi sifatidagi yangi alomatlarni generatsiya qilishdir.
Alomatlarni tanlash(features selection) – foydalaniladigan mezonlar va ularni amalga oshirish usullariga bog‘liq ravishda ahamiyatli (informativ) alomatlarni tanlashdir. Aniq bir masalaga nisbatan alomatlarni informativ deyish mumkin. Alohida alomatlarning yuqori informativligi, ulardan tashkil etilgan to‘plam ham informativ bo‘lishini kafolalamaydi. Odatda alomatlarni tanlash masalasi NP to‘liq masala bo‘lganligi sababli optimal yechim mumkin bo‘lgan barcha variantlarni ko‘rib chiqish asosida olinishi mumkinki, real masalalarda buni amalga oshirishning deyarli imkoniyati yo‘q. Barcha variantlarni qarab chiqishni cheklab o‘tish uchun amaliyotda turli evristik usullardan foydalaniladi.
Alomatlar bir-biri bilan kuchli bog‘liq bo‘lishi, bir qator masalalarda ularning soni obyektlar sonidan katta bo‘lishi mumkin. Tanlanma obyektlari to‘plamining barchasi uchun bir xil informativ bo‘lgan alomatlarning o‘rtacha to‘plam ostisini olish murakkab masaladir.
Ma’ruzada barcha obyektlar tanlanmasi va alohida har bir obyekt uchun alohida informativ alomatlar to‘plam ostilarini tanlash masalalari qaraladi. Tanlash usullarida tanlanmaga dastlabki ishlov berishga asoslangan chastotali tahlilidan foydalaniladi. Obyektlar tavsifidagi alomatlar qiymatlarini yagona (nominal) o‘lchov shkalasiga o‘tkazish va informativ alomatlar to‘plam ostisiga nomzod sifatida faqat bog‘liqmas alomatlarni tanlash taklif etiladi.
Odatda, “o‘qituvchi” yordamida sinflashda turli toifadagi alomatlarning informativ to‘plam ostilarilarini ajratish jarayoni quyidagi muammolar yechimiga bog‘liq:
a) alomatlarni, boshlang‘ich ma’lumotni minimal yo‘qotadigan yagona turdagi o‘lcham shkalasiga o‘tkazish yoki miqdoriy alomatlar to‘plami bo‘yicha obyektlarning atrof tizimini berish;
b) obyektlar o‘rtasidagi yaqinlik o‘lchamini va tanlash mezonlarini aniqlash.
Obrazlarni anglashning o‘qituvchili o’rgatish masalalari yechishda obyektlarni baholash (indekslashtirish) mezonlari qaraladi. Baho qiymati obyekt informativ alomatlarining individual to‘plam ostisi bo‘yicha mezonning ekstremumi asosida hisoblanadi. Har bir obyekt atrofida o‘zining mantiqiy qonuniyati mavjudligi haqidagi gipotezaning rostliligi tekshiriladi.