Algoritm k-eng yaqin qo'shnilar
k - eng yaqin algoritm asosida tasniflash modelini qurish qo'shnilar hisoblanadi ichida yodlash ta'lim berish namunalar ma'lumotlar. Uchun Bormoq,
yangi ma'lumotlar misoli uchun bashorat qilish uchun, algoritm bajaradi Qidirmoq eng yaqin uchun uni ball ta'lim berish namuna, mavzular eng topish
"eng yaqin qo'shnilar." Yangi misol tayinlangan yorliq, o'quv majmuasining eng yaqin nuqtasiga tegishli. Algoritm imkon beradi nafaqat bitta eng yaqin qo'shnini, balki ularning o'zboshimchaliklarini ham ko'rib chiqing miqdori ( k ) [156].
Bo'lsin berilgan tarbiyaviy namuna dan juftlikda mehribon "ob'ekt-javob":
𝑥 𝑚 − { ( 𝑥 1 , 𝑦 2 ) , … , (𝑥 𝑚 , 𝑦 𝑚 )} . (2.5)
Ob'ektlar to'plamida 𝑝(𝑥, 𝑥 ′ ) [121] masofa funksiyasi berilsin, ob'ektlarning o'xshashligining etarlicha adekvat modeli bo'lishi kerak, keyin yemoq Qanday Ko'proq ma'nosi bu funktsiyalari, mavzular Kamroq o'xshash bor ob'ektlar 𝑥, 𝑥 ' . Uchun o'zboshimchalik bilan 𝑢 tartibga solish ob'ektlar ta'lim berish namunalar
𝑥 𝑖 ichida ortib borayotgan tartib masofalar oldin 𝑢 :
𝑝(𝑢, 𝑥 1;𝑢 ) ≤ 𝑝(𝑢, 𝑥 2;𝑢 ) ≤ ⋯ ≤ 𝑝(𝑢, 𝑥 𝑚;𝑢 ), (2.6)
qayerda 𝑥 𝑖,𝑚 bo'lgan ta'lim namunasi ob'ekti hisoblanadi 𝑖- qo'shni ob'ekt 𝑢 . Xuddi shunday, biz 𝑦 𝑖,𝑢 belgilarini kiritamiz 𝑖- chi qo'shniga javob berish . Algoritm eng yaqin qo'shnilar ichida eng umumiy shakl ko'rinadi Shunday qilib:
𝑖=1
𝑎 ( 𝑢 ) = 𝑎𝑟𝑔𝑚𝑎𝑥 ∑ 𝑚
[𝑥 𝑖,𝑚 = 𝑦]𝑤 ( 𝑖, 𝑢 ) ,
(2.7)
bu yerda 𝑤 ( 𝑖, 𝑢 ) 𝑖 ning ahamiyatlilik darajasini baholovchi berilgan vazn funksiyasi - ob'ektni tasniflashda th qo'shnisi 𝑢 [122]. Bu funksiya bo'lishi kerak salbiy bo'lmagan va ko'paytirmang yoqilgan 𝑖 -m.
k -yaqin qo'shnilar algoritmi bir qancha afzalliklarga ega, jumladan shu jumladan yengillik talqinlar modellar, qoniqarli sifat bashorat qilish olish mumkin foydalanmasdan katta miqdorlar sozlamalar. Ko'proq Bormoq, odatda the algoritm imkon beradi qurmoq model tasnifi juda tez. lekin da mavjudligi katta ta'lim berish namuna, modellar zarur qo'shimcha vaqt, uchun o'rganing. Shuningdek xarajatlar Mark, nima algoritm k- eng yaqin qo'shnilar
samarasiz uchun ish dan zaryadsizlangan to'plamlar ma'lumotlar, ichida qaysi bu yerda nol qiymatlar, lekin shuningdek dan to'plamlar ma'lumotlar, qayerda mavjud kopgina belgilar uchun taxminlar modellar. Shunday qilib yo'l algoritm k- _ eng yaqin qo'shnilar ko'pincha amalda qo'llanilmaydi, chunki u ega nisbatan past tezlik hisoblash Va emas balki tutqich katta xususiyatlar soni [123, 156].
Do'stlaringiz bilan baham: |