Agar model yangi ma'lumotlar uchun aniq prognozlarni ishlab chiqarishga qodir bo'lsa, unda mumkin o'ylab ko'ring, nima u ega qobiliyat umumlashtirish natija ustida sinov namunasi. Shuning uchun modelni shunday qurish kerak edi uchun u egalik qilgan maksimal ta'lim berish qobiliyat. Odatda model tasnifi shunday tuzilganki, u aniq bashorat beradi ta'lim namunasi bo'yicha. Agar ta'lim va sinov namunalari katta bo'lsa raqam umumiy xususiyatlar, keyin mumkin faraz qilmoq, nima model bo'ladi aniq Va ustida sinov o'rnatish ma'lumotlar, lekin bu emas har doim shunday. Qachon biz murakkab modellarni yaratamiz, keyin o'quv namunasi bo'yicha biz olishimiz mumkin o'zboshimchalik bilan aniqlik. faqat ko'rsatkich sifat ish yangi ma'lumotlar namunasi bo'yicha tasniflash algoritmidan foydalanish kerak sinov o'rnatish. hodisa, da qaysi yaratilgan model aylanadi juda ko'p qiyin uchun mavjud hajmi ma `lumot, chaqirdi overfitting va algoritm juda aniq bo'lganda paydo bo'ladi sozlaydi ostida o'ziga xos xususiyatlar ta'lim berish namuna, xop ishlaydi ustida uni, lekin natijani yangi ma'lumotlarga umumlashtira olmaydi. Boshqa bilan qo'l, agar model bo'ladi juda ko'p oddiy, keyin u bo'ladi yomon ish
hatto ustida ta'lim berish namuna. Vaziyat, da qaysi o'tkazildi tanlash juda oddiy model underfitting deb ataladi. Model qanchalik murakkab tasnifi, ta'lim ma'lumotlari ustida qanchalik samarali ishlaydi. Lekin agar model bo'ladi aylanadi juda ko'p murakkab keyin biz boshlaylik berish ta'lim namunasi ma'lumotlarining har bir misoliga juda ko'p e'tibor berish, va bunday model yangi ma'lumotlarga yaxshi umumlashtira olmaydi. Shunday qilib, zarur topmoq nuqta, tasvirlab berish murosaga kelish orasida kam tayyorgarlik Va qayta tayyorlash (rasm 3.2).
3.2-rasm. Noto'g'ri moslashish va o'rtasidagi kelishuvni tavsiflovchi nuqta qayta tayyorlash
Parametrlarning optimal qiymatlarini izlash va modelni baholash amalga oshirildi orqali foydalanish to'plamlar panjara qidirmoq dan birlashtirilgan tekshirish va 5 blokli o'zaro tekshirish, bunda ma'lumotlar bo'linadi bir necha marta va mos keladigan modellar soni qurilgan (3.3-rasm) [178].
Rasm 3.3. Jarayon 5-blok o'zaro tasdiqlash [156]
Jarayon 5-blok o'zaro tasdiqlash ko'rinadi Keyingi yo'l: Birinchidan, ma'lumotlar bir xil o'lchamdagi 5 qismga bo'linadi, deyiladi bloklar. Keyinchalik, birinchi model joylashgan modellar ketma-ketligi quriladi sinov namunasi sifatida birinchi blokdan foydalangan holda o'qitiladi, qolganlari bloklar (2-5) bajaring roli ta'lim berish namunalar.
O'xshash jarayonlar bino modellar takrorlanadi uchun hammasi qolgan bloklar. Beshta ma'lumotdan birinchisi birinchi blokni tashkil qiladi, beshta ma'lumotlarning ikkinchisi ikkinchi blokdir va hokazo. Shunday qilib, hisoblangan o'rtacha uchun hammasi bo'limlar kattalik xatolar ustida sinov kichik namunalar [179, 180].
Tasniflash uchun o'zgaruvchan parametrlar sifatida tarmoq paketlar, edi tanlangan parametrlar, topshirildi ichida 3.4-jadval.
3.4-jadval. Asoslangan klassifikatorni tayyorlash parametrlari gradientni oshirish
Parametrlar uchun optimallashtirish
|
Diapazon optimal
parametrlari
|
Optimal
parametrlari
|
Miqdori iteratsiyalar n_estimators
|
[10, 150]
|
ellik
|
Tezlik o'rganish o'rganish_stavkasi
|
[0.005, bir]
|
0.2
|
Balandligi ta'lim berish daraxt
maksimal_chuqurlik
|
[bir, 10]
|
7
|
Miqdori barglari
min_child_namunalar
|
[5.50]
|
o'ttiz
|
Do'stlaringiz bilan baham: |