Qaror daraxtlarini kesish
Bo'linish jarayoni to'xtash mezonlariga erishilgunga qadar to'liq o'sgan daraxtlarga olib keladi. Biroq, to'liq o'sgan daraxt ma'lumotlarga to'g'ri kelishi mumkin, bu esa ko'rinmaydigan ma'lumotlarning past aniqligiga olib keladi.
Azizilloda siz daraxt shoxlarini kesib tashlaysiz , ya'ni umumiy aniqlik buzilmasligi uchun barg tugunidan boshlab qaror tugunlarini olib tashlang. Bu haqiqiy o'quv majmuini ikkita to'plamga ajratish orqali amalga oshiriladi: o'quv ma'lumotlari to'plami, D va tekshirish ma'lumotlar to'plami, V. Ajratilgan o'quv ma'lumotlar to'plamidan foydalangan holda qarorlar daraxtini tayyorlang, D. Keyin aniqligini optimallashtirish uchun daraxtni mos ravishda kesishni davom eting. tekshirish ma'lumotlar to'plami, V.
Azizillo
Yuqoridagi diagrammada daraxtning chap tomonidagi "Yosh" atributi kesilgan, chunki u daraxtning o'ng tomonida ko'proq ahamiyatga ega, shuning uchun ortiqcha moslamalar olib tashlandi.
Tasodifiy o'rmon
Tasodifiy o'rmon ansamblni o'rganishga misol bo'lib, unda biz yaxshi bashoratli ishlashga erishish uchun bir nechta mashinani o'rganish algoritmlarini birlashtiramiz.
Nima uchun "Tasodifiy" nomi?
Unga tasodifiy nom beradigan ikkita asosiy tushuncha:
Daraxtlarni qurishda o'quv ma'lumotlari to'plamining tasodifiy namunasi.
Tugunlarni ajratishda ko'rib chiqiladigan xususiyatlarning tasodifiy kichik to'plamlari.
Qoplash deb nomlanuvchi usul daraxtlar ansamblini yaratish uchun ishlatiladi, bu erda bir nechta o'quv majmualari almashtiriladi.
Qoplash texnikasida ma'lumotlar to'plami tasodifiy tanlab olish yordamida N namunaga bo'linadi . Keyin bitta o'rganish algoritmidan foydalanib, barcha namunalar bo'yicha model tuziladi. Keyinchalik, natijaviy bashoratlar parallel ravishda ovoz berish yoki o'rtacha hisoblash yordamida birlashtiriladi.
Tasodifiy o'rmon harakatda
Chiziqli yoki daraxtga asoslangan modellar qaysi biri yaxshiroq?
Xo'sh, bu siz hal qilayotgan muammo turiga bog'liq.
Agar qaram va mustaqil o'zgaruvchilar o'rtasidagi munosabatlar chiziqli model bilan yaxshi yaqinlashsa, chiziqli regressiya daraxtga asoslangan modeldan ustun bo'ladi.
Agar qaram va mustaqil o'zgaruvchilar o'rtasida yuqori chiziqli bo'lmagan va murakkab munosabatlar mavjud bo'lsa, daraxt modeli klassik regressiya usulidan ustun turadi.
Agar siz odamlarga tushuntirish oson bo'lgan modelni yaratishingiz kerak bo'lsa, qaror daraxti modeli har doim chiziqli modelga qaraganda yaxshiroq ishlaydi. Qaror daraxti modellarini talqin qilish chiziqli regressiyaga qaraganda osonroq!
Do'stlaringiz bilan baham: |