Algoritm tasodifiy o'rmonlar
Avval aytib o'tganimizdek, daraxt algoritmining asosiy kamchiligi yechimlar ortiqcha moslashishga moyillikdir. Shu bilan birga, dastur Tasodifiy o'rmon algoritmi - nazorat ostida mashinani o'rganish algoritmi - qaror qiladi berilgan muammo.
Tasodifiy o'rmon - bu qaror daraxtlari to'plami har bir daraxt boshqalaridan parametrlari bo'yicha bir oz farq qiladi. mohiyati berilgan algoritm hisoblanadi ichida hajmi, nima har biri yog'och xop o'rganmoqda, lekin, ehtimol, qayta tayyorlangan ustida qismlar ma'lumotlar. Agar qurmoq katta raqam daraxtlar yechimlar qaysi xop tayyorlamoq Va turli darajada qayta o'qitiladi, kamaytirish mumkin qayta tayyorlash bo'ylab o'rtacha ular natijalar. Uchun tavsiflar berilgan yechimlar qurilish ishlari olib borilmoqda kopgina daraxtlar yechimlar qaysi bashorat qilish maqsadli o'zgaruvchi to'g'ri darajada va bir-biridan farq qiladi [156]. Algoritm bino tasodifiy o'rmonlar ko'rinadi Keyingi yo'l [128]:
uchun hamma n= 1 … , N yaratilgan namuna 𝑋 𝑛 , yoqilgan qaysi qurilish ishlari olib borilmoqda hal qiluvchi yog'och:
yoqilgan berilgan mezon tanlanadi eng yaxshi belgisi, yoqilgan kimga o'tkazildi bo'lim daraxt (charchoqqa qadar namunalar);
daraxt barglarning har biri yo'q bo'lgunga qadar quriladi ko'proq 𝑛 𝑚𝑖𝑛 ob'ektlar yoki ma'lum bir narsaga qadar chuqurlik daraxt;
da hamma bo'linish boshida tanlanadi m tasodifiy belgilar dan n boshlang'ich;
namunaning optimal bo'linishini izlash faqat ular orasida amalga oshiriladi. final klassifikator ko'rinadi Shunday qilib:
𝑎 ( 𝑥 ) = bitta ∑ 𝑁 𝑏 (𝑥) , (2.9)
𝑁 𝑖=1 𝑖
aks holda aytish uchun vazifalar tasnifi yechim tanlanadi ovoz berish yoqilgan eng [156].
Tanlangan xususiyatlar soni parametr yordamida aniqlanadi maksimal_xususiyatlar. Xususiyatlar to'plamini tanlash jarayoni alohida takrorlanadi tugunlarning har biri uchun, ular bilan bog'liq holda tugun bo'yicha qaror qabul qilinishi mumkin "o'z" funktsiyalar to'plamidan foydalanish. shart max_features = n_features har bir bo'linishda hamma ishtirok etishi mumkinligini anglatadi belgilar namunalar ma'lumotlar, lekin ichida jarayon tanlash belgilar emas bo'ladi tanishtirdi baxtsiz hodisa. Agar siz max_features = 1 ni o'rnatsangiz, bo'linmaydi amalga oshirilsin yo'q tanlash uchun sinov, o'rniga bu bo'ladi qidiruv tasodifiy uchun turli chegara qiymatlarini hisobga olgan holda amalga oshiriladi tanlangan belgisi. Yuqori ma'nosi bu parametr rahbarlik qiladi uchun bunga nima daraxtlar ichida tasodifiy o'rmon bo'ladi juda o'xshash Va qodir bo'ladi osongina taxminiy ma'lumotlar, murojaat qilish eng kamsituvchi belgilar. Kam qiymat o'rmondagi daraxtlar o'rtasida kuchli farqlarga olib keladi va, balki, ularning katta chuqurlik uchun yaxshiroq mos ma'lumotlar.
Da qabul qilish bashorat uchun tasodifiy o'rmonlar algoritm boshida hisoblab chiqadi bashorat uchun hamma daraxt ichida o'rmon. Uchun tasnifi qo'llaniladi strategiya "yumshoq ovoz berish”, orqali hisob-kitoblar ehtimolliklar uchun hamma sinf Va ekstraditsiya "yumshoq" bashorat. Bular ehtimolliklar barcha daraxtlar uchun o'rtacha hisoblanadi, shundan so'ng sinf bashorat qilinadi dan ehtimoldan xoli emas.
Tasodifiy o'rmon algoritmidan foydalanishning asosiy afzalliklari algoritm daraxt qarorlar bor ichida yo'qligi kerak masshtablash ma'lumotlar, lekin shuningdek ichida Ko'proq yuqori samaradorlik algoritm. Muhim kamchilik lekin, aylanadi imkonsizlik samarali ish dan siyrak Va yuqori o'lchamli ma'lumotlar. [129, 156].
Do'stlaringiz bilan baham: |