Ba'zi daraxtlar asosida berilgan parametrlarni qurish va bashorat qilish algoritmlaridan farqli o'laroq, regressiya vazifasi uzluksiz funksiyani uning qiymatlaridan tiklashdir:
E(𝑦|𝑥) = 𝑓(𝑥). (2.10)
DDoS hujumlarini aniqlash bo'yicha regressiya muammosi quyidagicha tuzilgan. Regressiya qiymatlari parametrlari toʻplami {𝑥1, 𝑥2, … , 𝑥𝑛} toʻplami, bogʻliq oʻzgaruvchilarning mos qiymatlari esa {𝑦1, 𝑦2, …, 𝑦𝑛} toʻplamidir.
Regressiya modeli quyidagi shaklga ega:
𝜔̅ =𝑝(𝑦|𝑥,𝜔,𝑓), (2.11)
Gde𝜔̅ - eng ehtimolli parametrlar, 𝑝 - qaramlikni topishning ehtimollik funksiyasi.
Tasniflash muammolarida regressiyadan foydalanish muhim kamchilikka ega, ya'ni oddiy modellar bashorat qilishning past aniqligiga ega, murakkab modellar esa, aksincha, haddan tashqari o'rnatilgan bo'lib chiqadi, bu tasniflash bashoratlarining aniqligini sezilarli darajada kamaytiradi va o'rganish xatolari ehtimolini oshiradi. sinov to'plamida.
Qaror daraxtlari asosida tasniflash va regressiya modellari qarorga olib keladigan "agar ... keyin" shartlar ierarxiyasi orqali qurilgan. Daraxt qurishda algoritm barcha mumkin bo'lgan test va topilmalardan o'tadimaqsadli o'zgaruvchi uchun eng informatsion ma'lumotlarni bo'lish rekursiv davom etadi. Ushbu protsedura barcha ma'lumotlar nuqtalari qaror daraxtining har bir bargidagi maqsadli o'zgaruvchining bir xil qiymatiga tegishli bo'lguncha davom etadi [124, 125]. Buning natijasidajarayonda har bir tugun mos keladigan daraxt quriladi ma'lum bir sinov. Maqsadli o'zgaruvchining bir xil qiymatiga tegishli nuqtalarni o'z ichiga olgan daraxt bargi sof deb nomlanadi [156]. K misol va N sinfni o'z ichiga olgan o'quv majmuasi berilsin. Muayyan atribut asosida olingan bo'linishning samaradorligini baholash uchun biz 𝜚(𝑠 ∨ 𝑡) ko'rsatkichini kiritamiz, bu erda s identifikator hisoblanadi.
bo'lim, t esa tugun identifikatori [156]. Keyin biz yozishimiz mumkin [126]:
𝑗=1
𝑊(𝑠 ∨ 𝑡) = 2 ∗ 𝑃𝐿 ∗ 𝑃𝑅 ∑𝑁
(𝑃(𝑗 ∨ 𝑡𝐿) − 𝑃(𝑗 ∨ 𝑡𝑅)),
(2.8)
bu yerda 𝑡𝐿 va 𝑡𝑅 mos ravishda t tugunining chap va oʻng bolalari, 𝑃𝐿 va 𝑃𝑅 chap va oʻng bolalardagi misollar sonining oʻquv toʻplamidagi umumiy soniga nisbati, 𝑃(𝑗 ∨ 𝑡) va (𝑗 ∨ 𝑡𝑅) - chap va o'ng bolalardagi j sinf misollari sonining ularning har biridagi umumiy soniga nisbati.
Qarorlar daraxti algoritmi ishning yuqori tezligini va tasniflash natijalarini vizualizatsiya qilish sathini ko'rsatadi, bu shubhasiz afzallik hisoblanadi. Biroq, tasniflashning maksimal aniqligiga erishishga harakat qilganda, qaror daraxtlari algoritmidan foydalangan holda modelni o'rgatish ushbu algoritmning qayta o'qitilishi mumkinligi sababli qiyinlashadi [127, 156].
Do'stlaringiz bilan baham: |