Birinchi qadam: ikkita shartli sinf yaratamiz:
"Ha," odam kompyuter sotib olishi mumkin.
"Yo‘q" - buning iloji yo‘q.
Ikkinchi qadam: - ularning har biri uchun ehtimollik qiymatini hisoblash.
"Ha", "buys_computer = yes" natijasi uchun formula quyidagicha ko‘rinadi:
P(buys=Yes)=9/14
"Yo‘q", natijasi uchun esa "buys_computer = no", shunga o‘xshash:
P(buys=no)=5/14
Uchinchi qadam : Ehtimollik qiymatlarini formulaga joylashtirish orqali entropiya qiymatini hisoblaymiz.
Info(D)=I(9,5)=- log2( )- log2( )=0,940
Bu entropiyaning ancha yuqori darajasi. To‘rtinchi qadam : Chuqurroq yondashamiz va qaror daraxti uchun mos ildiz atributini hisoblash uchun har bir holat uchun ma'lumotlarning o‘sishini hisoblaymiz. Bu yerda tushuntirish kerak. Masalan, “Yosh” atributi asos qilib olinsa, axborotning o‘sish sur'ati nimani anglatadi? Bu maʼlumotlar maʼlum bir yosh guruhidagi qancha odam mahsulot sotib olishini va sotib olmasligini koʻrsatadi. Aytaylik, 30 yoshli va bu yoshga to‘lmagan ikki kishi kompyuter sotib oladi (Ha), uch kishi sotib olmaydi (Yo‘q). Info(D) oxirgi uchta toifadagi odamlar uchun hisoblab chiqiladi - shunga ko‘ra, Info(D) ushbu uchta yosh diapazonining yig'indisi bo‘yicha hisoblanadi. Natijada, umumiy entropiya Info(D) va Info(D)age uchun entropiya o‘rtasidagi farq (u 0,694 ga teng bo‘lsin) ma'lumot o‘sishining istalgan qiymati bo‘ladi. U mana shu formula orqali aniqlanadi: Gain(age)=Info(D)-Infoage(D)=0,246 Keling, barcha atributlar uchun ma'lumotlarning o‘sish sur'atlarini taqqoslaylik:
Yoshi = 0,246.
Daromad = 0,029.
Talaba = 0,151.
Kredit reytingi = 0,048.
Ma'lum bo‘lishicha, yosh atributi uchun ma'lumotlarning o‘sishi eng muhimi - bu undan foydalanishga arziydi. Xuddi shunday, biz ushbu atributni olish yoki olmaslikni aniqlash uchun har bir bo‘linishdagi ma'lumotlarning daromadini taqqoslaymiz. Shunday qilib, optimal daraxt quyidagicha ko‘rinadi:
Ushbu daraxt uchun tasniflash qoidalari quyidagicha yozilishi mumkin:
Agar odam 30 yoshdan kichik bo‘lsa va u talaba bo‘lmasa, u kompyuter sotib olmaydi.
Agar odam 30 yoshdan kichik bo‘lsa va u talaba bo‘lsa, u kompyuter sotib oladi.
Agar odam 31 yoshdan 40 yoshgacha bo‘lsa, u katta ehtimol bilan kompyuter sotib oladi.
Agar odam 40 yoshdan oshgan bo‘lsa va a'lo darajadagi kredit reytingiga ega bo‘lsa, u kompyuter sotib olmaydi.
Agar odam 40 yoshdan oshgan bo‘lsa, o‘rtacha kredit reytingi bo‘lsa, u ehtimol kompyuter sotib oladi.
Shunday qilib, biz optimal qaror daraxtiga erishdik.
Do'stlaringiz bilan baham: |