Qarorlar daraxti va uni qurish algoritmlari


Bo'linish uchun Jini indeksini hisoblash qadamlari



Download 1,44 Mb.
bet6/11
Sana27.01.2023
Hajmi1,44 Mb.
#904031
1   2   3   4   5   6   7   8   9   10   11
Bog'liq
Qaror daraxti algoritmi

Bo'linish uchun Jini indeksini hisoblash qadamlari

  1. Muvaffaqiyat (p) va muvaffaqiyatsizlik (q) (p²+q²) uchun yuqoridagi formuladan foydalanib, kichik tugunlar uchun Gini hisoblang.

  2. Ushbu bo'linishning har bir tugunining vaznli Gini ballidan foydalanib, bo'linish uchun Gini indeksini hisoblang.

CART (Tasniflash va regressiya daraxti) bo'linish nuqtalarini yaratish uchun Gini indeks usulidan foydalanadi.
Daromad nisbati
Axborotni olish ildiz tugunlari sifatida ko'p sonli qiymatlarga ega atributlarni tanlashga qaratilgan. Bu ko'p sonli aniq qiymatlarga ega atributni afzal ko'rishini anglatadi.
ID3 takomillashtirilgan C4.5 daromad koeffitsientini ishlatadi, bu ma'lumot daromadining modifikatsiyasi bo'lib, uning tarafkashligini kamaytiradi va odatda eng yaxshi variant hisoblanadi. Daromad koeffitsienti bo'linishdan oldin paydo bo'ladigan filiallar sonini hisobga olgan holda ma'lumot olish muammosini bartaraf etadi. U bo'linishning ichki ma'lumotlarini hisobga olgan holda ma'lumotni to'g'rilaydi.
Keling, bizda jins, yosh guruhi, reyting, blah, blah kabi o'zgaruvchilarga asoslangan foydalanuvchilar va ularning film janri afzalliklariga ega bo'lgan ma'lumotlar to'plami bor yoki yo'qligini ko'rib chiqaylik. Ma'lumot olish yordamida siz "Gender" bo'limiga bo'linasiz (agar u eng yuqori ma'lumotga ega bo'lsa) va endi "Yoshlar guruhi" va "Reyting" o'zgaruvchilari bir xil darajada muhim bo'lishi mumkin va daromad nisbati yordamida u jazolanadi. keyingi darajadagi bo'linish haqida qaror qabul qilishimizga yordam beradigan aniqroq qiymatlarga ega o'zgaruvchi.

Daromad nisbati
Bu erda "oldin" bo'linishdan oldingi ma'lumotlar to'plami, K - bo'linish natijasida hosil qilingan kichik to'plamlar soni va (j, keyin) bo'linishdan keyingi j kichik to'plami.
Variantning qisqarishi
Dispersiyani kamaytirish - doimiy maqsadli o'zgaruvchilar (regressiya muammolari) uchun ishlatiladigan algoritm. Ushbu algoritm eng yaxshi bo'linishni tanlash uchun standart dispersiya formulasidan foydalanadi. Kam dispersiyaga ega bo'linish populyatsiyani bo'lish mezonlari sifatida tanlanadi:

X-bar ustidagi qiymatlarning o'rtacha qiymati, X haqiqiy va n - qiymatlar soni.

Download 1,44 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   11




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish