Eng kichik kvadratlar usuli.
Ikki xil funksiya mavjud: chiziqli va chiziqli bo'lmagan. Birinchi holda, o'rnatilgan funksiyalar :
mustaqil o'zgaruvchilar uchun koeffitsientlar .
Muammo (5.1) shartni qondirish uchun shunday koeffitsientlarni ō topishda. Masalan, regressiya masalasini hal qilishda ō koeffitsientlarini kvadratik yo'qotish funksiyasi (5.2) va chiziqli funksiyalar to'plami yordamida hisoblash mumkin :
Ma'ruza 3. Klassifikatsiya masalalarini yechish uchun ma'lumotlarni birlamchi qayta ishlash
REJA
Klassifikatsiya va regressiya muammolari
Klassifikatsiya qoidalari
Yechim daraxtlari
Matematik funksiyalar
Klassifikatsiya qoidalarini qurish usullari
Tayanch tushunchalar: klassifikatsiya, regressiya, klassifikatsiya qoidalari, qaror daraxtlari, daraxt tugunlari, barglar daraxtlari, 1R-algoritm.
1.Klassifikatsiya va regressiya muammolari
Klassifikatsiya va regressiya muammosida ushbu ob'ektni tavsiflovchi boshqa o'zgaruvchilar qiymatlari asosida ob'ektning qaram o'zgaruvchisining qiymatini aniqlash talab qilinadi. Rasmiy ravishda klassifikatsiya va regressiya muammosini quyidagicha ta'riflash mumkin. Ko'p ob'ektlar mavjud:
o'rganilayotgan ob'ekt qayerda . Turli ob-havo sharoitida o'yinlarni o'tkazish to'g'risidagi ma'lumotlar bunday ob'ektlarga misol bo'lishi mumkin (3.1-jadval).
3.1-jadval
Kuzatish
|
harorat
|
namlik
|
shamol
|
O`yin
|
Quyoshli
|
Issiq
|
Yuqori
|
Yo’q
|
Yo`q
|
Quyoshli
|
Issiq
|
Yuqori
|
Bor
|
Yo’q
|
Bulutli
|
Issiq
|
Yuqori
|
Yo’q
|
Ha
|
Yomg`ir
|
O’rtacha
|
Yuqori
|
Yo’q
|
Ha
|
Yomg`ir
|
Sovuq
|
O’rtacha
|
Yo’q
|
Ha
|
Yomg`ir
|
Sovuq
|
O’rtacha
|
Bor
|
Yo`q
|
Bulutli
|
Sovuq
|
Yuqori
|
Bor
|
Ha
|
Quyoshli
|
O’rtacha
|
O’rtacha
|
Yo`q
|
Yo`q
|
Quyoshli
|
Sovuq
|
O`rtacha
|
Yo`q
|
Ha
|
Yomg`ir
|
O’rtacha
|
O’rtacha
|
Yo`q
|
Ha
|
Quyoshli
|
O’rtacha
|
O`rtacha
|
Bor
|
Ha
|
Har bir ob'ekt o'zgaruvchilar to'plami bilan tavsiflanadi:
qaerda - mustaqil o'zgaruvchilar, ma'lum x va y qaram o'zgaruvchining qiymati aniqlanadi qaysi asosida qaysi qiymatlari , bu misolda, mustaqil o'zgaruvchilar bor: kuzatish, harorat, namlik va shamol. Bog'liq o'zgaruvchi sifatida qaraladi.
Data Miningda mustaqil o'zgaruvchilar to'plami ko'pincha vektor sifatida belgilanadi:
Har bir o'zgaruvchi ma'lum bir to'plamdan qiymatlarni olishi mumkin:
Agar o'zgaruvchining qiymatlari cheklangan to'plamning elementlari bo'lsa, u kategorik tipga ega deb aytiladi. Masalan, o'zgaruvchan kuzatuv {quyosh, bulutli, yomg'ir} qiymatlari to'plami bo'yicha qiymatlarni oladi.
Agar qiymatlar to'plami bo'lsa
o'zgaruvchi chekli bo'lsa, u holda muammo klassifikatsiya muammosi deb ataladi. Agar o'zgaruvchi haqiqiy sonlar to'plamida qiymat olsa , u holda muammo regressiya muammosi deb ataladi.
Klassifikatsiya va regressiya masalalarida oʻzgaruvchilar oʻrtasidagi aniqlangan funksional bogʻliqlik quyidagi usullardan biri bilan ifodalanishi mumkin:
klassifikatsiya qoidalari;
qaror daraxtlari;
matematik funksiyalar.
Do'stlaringiz bilan baham: |