R2
: bashorat qilingan regressiyaning muvofiqlik o'lchovi.
R2 bilan belgilangan aniqlash koeffitsienti yaxshilikning umumiy o'lchovi bu taxmin qilingan regressiya chizig'iga (yoki bir nechta regressor jalb qilingan bo'lsa, tekislikga),
ya’ni barcha regressorlar tomonidan tushuntirilgan qaramlikdagi jami o'zgaruvchi Y (TSS) o‘zgarish nisbati yoki foizini beradi. R2 qanday hisoblanganligini ko'rish uchun, biz belgilaymiz:
Kvadratlarning umumiy yig'indisi (TSS) = y YY i i
2 2 ()
Izohlangan maydonlar yig'indisi (ESS) = (-
Y Y) i 2
Kvadratlarning qoldiq yig'indisi (RSS) = ei
2
Endi buni ko'rsatish mumkin
yye i ii
2 22
Ushbu tenglama aytadiki, haqiqiy Y qiymatlarining ularning namunasi bo'yicha umumiy o'zgarishi
o'rtacha (TSS) Y ning taxminiy qiymatlarining ular bo'yicha umumiy o'zgarishiga qo'shiladi.
yye i ii
2 22. Bir so'z bilan aytganda
TSS = ESS + RSS (1.17)
Endi R2 ni quyidagicha aniqlaymiz:
R2 ESS
TSS (1.18)
Shunday qilib, aniqlash koeffitsienti shunchaki nisbat yoki
Y ning umumiy o'zgarishini regressiya modeli foizi bilan izohlanadi.
Shuning uchun R2 0 va 1 oralig'ida bo'ladi, agar modelda kesishish muddati mavjud bo'lsa.
1 ga qanchalik yaqin bo'lsa, moslashuv yaxshiroq va 0 ga qanchalik yaqin bo'lsa, fitna shunchalik yomon bo'ladi. Eslab qoling, regressiya tahlilida maqsadlardan biri regressorlar yordamida iloji boricha o’zgaruvchiga bog’liq bo’lgan o'zgaruvchanlikni tushuntirishdir.
Shu bilan bir qatorda, R2 ni quyidagicha aniqlash mumkin:
R2 1 RSS
TSS
R2 ning bir kamchiligi shundaki, regressorlar sonining funksiyasining ortib borayotgani. Ya’ni agar siz modelga o’zgaruvchini qo’shsangiz, R2 ni qiymatlari oshadi. Shunday qilib, tadqiqotchilar R2 <> o’yinini topishadi, ya’ni R2 qanchalik yuqori bo’lsa, demak model yaxshiroq.
Ushbu vasvasaga yo’l qo’ymaslik uchun R2 o’lchovini modelga kiritilgan regressorlar sonini hisobga olgan holda aniq ishlatish tavsiya etiladi. Bunday R2 – tuzatilgan R2 deyiladi. Ř2 (R shapkali kvadrat) deb nomlanadi va tuzatilgan R2 dan quyidagicha hisoblanadi:
Ř=1-(1-R2)n-1/n-k
<> atamasi bog’liq bo’lgan erkinlik darajalariga moslashtirilgan degan ma’noni anglatadi, modeldagi regressorlar soniga (k) bog’liq bo’ladi.
R2ning 2ta xususiyatiga e’tibor bering:
Agar k>1 , Ř2>R2 , ya’ni modeldagi regressorlar soni ko’paygan sari, sozlangan R2 sonlanmagan Ř2 ga qaraganda tobora kichrayadi. Shunday qilib, R2 ko’proq regressorlarni qo’shish uchun “Xato” ni keltirib chiqaradi.
Tuzatilmagan R2 har doim ijobiy bo’ladi, lekin R2 ba’zan manfiy bo’lishi ham mumkin.
Tuzatilgan R2 ko’pincha bir xil bog’liq o’zgaruvchi mavjud bo’lgan 2 yoki undan ortiq rehressiya modellarini taqqoslash uchun ishlatiladi. Albatta regressorlar modelini taqqoslashning boshqa choralari ham mavjud, ularni 7 bobdaa muhokama qilamiz.
CLRM asosidagi asosiy nazariyani ko’rib chiqib, endi biz anoq yuqorida muhokama qilingan fikrlarni aks ettiruvchi misollarga bir ma’lumot beramiz. Ushbu misol bir necha regressiya modellarining prototipidir.
Do'stlaringiz bilan baham: |