Hal qiluvchi qoida: agar bo‘lsa, i chi prediktor sinovdan o‘tgan hisoblanib modelda qoldiriladi, aks holda bu prediktorni yoki u bilan kuchli korrelyatsiyalangan boshqa prediktorni modeldan chiqarib tashlashga to‘g‘ri keladi.
Namuna O’zbekiston Respublikasining Xorazim viloyatining jami aholi soni o’rganildi.Bu jadvalda biz shu 2000-2021-yillar orasidagi hisobotini ko’rishimiz mumkin va bu natijalar 5 ta ko’rsatkich asosida tuzildi:
X1 Iqtisodiy faol aholi soni
X2 Ishsizlar
X3 Ko’chib ketganlar xorijga
X4 Ko’chib kelganlar xorijdan
Y Jami aholi soni
Yillar
|
X1
|
X2
|
X3
|
X4
|
Y
|
2000
|
463,7
|
2,5
|
627
|
75
|
1323,9
|
2001
|
472,1
|
3,8
|
846
|
51
|
1347,7
|
2002
|
483,0
|
4,7
|
1371
|
39
|
1369,3
|
2003
|
497,0
|
6,6
|
1652
|
39
|
1390,9
|
2004
|
514,8
|
8,2
|
1732
|
37
|
1410,3
|
2005
|
527,2
|
4,9
|
2203
|
72
|
1432,8
|
2006
|
541,0
|
3,0
|
1329
|
48
|
1453,9
|
2007
|
581,7
|
28,1
|
1587
|
48
|
1477,8
|
2008
|
599,2
|
28,1
|
766
|
49
|
1504,2
|
2009
|
620,4
|
32,2
|
901
|
56
|
1530,8
|
2010
|
642,0
|
35,3
|
771
|
79
|
1561,6
|
2011
|
659,8
|
34,6
|
810
|
86
|
1601,1
|
2012
|
679,1
|
35,7
|
784
|
104
|
1629,1
|
2013
|
697,5
|
37,1
|
624
|
82
|
1653,8
|
2014
|
717,8
|
39,2
|
605
|
83
|
1684,1
|
2015
|
735,5
|
39,5
|
448
|
51
|
1715,6
|
2016
|
754,7
|
41,4
|
365
|
74
|
1746,9
|
2017
|
773,3
|
44,0
|
226
|
64
|
1776,7
|
2018
|
786,0
|
74,2
|
244
|
75
|
1805
|
2019
|
810,0
|
73,5
|
259
|
32
|
1835,7
|
2020
|
804,5
|
88,1
|
543
|
2
|
1866,5
|
2021
|
806,4
|
80,1
|
398
|
7
|
1893,3
|
Manba: https://stat.uz/uz/rasmiy-statistika/living-standards-2
Universitet reytingi (Y) korrelyatsiya matritsasi
Minitab dasturi yordamida masalamizning korrelyatsiya matrisasini hosil qilamiz:
|
Y
|
X1
|
X2
|
X3
|
X4
|
Y
|
1,00000
|
0,99675
|
0,93305
|
-0,73020
|
0,29165
|
X1
|
0,99675
|
1,00000
|
0,93854
|
-0,74124
|
0,31863
|
X2
|
0,93305
|
0,93854
|
1,00000
|
-0,72683
|
0,22894
|
X3
|
-0,73020
|
-0,74124
|
-0,72683
|
1,00000
|
-0,31291
|
X4
|
0,29165
|
0,31863
|
0,22894
|
-0,31291
|
1,00000
|
Ushbu masaladagi korrelyatsiya matritsasining ko‘rinishi 5x5 ko‘rinishida. Jadvalda yoritilgan 1,0 qiymati o‘zgaruvchi o‘zi bilan 100% korrelyatsiyalanganligini bildiradi.
Korrelyatsiya matritsasiga ko‘ra birinchi o‘zgaruvchi (X1), ya’ni Iqtisodiy faol aholi soni jami aholi soni reytingi (Y) bilan kuchli korrelyatsiyalangan (r12=0,99675), shuning uchun “yaxshi” prediktor sifatida olsak bo‘ladi.
Ikkinchi o‘zgaruvchi X2 ya’ni Ishsizlar soni ham jami aholi soni reytingi (Y) bilan kuchli korrelyatsiyalangan (r13=0,93305), shuning uchun bu prediktorni ham “yaxshi” prediktor sifatida olsak bo‘ladi.
Qolgan prediktorlar jami aholi soni reytingi (Y) bilan kuchsiz korrelyatsiyalangan. Shuning uchun ularni “yaxshi” prediktor sifatida ola olmaymiz.
Regression Analysis: Y versus x1; x2
Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Regression 2 674739 337370 828,42 0,000
x1 1 65160 65160 160,00 0,000
x2 1 2105 2105 5,17 0,035
Error 19 7738 407
Total 21 682477
Model Summary
S R-sq R-sq(adj) R-sq(pred)
20,1803 98,87% 98,75% 98,45%
Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 735,4 50,8 14,47 0,000
x1 1,274 0,101 12,65 0,000 7,57
x2 1,048 0,461 2,27 0,035 7,57
Regression Equation
Y = 735,4 + 1,274 x1 + 1,048 x2
Fits and Diagnostics for Unusual Observations
Std
Obs Y Fit Resid Resid
22 1893,30 1846,88 46,42 2,61 R
Taklif etilgan model uchun chiziqli regressiya tenglamasi quyidagicha:
Y=735,4+1,274X1+1,048X2
X1 – iqtisodiy faol aholi;
X2 – ishsizlar;
Y ning X1 va X2 prediktorlar bilan ko‘p o‘zgaruvchi determinatsiyasi koeffitsiyenti foizi R2=98,87% ga teng. Bundan iqtisodiy faol aholi va ishsizlar soni jami aholi reytingi ulushi (%) yordamida topildi.
Xulosa
Ekonometrikaga oid tahlildan so‘ng quyidagicha xulosaga kelindi. Ushbu masala uchun 5 ta eng asosiy ahamiyatga ega bo‘lgan prediktorlar tanlab olindi va tahlildan o‘tkazildi. Dastlab, prediktorlar yordamida korrelyatsiya matritsasi qurildi va u bashorat uchun eng muhim prediktorlarni aniqlab olishga yordam berdi. Ushbu shartga ko‘ra bashorat uchun tanlangan prediktorlarning bog‘liq o‘zgaruvchi bilan korrelyatsiya koeffitsiyenti kuchli va o‘zaro korrelyatsiya koeffitsiyentlari esa kuchsiz (VIF tahlildan o‘tadigan) bo‘lishi kerak. Korrelyatsiya matritsa tahlili shartlariga ko‘ra modelda multikollinearlik mavjud bo‘lmasada,o‘qitish tizimiX1 va X2o‘zaro kuchli korrelyatsiyalangan edi.
Chiziqsiz regressiya modellari. Chiziqsiz regressiya
koeffitsiyentlarini baholash
Laboratoriya ishi uchun topshiriqlar:
Ishonchli manbalardan hajmi kamida 20 ta bo‘lgan X va Y ma’lumotlar oling.
Ushbu ma’lumotlar orasidagi bog‘lanishni aniqlang. Nuqtaviy diagrammasini chizing.
Ushbu ma’lumotlar asosida oddiy regression model quring, determinatsiya koeffitsiyentini aniqlang.
XvaY ma’lumotlar orasida parabolik regression model va kubik regression modellarni quring.
Ushbu ma’lumotlar orasidagi eksponensial regression model va logarifmik regression modellarni quring.
Yuqorida olingan modellarni solishtiring va eng yaxshi modelni aniqlang. Barcha ishlar bo‘yicha xulosa chiqaring.
Regressiya koeffitsiyentlari va xatolikka nisbatan chiziqli bo‘lgan model erkin o‘zgaruvchilarga nisbatan chiziqli bo‘lmasligi ham mumkin. Bunday model egri chiziqli model deyiladi.
Egri chiziqli modellarning asosiylaridan biri bu polinomial regressiya modelidir:
Y = 0 + 1X +2X2+ ... + kXk + .
Bu modelda k ko‘phadning tartibi. Regressiya tenglamasidagi erkin o‘zgaruvchi darajasining eng yuqori tartibi polinomial modelning tartibiga mos keladi. Masalan, oddiy chiziqli regressiya modelini birinchi tartibli polinom yoki ko‘phad deb atash mumkin:
Y 01X .
Ikkinchi tartibli polinom yoki parabolik model:
Y = 0 + 1X +2X2+,
bu yerda: Y – bog‘liq o‘zgaruvchi;
X – erkin o‘zgaruvchi;
0 Y–kesim;
1 parabolaning siljishi;
2 egrilik koeffisiyenti;
– tasodifiy xatolik.
Agar ijtimoiy - iqtisodiy hodisalar o‘rtasida to‘g‘ri chiziqlidan boshqa turdagi bog‘lanish mavjud bo‘lsa, u holda ularga mos funksional bog‘lanishning bahosini to‘g‘ri chiziqli bo‘lmagan modellar orasidan topish mumkin.
To‘g‘ri chiziqli bo‘lmagan regressiyani ikki sinfga ajratib o‘rganiladi:
Modelga kiritilgan tushuntiruvchi o‘zgaruvchilarga nisbatan chiziqli bo‘lmagan, lekin baholanadigan parametrlarga nisbatan chiziqli regressiya, masalan
parabola: ;
polinomialfunksiya: ;
teng tomonli giperbola: ;
yarim logarifmik funksiya: ;
ildizli funksiya:
Baholanayotgan parametrlarga nisbatan chiziqli bo‘lmagan regressiya: masalan,
ko‘rsatkichli funksiya: ;
eksponensial funksiya: ;
logistik funksiya: ;
umumlashgan darajali funksiya:
Misol.O’zbekiston Respublikasining Xorazm viloyati 2000-2021- yillar o’rasida ko’chib kelganlar xorijdan va ko’chib ketganlar xorijga haqida malumot berilgan . Bunda ko’chib kelganlar X ko’chib ketganlarni Y bilan belgilaymiz
Yillar
|
Ko’chib kelganlar xorijdan X
|
Ko’chib ketganlar xorijga Y
|
2000
|
75
|
627
|
2001
|
51
|
846
|
2002
|
39
|
1371
|
2003
|
39
|
1652
|
2004
|
37
|
1732
|
2005
|
72
|
2203
|
2006
|
48
|
1329
|
2007
|
48
|
1587
|
2008
|
49
|
766
|
2009
|
56
|
901
|
2010
|
79
|
771
|
2011
|
86
|
810
|
2012
|
104
|
784
|
2013
|
82
|
624
|
2014
|
83
|
605
|
2015
|
51
|
448
|
2016
|
74
|
365
|
2017
|
64
|
226
|
2018
|
75
|
244
|
2019
|
32
|
259
|
2020
|
2
|
543
|
2021
|
7
|
398
|
Nuqtali diagramma chizamiz:
Nuqtali diagrammadan ko‘rinib turibdiki, X vaY o‘zaro musbat korrelyatsiyalangan bog‘langan.
Chiziqli model
Chiziqli modelni quramiz. Bu bizga bu ikki o‘zgaruvchi qanday chiziqli bog‘langanligini ko‘rsatadi.
Chiziqli modelda Y X orqali ifodalanadigan regressiya tenglamasi quyidagi ko‘rinishda bo‘ladi:
Y=953,2-1,501X.
Kvadratik model
Kvadratik model tenglamasi quyidagi ko‘rinishga ega:
Y= 545,0+ 19,09 * X – 0,1981 * X2.
.
Kubik model
Berilgan masala uchun kubik model tenglamasi quyidagicha bo‘ladi:
Y= 247,2 +59,60*X -1,196*X2 +0,006491*X3.
Umumiy xulosa
Biz yuqorida bir nechta modellarni ko‘rib chiqishimizdan maqsad ma’lum masofani bosib o‘tish uchun (Y) ni (X) orqali eng yaxshi tushuntiradigan modelni tanlash edi. Eng yaxshi modelni aniqlashimiz uchun bizga har bir modeldagi determinatsiya koeffitsentlarining qiymatlarini taqqoslab chiqish kifoya. Qaysi modelda shu qiymat eng katta bo‘lsa o‘sha model biz uchun eng yaxshi model hisoblanadi. Chunki bu qiymat X prediktor Y bog`liq o‘zgaruvchining berilgan regressiya tenglamasi yordamida necha foizini tushintirib berishini anglatadi.
Masalani yechish jarayonida shuni aniqladikki, bizning masalamizda eng yaxshi model bu kubik model ekan. Bu modelda prediktor va tushuntiriluvchi o‘zgaruvchi kuchli korrelyatsiyalangan bog`liqlik mavjud. Shuningdek bu model uchun deteminatsiya koeffitsiyenti foizda 16,5% ga teng ekanligini yuqorida hisoblab topdik.
Do'stlaringiz bilan baham: |