Bog'liq Nazirov Q 616-21Ehtimollik va statistika Mustaqil ish
KO'P O'LCHOVLI REGRESSIYA TENGLAMALARINI BAHOLASH VA TAHLIL QILISH
Reja: Regressiya tenglamalarini baholash
Matritsani aniqlovchi tenglamalar
Regression tahlil
Jamiyat hayotidagi hodisalar bir qator omillar ta'siri ostida shakllanadi, ya'ni ular ko'p qirrali. Kompleks omillar omillar o'rtasida mavjud, shuning uchun ularni ajratilgan ta'sirlarning oddiy yig'indisi sifatida ko'rib bo'lmaydi. Uch yoki undan ortiq bog'liq xususiyatlarning o'zaro bog'liqligini o'rganish ko'p darajali korrelyatsiya va regressiya tahlili deb nomlanadi.
Ushbu tushuncha birinchi marta Pearson tomonidan 1908 yilda paydo bo'lgan.
Ko'p o'zgaruvchan korrelyatsiya va regressiya tahlili quyidagi bosqichlarni o'z ichiga oladi:
Vazifa uchun zarur bo'lgan omil belgilarini tanlashga qaratilgan nazariy tahlil; aloqa shaklini tanlash (regressiya tenglamasi);
muhim omil xususiyatlarini tanlash, modeldan muhim bo'lmagan xususiyatlarni olib tashlash, bir nechta omil xususiyatlarini bittasiga birlashtirish (bu xususiyat har doim ham mazmunli izohga ega emas); olingan modelning mosligini tekshirish;
natijalarni sharhlash.
Faktor belgilarini tanlash bosqichida, agar raqamli ma'lumotlar ikki qiymat o'rtasidagi bog'liqlikni ko'rsatsa ham, bu ularning ikkalasi ham bir yoki bir nechta qiymatlarga bog'liqligini ko'rsatishi mumkin (masalan, soch uzunligi - bo'yi - jinsi; pingvin sindromi). )
Bog'lanishning har qanday shakli uchun, ayniqsa o'rganilayotgan populyatsiyaning oz miqdori sharoitida, bu bog'liqliklarni bir darajaga yoki boshqasiga tavsiflaydigan butun tenglamalarni tanlash mumkin. Munosabatlarning ko'p qirrali modellarini qurish amaliyoti shuni ko'rsatadiki, ijtimoiy-iqtisodiy hodisalar o'rtasidagi bog'liqlikni tavsiflash uchun odatda chiziqli, ko'paytirilgan, kuch va giperbolik funktsiyalar qo'llaniladi. Modelni tanlashda ular avvalgi tadqiqotlar yoki tegishli sohalarda o'qish tajribasidan foydalanadilar.
Chiziqli modellarning afzalligi parametrlarni hisoblash va iqtisodiy izohlarning soddaligi. O'zgaruvchiga bog'liq bo'lmagan chiziqli bog'liqliklar (kvilinear) o'zgaruvchilar o'zgarishi bilan chiziqli shaklga kamaytirilishi mumkin. Ko'p regressiya tenglamasining parametrlari normal tenglamalar tizimidan eng kam kvadratlar usuli bilan topiladi. Kompyuterdan foydalanish sharoitida ham chiziqli, ham nochiziqli qaramlik uchun parametrlarni aniqlash raqamli usul bilan amalga oshirilishi mumkin.
Ko'p tanlangan regressiyaning allaqachon tanlangan tenglamasini qurishda muhim bosqich bu faktor atributlarini tanlashdir. Simulyatsiya qilingan jarayonni etarlicha aks ettirish uchun modelga maksimal miqdordagi omillar kiritilishi kerak, ammo boshqa tomondan, parametrlarning haddan tashqari ko'pligi model bilan ishlashni qiyinlashtiradi. Bundan tashqari, olingan natijalar har bir omil xarakteristikasi uchun etarlicha ishonchli va takrorlanadigan bo'lishi uchun 10–20 ta kuzatuv o'tkazilishi kerak. Shuning uchun ularning ahamiyatini tahlil qilish asosida omillarni tanlash kerak.
Faktorlarni tanlash quyidagilar asosida amalga oshiriladi. bosqichma-bosqich chiqarib tashlash usuli;
bosqichma-bosqich regressiya usuli.
Bosqichma-bosqich chiqarib tashlash usulining mohiyati talabalar mezoni tomonidan sinovdan o'tkazilganda parametrlari ahamiyatsiz bo'lgan omillarni regressiya tenglamasidan ketma-ket chiqarib tashlashdir.
Bosqichli regressiya usulidan foydalanib, omillar regressiya tenglamasiga birmabir kiritiladi va kvadratlar qoldiqlari va ko'p korrelyatsiya koeffitsientlarining o'zgarishi baholanadi. Faktor ahamiyatsiz deb hisoblanadi va agar u regressiya tenglamasiga kiritilgan bo'lsa, kvadrat registri o'zgargan bo'lsa ham, kvadratik qoldiqlarning miqdori o'zgarmagan bo'lsa e'tiborga olinmaydi. Faktor ahamiyatli deb hisoblanadi va agar korrelyatsiya koeffitsienti ko'paygan va kvadratik qoldiqlarning yig'indisi kamaygan bo'lsa, regressiya koeffitsientlari ahamiyatsiz o'zgargan bo'lsa ham modelga kiritiladi.
Regressiya modellarini qurishda ko'pkolinearlilik bilan bog'liq muammo paydo bo'lishi mumkin. Ushbu muammoning mohiyati omil belgilari o'rtasida sezilarli chiziqli bog'liqlik mavjudligidadir. Ko'p omillar hodisalarning bir tomonini aks ettirganda yoki biri ikkinchisining ajralmas qismi bo'lganida yuzaga keladi. Bu hisoblangan regressiya parametrlarining buzilishiga olib keladi, muhim omillarni tanlashni murakkablashtiradi va regressiya koeffitsientlarining iqtisodiy talqinining ma'nosini o'zgartiradi. Ko'p omillilik ko'rsatkichi bu korrelyatsion koeffitsientlar () bo'lib, bu omillar orasidagi o'zaro bog'liqlikni:
. Ko'p yo'nalishli aloqadorlikni yo'q qilish korrelyatsion modeldan bir yoki bir nechta chiziqli bog'liq xususiyatlarni yo'q qilish yoki asl omil xususiyatlarini yangi, kattalashtirilgan omillarga aylantirish orqali amalga oshirilishi mumkin.
Regressiya tenglamasini qurgandan so'ng, modelning mosligi tekshiriladi, unga regressiya tenglamasi va regressiya koeffitsientlarining ahamiyati tekshiriladi.
Har bir omilning samarali belgi o'zgarishiga qo'shgan hissasi regressiya
koeffitsientlari, har bir omilning ma'lum elastiklik omillari va standartlashtirilgan o'ziga xos regressiya koeffitsientlari bo'yicha baholanadi.
Regressiya koeffitsienti modelga kiritilgan barcha boshqa omillarning
o'rtacha darajasi bilan omilning ta'sirchan indikatorga mutlaq darajasini ko'rsatadi. Shu bilan birga, koeffitsientlarning turli xil o'lchov birliklarida (umuman olganda) o'lchanishi belgilarning ta'sir darajasini solishtirishga imkon bermaydi.
Bir misol.Olinadigan ko'mir ishlab chiqarish (t) tikuvning qalinligiga (m)
va mexanizatsiyalash darajasiga (%) bog'liq:.
Qisman egiluvchanlik koeffitsientlari tahlil qilinadigan indikator o'rtacha har bir omilning 1% o'zgarganda boshqalarning sobit pozitsiyasiga ega bo'lgan holda qancha o'zgarishini ko'rsatadi:
qaerda qabul qiluvchi omilning regressiya koeffitsienti, o'sha omilning
o'rtacha qiymati, samarali belgining o'rtacha qiymati.
Koeffitsientlar shuni ko'rsatadiki, standart omilning og'ish natijasi bo'lgan atribut shu omil o'zgarishi bilan qanchalik o'zgaradi, uning o'rtacha kvadratik og'ishining qiymati ko'rsatilgan.
bu erda omilning o'rtacha kvadrat og'ishi, natijada bo'lgan atributning
o'rtacha kvadrat og'ishi.
Shunday qilib, sanab o'tilgan ko'rsatkichlarga ko'ra, samarali atributdagi
o'zgarishlarning eng katta zaxiralari to'planadigan omillar aniqlanadi.
Bundan tashqari, ekstremal kuzatuvlarni aniqlash uchun qoldiq tahlilini
o'tkazish mumkin.
Ko'p darajali korrelyatsion tahlil doirasida ikkita tipik vazifalar ko'rib
chiqiladi:
qolganlarning ta'sirini o'rnatish yoki yo'q qilishda ikkita o'zgaruvchi
orasidagi bog'lanishning qattiqligini baholash;
bitta o'zgaruvchini qolganlari bilan bog'lashning qattiqligini baholash.
Birinchi muammoni hal qilish doirasida muayyan korrelyatsion
koeffitsientlar belgilanadi - boshqa barcha xususiyatlarni yo'q qilish paytida oshirib yuborilgan xususiyatlar o'rtasidagi munosabatlarning qat'iyligini tavsiflovchi ko'rsatkichlar.
Ko'p o'lchovli korrelyatsion tahlilda ikkita tipik muammolar ko'rib
chiqiladi:
Tahlilga kiritilgan bitta o'zgaruvchi (mahsuldor atribut) va boshqa barcha
o'zgaruvchilar (omil atributlari) o'rtasidagi o'zaro bog'liqlikni aniqlash.
Qolgan o'zgaruvchilarning ta'sirini yo'q qilish yoki yo'q qilishda ikkita
o'zgaruvchini o'zaro bog'liqligini aniqlash.
Ushbu muammolar ko'p va qisman korrelyatsiya koeffitsientlari
yordamida hal qilinadi.
Ularni aniqlash uchun namunaviy korrelyatsiya koeffitsientlarining
matritsasidan foydalanish mumkin.
,
bu erda funktsiyalar soni, namunaviy juftlikning korrelyatsiya
koeffitsienti.
Shunda samarali atributning butun faktor atributlari yig'indisi bilan
o'zaro bog'liqligini ko'p (jami) korrelyatsiya koeffitsienti yordamida o'lchash mumkin. Ushbu ko'rsatkichni baholash korrelyatsiya koeffitsientining namunasidir: