5-Mavzu: Logistik regressiya tushunchasi va ularning mashinali o'qitishda qo'llanilishi.
Logistik regression (logistik regression) - ob'ektlarning sinflarga tegishli bo'lgan
havoriy (апостериорные) ehtimolligini baholashga imkon beruvchi chiziqli
tasnifni (классификатор) yaratish usuli.n-sonli belgilar bilan tasvirlansin
Unda ob'ektlarning xarakterli tavsiflari maydoni Y — sinflarning son-sanoqsiz sonlari
(nomlari, teglari) bo'lsin. "Ob'ekt, javob" juftligini o'qitish namunasi berilsin
Logistik regressiyasi maqsadli o'zgaruvchining ehtimolligini taxmin qilish uchun
ishlatiladigan nazorat ostida o'quv tasnifi algoritmidir. Maqsad yoki qaram
o'zgaruvchining tabiyati dixotomikdir, ya'ni faqat ikkita mumkin bo'lgan sinf
bo'ladi.
Qisqacha aytganda, qaram o'zgarmaydigan ikkilik xususiyatga ega va 1 (muvaffaqiyat / ha degan ma'noni anglatadi) yoki 0 (rad etish / yo'q degan ma'noni anglatadi) sifatida kodlangan ma'lumotlarga ega. Matematik tarzda, logistik regressiyasi modeli p (Y = 1) ni x funktsiyasi sifatida bashorat qiladi, bu spamni aniqlash, diabetni prognoz qilish, saratonni aniqlash va h. K. kabi turli xil tasniflash vazifalari uchun ishlatilishi mumkin bo'lgan eng oddiy ML algoritmlaridan biridir.
Logistika regressiyasi – bu o'zgaruvchilar o'rtasidagi bog'liqlikni aniqlashning bir usuli bo'lib, ulardan biri qat'iy qaram va boshqalar mustaqildir. Buning uchun logistika funktsiyasi (qayta ishlaydigan logistika taqsimoti) qo'llaniladi. Logistika regressiyasining amaliy ahamiyati shundaki, u bir yoki bir nechta mustaqil o'zgaruvchini o'z ichiga olgan voqealarni bashorat qilishning kuchli statistik usuli hisoblanadi. Bu quyidagi hollarda talab qilinadi:
Ikkilik yoki binomial Ushbu turdagi tasniflashda qaram o'zgaruvchining faqat ikkita turi mavjud: 1 va 0. Misol uchun, bu o'zgaruvchilar muvaffaqiyat yoki muvaffaqiyatsizlikni, ha yoki yo'q, g'alaba yoki yo'qotishni va boshqalarni ifodalaydi. Ushbu tasniflash shaklida qaram o'zgarmaydigan 3 yoki undan ko'p sonli tartibsiz turlarga yoki miqdoriy ahamiyatga ega bo'lmagan turlarga ega bo'lishi mumkin. Misol uchun, bu o'zgaruvchilar "a turi" yoki "b turi" yoki "C turi"ni ifodalaydi.
Tartib Ushbu tasniflash shaklida qaram o'zgarmaydigan 3 yoki undan ko'p buyurtma turlari yoki miqdoriy ahamiyatga ega bo'lgan turlarga ega bo'lishi mumkin. Misol uchun, bu o'zgaruvchilar "yomon" yoki "yaxshi", "juda yaxshi", "yaxshi" va har bir
toifadagi 0,1,2,3 kabi ballar bo'lishi mumkin. ikkitalik yoki binomial logistikalıq regressiyadir, bunda matlab yoki unga aloqador bo'lgan o'zgaruvchi 1yoki 0 bo'lishi mumkin bo'lgan ikkita turga ega bo'lishi mumkin. Bu bizga bitta nechta taxminlik o'zgaruvchilar va ikkitalik / binomial matlab o'zgaruvchisi o'rtasidagi munosabatti modellashtirishga imkoniyat beradi. Logistik regressiya holida chiziqli funktsiya asosan quyidagi funktsiyadagi kabi boshqa funktsiyaga kirish sifatida ishlatiladi.
Bu yerda 𝑔 logistik yoki sigmasimon funkciya bo'lib, quyidagicha berilishi
mumkin – Sigmasimon egri chiziq quyidagi grafik yordamida ifodalanishi mumkin. Y ogi baholari 0 va 1 orasida yotganini va oqtı 0,5 ke kesib o'tganini ko'rishimiz mumkin. Sinflarni ijobiy yoki salbiy deb ajratish mumkin. Chiqish ijobiy sinf ehtimoli ostida, agar u 0 va 1 orasida bo'lsa, ro'yobga oshirishlik uchun biz gipoteza funktsiyasini -0.5 bo'lsa, ijobiy deb aytamız, aks holda salbiy. Algoritm funktsiyalarning vaznlari yordamida qanchalik yaxshi ijrosini o'lchash uchun yo'qotmoqlik funktsiyasini aniqlashimiz zurur, bu quyidagicha teta bilan ifodalanadi :
Do'stlaringiz bilan baham: |