k-eng yaqin qo'shnilar algoritmi (KNN) KNN algoritmi - Tasniflash usullarining tipik vakili k-eng yaqin qo'shnilar algoritmi (KNN) hisoblanadi. Usul birinchi marta 1951 yilda Evelyn Fix va Jozef Louson Xodges tomonidan ishlab chiqilgan va keyinchalik Tomas Cover tomonidan ishlab chiqilgan.
- Usul parametrik bo'lmagan sinfga tegishli, ya'ni o'quv majmuasi qaysi statistik taqsimotdan tuzilganligi haqidagi taxminlarni talab qilmaydi. Shuning uchun KNN usuli yordamida tuzilgan tasniflash modellari ham parametrik bo'lmagan bo'ladi. Bu shuni anglatadiki, modelning tuzilishi dastlab qattiq o'rnatilmagan, balki ma'lumotlar bilan belgilanadi.
- Tasniflash asosidagi xususiyatlar boshqa jismoniy tabiatga va shunga mos ravishda qiymatlar diapazoniga ega bo'lishi mumkinligi sababli, tasniflash natijalarini yaxshilash uchun o'quv ma'lumotlarini normallashtirish foydali bo'ladi.
har biriga sinfi berilgan ta kuzatuvdan iborat ma'lumotlar to'plami bo'lsin. Keyin, uning asosida, barcha misollar juftliklari bo'lgan o'quv majmuasi tuzilishi mumkin. - har biriga sinfi berilgan ta kuzatuvdan iborat ma'lumotlar to'plami bo'lsin. Keyin, uning asosida, barcha misollar juftliklari bo'lgan o'quv majmuasi tuzilishi mumkin.
- KNN algoritmini ikkita oddiy bosqichga bo'lish mumkin: o'qitish va tasniflash(klassifikatsiya). O’qitish paytida algoritm kuzatishlarning xususiyat vektorlarini va ularning sinf belgilarini (masalan, misollar) eslab qoladi. k algoritm parametri ham o'rnatiladi, u tasniflashda qo'llaniladigan "qo'shnilar" sonini belgilaydi.
- Klassifikatsiya bosqichida sinf belgisi ko'rsatilmagan yangi ob'ekt taqdim etiladi. Buning uchun k eng yaqin (ba'zi metrik ma'noda) oldindan tasniflangan kuzatishlar aniqlanadi. Keyin k eng yaqin misol-qo'shnilarning ko'pchiligiga tegishli bo'lgan sinf tanlanadi va tasniflanayotgan ob'ekt bir sinfga tegishli.
Yangi ob'ekt sinfini aniqlash - Eng oddiy holatda, k misollar orasidan eng ko'p uchraydigan sinfni tanlash orqali yangi ob'ektning sinfini aniqlash mumkin. Biroq, amalda bu har doim ham yaxshi yechim emas, masalan, ikki yoki undan ortiq sinflar uchun paydo bo'lish chastotasi bir xil bo'lsa. Bundan tashqari, barcha o'quvchilar sinfni aniqlashda bir xil ahamiyatga ega emas deb taxmin qilish oqilona. Bunda qandaydir funksiyadan foydalaniladi, uning yordamida sinf aniqlanadi, bu birikma funksiya deb ataladi.
- Odatdagidek, “oddiy og'irliksiz ovoz berish” usuli qo'llaniladi. Barcha k misollar tasniflanayotgan ob'ektgacha bo'lgan masofadan qat'iy nazar bir xil "ovoz berish" huquqiga ega deb taxmin qilinadi.
- Biroq, misol xususiyat fazosida tasniflanayotgan ob'ektdan qanchalik uzoqda joylashgan bo'lsa, uning sinfni aniqlash uchun ahamiyati shunchalik past bo'ladi, deb taxmin qilish mantiqan to'g'ri. Shuning uchun tasniflash natijalarini yaxshilash uchun misollarni ularning masofasiga qarab tortish kiritiladi. Bunday holda vaznli ovoz berish qo'llaniladi.
Do'stlaringiz bilan baham: |