71. Support Vector Machines (SVM) usulida sinflashtirish jarayonini bayon eting.
SVM - tasniflash , regressiya va chegaralarni aniqlash uchun foydalaniladigan nazorat qilinadigan o'rganish usullari to'plamidir .
SVM ning afzalliklari quyidagilardan iborat:
Yuqori o'lchamli bo'shliqlarda samarali.
Hali ham o'lchamlar soni namunalar sonidan ko'p bo'lgan hollarda samarali.
Qaror qabul qilish funktsiyasida (qo'llab-quvvatlash vektorlari deb ataladigan) o'quv nuqtalarining kichik to'plamidan foydalanadi, shuning uchun u xotiradan ham samaralidir.
Ko'p qirrali: qaror funktsiyasi uchun turli yadro funktsiyalari belgilanishi mumkin. Umumiy yadrolar taqdim etiladi, lekin maxsus yadrolarni ham belgilash mumkin.
SVM tarixi
• SVM statistik o'rganish nazariyasi bilan bog'liq
• SVM birinchi marta 1992 yilda taqdim etilgan
• SVM qo'lyozma raqamlarni aniqlashdagi muvaffaqiyati tufayli mashhur bo'lib bormoqda
• SVM ning “error rate” darajasi 1,1%. Bu aniqlik bilan tuzilgan LeNet4 neyron tarmog'ining xatolik darajasi bilan bir xil.
• SVM hozirda mashinani o’qitishning asosiy sohalaridan biri bo'lgan “asosiy usullari" ning muhim namunasi sifatida qaraladi.
K-NN (K Nearest Neighbors) algoritmining asosiy afzalliklarini misollar orqali tushuntirib bering.
KNN (K-Nearest-Neighbours)
• K-eng yaqin qo'shnilar nazorat ostida o'rganish texnikasiga asoslangan eng oddiy Mashina o'rganish algoritmlaridan biridir.
• K-NN algoritmi yangi ma'lumotlar va mavjud holatlar o'rtasidagi o'xshashlikni qabul qiladi va yangi qismni mavjud toifalarga eng o'xshash toifaga qo'yadi.
• K-NN algoritmi barcha mavjud ma'lumotlarni saqlaydi va o'xshashlik asosida yangi ma'lumotlar nuqtasini tasniflaydi.
• K-NN algoritmi regressiya uchun ham, tasniflash uchun ham qo'llanilishi mumkin, lekin u asosan tasniflash muammolari uchun ishlatiladi.
• K-NN parametrik boʻlmagan algoritm boʻlib, u asosiy maʼlumotlarga hech qanday taxmin qilmaydi.
K-Yaqin qo'shni nazorat ostida o'rganish texnikasiga asoslangan eng oddiy Mashina o'rganish algoritmlaridan biridir.
K-NN algoritmi yangi holatlar/ma'lumotlar va mavjud holatlar o'rtasidagi o'xshashlikni qabul qiladi va yangi ishni mavjud toifalarga eng o'xshash toifaga qo'yadi.
K-NN algoritmi barcha mavjud ma'lumotlarni saqlaydi va o'xshashlik asosida yangi ma'lumotlar nuqtasini tasniflaydi. Bu shuni anglatadiki, yangi ma'lumotlar paydo bo'lganda, uni K-NN algoritmidan foydalangan holda osongina quduqlar to'plami toifasiga ajratish mumkin.
K-NN algoritmi regressiya uchun ham, tasniflash uchun ham ishlatilishi mumkin, lekin u asosan tasniflash muammolari uchun ishlatiladi.
K-NN parametrik bo'lmagan algoritmdir , ya'ni u asosiy ma'lumotlarga hech qanday taxmin qilmaydi.
U dangasa o'rganuvchi algoritmi deb ham ataladi, chunki u o'quv to'plamidan darhol o'rganmaydi, aksincha u ma'lumotlar to'plamini saqlaydi va tasniflash vaqtida ma'lumotlar to'plamida amal qiladi.
O'quv bosqichida KNN algoritmi faqat ma'lumotlar to'plamini saqlaydi va u yangi ma'lumotlarni olganida, u ma'lumotlarni yangi ma'lumotlarga juda o'xshash toifaga tasniflaydi.
Misol: Aytaylik, bizda mushuk va itga o'xshash jonzot tasviri bor, lekin biz bu mushuk yoki it ekanligini bilishni xohlaymiz. Shunday qilib, ushbu identifikatsiya qilish uchun biz KNN algoritmidan foydalanishimiz mumkin, chunki u o'xshashlik o'lchovida ishlaydi. Bizning KNN modelimiz mushuklar va itlar tasvirlarida yangi ma'lumotlar to'plamining o'xshash xususiyatlarini topadi va eng o'xshash xususiyatlarga asoslanib, uni mushuk yoki it toifasiga kiritadi.
Misol uchun :
Aytaylik, ikkita toifa, ya'ni A va B toifalari mavjud va bizda yangi ma'lumotlar nuqtasi x1 bor, shuning uchun bu ma'lumotlar nuqtasi ushbu toifalarning qaysi birida joylashgan bo'ladi. Ushbu turdagi muammolarni hal qilish uchun bizga K-NN algoritmi kerak. K-NN yordamida biz ma'lum bir ma'lumotlar to'plamining toifasi yoki sinfini osongina aniqlashimiz mumkin. Quyidagi diagrammani ko'rib chiqing:
K-NN qanday ishlaydi?
K-NN ning ishlashini quyidagi algoritm asosida tushuntirish mumkin:
1-qadam: Qo'shnilarning K raqamini tanlang
2-bosqich: K qo'shnilarning Evklid masofasini hisoblang
3-qadam: Hisoblangan Evklid masofasiga ko'ra K eng yaqin qo'shnilarni oling.
4-qadam: Ushbu k qo'shnilar orasida har bir toifadagi ma'lumotlar nuqtalarining sonini hisoblang.
5-qadam: Yangi ma'lumotlar nuqtalarini qo'shni soni maksimal bo'lgan toifaga belgilang.
6-qadam: Bizning modelimiz tayyor.
Ma’lumotlarning intellektual tahlilida sun’iy neyron tarmoqlarining o’rni qanday?
Ma’lumotlarning intellektual tahlilida sun’iy neyron tarmoqlari yordamida qanday qilib sinflashtirish masalalari yechiladi?
Sun’iy neyron tarmoqlari nima?
Sun’iy neyron tarmog‘ining asosiy tashkil etuvchilarini yoritib bering.
Biologik va sun’iy neyron tarmoqlarining asosiy farqlarini yoritib bering.
Sun’iy neyron tarmoqning tashkil etuvchilarini misol orqali yoritib bering.
Perceptron nima?
Do'stlaringiz bilan baham: |