Mashinali o‘qitishning asosiy tushunchalari.
Mashinali o'rganish bu kompyuterlar o'rganadigan va odamlar singari harakat qiladigan bilimdir. Vaqt o'tishi bilan, o'zingizning haqiqatingizni kuzatish shaklida ma'lumotlarni taqdim etish orqali buni yaxshilashni o'rganing ».
Yuqoridagi ta'rif Machine Learning-ning asosiy maqsadi. Ushbu maqolaning maqsadi Machine Learning qanday ishlashi haqida tushuncha berishdir.
Bu ta'rif nimani anglatadi?
Har qanday kontseptsiyada bo'lgani kabi, kim bilan gaplashayotganingizga qarab, Machine Learning biroz boshqacha ta'rifga ega bo'lishi mumkin. To'rt amaliy ta'rif:
"Mashinada o'qitishning eng oddiy shakli - bu ma'lumotlarni tahlil qilish, undan o'rganish va keyin dunyodagi har qanday narsa haqida bashorat qilish uchun algoritmlardan foydalanish amaliyoti." - Nvidia
"Mashinali o'qitish - bu kompyuterlarni aniq dasturlashtirilmagan holda ishlashga oid fan". - Stenford
"Mashinada o'qitish qoidalarga asoslangan dasturlashga tayanmasdan ma'lumotlardan o'rganish mumkin bo'lgan algoritmlarga asoslangan." - McKinsey & Co.
Machine Learning savolga javob berishga harakat qilib, tajriba orqali avtomatik ravishda takomillashadigan kompyuter tizimlarini qanday qurishimiz mumkin va barcha o'quv jarayonlarini boshqaradigan asosiy qonunlar qanday? - Karnegi Mellon universiteti
Mashinaning asosiy tushunchalari
Mashinani o'rganish uchun turli xil algoritmlar mavjud. Har kuni yuzlab nashrlar chop etiladi. Ular odatda tomonidan guruhlanadi o'quv uslubi (nazorat ostida o'rganish, nazoratdan o'tkazilmaydigan o'rganish, yarim tekshiruvdan o'tish) yoki undan foydalanish shakl yoki funktsiya bo'yicha shartnomalar (masalan, tasniflash, regressiya, qarorlar daraxti, klasterlash, chuqur o'rganish va hk). O'quv uslubi yoki funktsiyasidan qat'i nazar, barcha kombinatsiyalar quyidagilardan iborat:
Taklif (bir tasniflovchi yoki kompyuter tushunadigan til)
Baholash (ob'ektiv / skoring funktsiyasi sifatida ham tanilgan)
Optimallashtirish (qidirish uslubi, odatda eng yaxshi balli tasniflovchi, off-the-shelf va maxsus optimallash usullari qo'llaniladi)
Machine Learning algoritmlarining asosiy maqsadi bundan oldin umumlashtirish, ya'ni ilgari hech qachon taqdim qilinmagan ma'lumotlarni muvaffaqiyatli talqin qilishdir.
Mashinalar o'rgansin
Mashinalarni o'rganishning turli usullari mavjud. sun'iy nerv tarmoqlari qatlamlari ichiga oddiy qaror daraxt Klaster foydalanish (ikkinchi chuqur o'rganish uchun yo'l bergan).
Ko'pincha eng yaxshi o'rganish algoritmini tanlashga diqqat qaratilgan bo'lsa-da, tadqiqotchilar eng qiziqarli savollarning ayrimlari Mashinani o'rganish uchun mavjud bo'lgan algoritmlarga javob bermaganligini aniqladilar.
Muhimi, Mashinani o'rganish faqatgina avtomatlashtirish emas. Agar shunday deb o'ylayotgan bo'lsangiz, albatta, sizga taqdim etadigan qimmatbaho tushuncha va imkoniyatlarni sog'inasiz.
O'rganadigan mashinalar foydalidir, chunki barcha qayta ishlash kuchlari bilan ular katta ma'lumotlarning namunalarini tezroq topa oladilar. Aks holda bu qismlar odamlar tomonidan o'tkazib yuborilgan bo'lar edi. Mashinada o'rganish - bu muammolarni hal qilishni yaxshilash uchun ishlatilishi mumkin bo'lgan vosita. U kasalliklarni aniqlash va global iqlim o'zgarishiga qarshi echimlarni topish kabi turli xil muammolar bo'yicha asosli xulosalar chiqarishi mumkin.
Mashinani o'rganishdagi qiyinchiliklar va cheklovlar
Eng ko'p boshlang'ich xatolaridan biri - mashq ma'lumotlarini muvaffaqiyatli sinovdan o'tgan illuzey bilan muvaffaqiyatli sinab ko'rishdir. Ma'lumot yig'ishning bir qismi barcha ma'lumotlar to'plami haqida hech narsa aytmaydi.
Agar o'rganish algoritmi (ya'ni o'quvchi) ishlamasa, ba'zan mashinaga qo'shimcha ma'lumot etkazib berish muvaffaqiyatli bo'ladi. Shu bilan birga, bu o'rganilayotgan vaqtdan ko'ra bizda ko'proq ma'lumotlarga ega bo'lgan o'lchamdagi muammolarga olib kelishi mumkin.
Mashinada o'qitish o'z-o'zidan maqsad emas. Bundan tashqari, uni umumiy echim sifatida ishlatish foydali emas.
Nerv tarmoqlarida chuqur o'rganish va zamonaviy rivojlanish
Chuqur o'rganish ma'lumotlarni abstraktsiyaning bir necha darajalarida namoyish etish uchun mashina algoritmlarini o'z ichiga oladi. Bu kompyuter tizimlarini tashkil qilish usullari. DeepMind, Facebook va boshqa institutlar orqali chuqur o'rganish Machine Learning-ning navbatdagi bosqichi sifatida aniqlandi.
Chuqur o'rganish tizimlari so'nggi o'n yil ichida yuzni tanib olish, matnni nutqqa aylantirish va ma'lumotlarni tiklash bo'yicha yaxshi natijalarga erishdi. Hozirgi kunda tadqiqotlar ma'lumotlar samaradorligini oshiruvchi mashinalarni o'rganishni rivojlantirishga qaratilgan. Bu samaraliroq o'rganish mumkin bo'lgan, qisqa vaqt ichida va kam ma'lumotlarga ega bo'lgan bir xil ishlashga ega bo'lgan chuqur o'quv tizimlari. Chuqur ta'lim sog'liqni saqlash, mashinalarni o'rganish robotlari va hissiyotlarni tahlil qilish kabi muhitlarda qo'llaniladi.
Mashinani o'rganish bo'yicha eng yaxshi amaliyotlar
Muvaffaqiyatli kompyuterni o'qitish loyihalarida eng muhim omil shubhasiz bo'lgan xususiyatlarma'lumotlarni ta'riflash uchun ishlatiladi. Bundan tashqari, siz modellarni tayyorlash uchun etarli ma'lumotlarga ega bo'lishingiz kerak.
Algoritmlar yaxshi ishlamaydigan ko'p hollarda, bu o'quv ma'lumotlari bilan bog'liq muammolarga bog'liq.
Tajribaviy ma'lumotlar, iloji bo'lsa, olinishi kerak. Misol uchun, tasodifiy namunaga e-mailning turli xil variantlarini yuborish orqali to'plangan ma'lumotlar
Har doim cross-validation uchun ta'lim ma'lumotlarining bir qismini qo'ying. Shunday qilib, tanlangan tasniflovchi yoki yangi algoritmni yangi ma'lumotlar yordamida tekshirishingiz mumkin