Mashinalarni o'qitish texnologiyasining mohiyati.
Umuman olganda, mashinani o'rganish - bu kompyuter dasturini yoki algoritmni berilgan topshiriqning bajarilishini bosqichma-bosqich yaxshilashga o'rgatish.
Mashinada o'qitish deganda muammoni to'g'ridan-to'g'ri emas, balki turli xil ma'lumotlarning tarkibiy qismlarini topishga asoslangan algoritmlarni ishlab chiqish uchun turli xil matematik, statistik va hisoblash usullari tushuniladi.
Ma’lumotlar aniq formulaga ko'ra emas, balki natijalarning ma'lum belgilar to'plamiga va ularning qiymatlariga o'rnatilgan bog'liqligiga qarab hisoblab chiqiladi.Masalan, har hafta bir hafta davomida qor qor bilan qoplangan va havo harorati sezilarli darajada noldan past bo'lsa, u holda ehtimol qish keldi. Shu sababli, mashinalarni o'rganish turli xil sohalarda: tibbiyotdan bankgacha diagnostika, prognozlash, tan olish va qarorlarni qabul qilish uchun qo'llaniladi.
Mashinada o'qitish nafaqat matematik, balki amaliy, muhandislik fanidir. Sof nazariya, qoida tariqasida, amalda qo'llaniladigan usul va algoritmlarni darhol olib kelmaydi. Ularni yaxshi ishlashi uchun siz nazariyada qilingan taxminlar va haqiqiy muammolar o'rtasidagi tafovutni qoplash uchun qo'shimcha evristikani ixtiro qilishingiz kerak. Mashinada o'qitish bo'yicha deyarli hech qanday izlanish usulning amaliy ishlashini tasdiqlovchi model yoki haqiqiy ma'lumotlarga nisbatan eksperimentsiz to'liq bo'lmaydi.
GeekUniversity, Mail.ru Group bilan birgalikda mashinada o'qishni o'rgatadigan birinchi Rossiya sun'iy intellekt fakultetini ochdi. O'qish uchun maktab ma'lumotlari etarli. Dastur barcha zarur manbalar va vositalarni + oliy matematikada to'liq dasturni o'z ichiga oladi. Oddiy universitetlarda bo'lgani kabi mavhum emas, lekin amalda qurilgan. Trening sizni mashinalarni o'qitish texnologiyalari va neyron tarmoqlari bilan tanishtiradi, sizga haqiqiy biznes muammolarini qanday hal qilishni o'rgatadi.
Dasturlash tillari (Programming Languages).
Mashinani o'rganishga ixtisoslashish uchun tilni tanlashda siz joriy ish e'lonlarida ko'rsatilgan ko'nikmalarni, shuningdek, mashinani o'rganish jarayonlari uchun ishlatilishi mumkin bo'lgan turli tillarda mavjud kutubxonalarni hisobga olishingiz mumkin.
2016-yil dekabr oyida indeed.com saytidagi ish e’lonlaridan olingan ma’lumotlardan shuni aytish mumkinki, Python mashinani o‘rganish professional sohasida eng ko‘p talab qilinadigan dasturlash tili hisoblanadi. Pythondan keyin Java, keyin R, keyin C++.
Python-ning mashhurligi so'nggi paytlarda ushbu til uchun mavjud bo'lgan chuqur o'rganish tizimi, jumladan TensorFlow, PyTorch va Kerasning rivojlanganligi bilan bog'liq bo'lishi mumkin. O'qilishi mumkin bo'lgan sintaksis va skript tili sifatida foydalanish qobiliyatiga ega bo'lgan til sifatida Python ma'lumotlarni oldindan qayta ishlash va to'g'ridan-to'g'ri ma'lumotlar bilan ishlash uchun kuchli va sodda ekanligini isbotlaydi. Scikit-learn mashina o'rganish kutubxonasi Python ishlab chiquvchilari allaqachon tanish bo'lishi mumkin bo'lgan bir nechta mavjud Python paketlari, xususan NumPy, SciPy va Matplotlib ustiga qurilgan.
Python bilan ishlashni boshlash uchun siz “Python 3-da qanday kodlash” bo‘yicha bizning o‘quv qo‘llanmalarimizni o‘qishingiz yoki maxsus “Python-da scikit-learn yordamida mashinani o‘rganish klassifikatorini qanday yaratish” yoki “Neyron uslublarini uzatishni qanday amalga oshirish” bo‘limlarini o‘qishingiz mumkin. Python 3 va PyTorch."
Java korporativ dasturlashda keng qo'llaniladi va odatda korxona darajasida mashinani o'rganish ustida ishlayotgan ish stoli dasturlarini ishlab chiquvchilar tomonidan qo'llaniladi. Odatda bu mashinani o'rganishni o'rganmoqchi bo'lgan dasturlashni yangi boshlaganlar uchun birinchi tanlov emas, lekin Java dasturini ishlab chiqishda ma'lumotga ega bo'lganlar tomonidan mashinani o'rganishga qo'llash ma'qul keladi. Sanoatda mashinani o'rganish dasturlari nuqtai nazaridan, Java tarmoq xavfsizligi uchun Python'dan ko'ra ko'proq foydalaniladi, shu jumladan kiberhujum va firibgarlikni aniqlash holatlarida.
Java uchun mashina o'rganish kutubxonalari orasida Java va Scala uchun yozilgan ochiq manbali va taqsimlangan chuqur o'rganish kutubxonasi Deeplearning4j; MALLET (Machine Learning for LanguageE Toolkit) matnda mashina oʻrganish ilovalari, jumladan, tabiiy tilni qayta ishlash, mavzularni modellashtirish, hujjatlar tasnifi va klasterlash imkonini beradi; va Weka, ma'lumotlarni qazib olish vazifalarida foydalanish uchun mashinani o'rganish algoritmlari to'plami.
R ochiq kodli dasturlash tili bo'lib, asosan statistik hisoblash uchun ishlatiladi. So'nggi yillarda u mashhurlik darajasiga ko'tarildi va ko'pchilik akademiya tomonidan ma'qullanadi. R odatda sanoat ishlab chiqarish muhitida qo'llanilmaydi, lekin ma'lumotlar faniga qiziqish ortishi tufayli sanoat ilovalarida ko'tarildi. R-da mashinani o'rganish uchun mashhur paketlar orasida bashoratli modellarni yaratish uchun karet (klassifikatsiya va regressiya treningining qisqartmasi), tasniflash va regressiya uchun randomForest va statistika va ehtimollar nazariyasi funktsiyalarini o'z ichiga olgan e1071 kiradi.
C++ - bu o'yin yoki robot ilovalarida (jumladan, robot harakatini) mashinani o'rganish va sun'iy intellekt uchun tanlangan til. O'rnatilgan hisoblash apparatlarini ishlab chiquvchilar va elektronika muhandislari tilni bilish va boshqarish darajasi tufayli mashinani o'rganish dasturlarida C ++ yoki C ni afzal ko'rishadi. C++ bilan foydalanishingiz mumkin bo'lgan ba'zi mashina o'rganish kutubxonalari orasida kengaytiriladigan mlpack, keng ko'lamli mashinani o'rganish algoritmlarini taklif qiluvchi Dlib va modulli va ochiq manbali Shark mavjud.
Do'stlaringiz bilan baham: |