1-mavzu: Kirish. Mashinali o`qitishga kirish va uning asosiy tushunchalari
Reja:
1.1 Kirish
1.2 Mashinada o'qitish muammolari turlari
1.1 Kirish
Mashinada o'qitish tufayli dasturchi barcha mumkin bo'lgan muammolarni hisobga olgan va barcha echimlarni o'z ichiga olgan ko'rsatmalarni yozishi shart emas. Buning o'rniga, kompyuterga (yoki alohida dasturga) statistik ma'lumotlardan kompleks foydalanish orqali mustaqil ravishda echimlarni topish algoritmi yuklanadi, ulardan naqshlar olinadi va ular asosida bashorat qilinadi.
Ma'lumotlarni tahlil qilish asosida mashinalarni o'rganish texnologiyasi 1950 yilda, shashka o'yini uchun birinchi dasturlar ishlab chiqila boshlangandan boshlanadi. So'nggi o'n yilliklarda umumiy tamoyil o'zgarmadi. Ammo kompyuterlarning hisoblash qudratidagi portlovchi o'sish tufayli ular yaratgan naqshlar va bashoratlar bir necha bor murakkablashdi va mashinasozlik yordamida hal qilinadigan muammolar va vazifalar doirasi kengaydi.
Mashinada o'qitish jarayonini boshlash uchun avval kompyuterga ma'lumotlar to'plamini (dastlabki ma'lumotlarning bir qismini) yuklab olishingiz kerak, bu algoritm so'rovlarni qayta ishlashni o'rganadi. Masalan, itlar va mushuklarning rasmlari bo'lishi mumkin, ular allaqachon kimga tegishli ekanliklarini ko'rsatadigan yorliqlarga ega. O'quv jarayonidan so'ng dasturning o'zi it va mushuklarni yangi rasmlarda tegsiz taniy oladi. Prognozlar chiqarilgandan so'ng o'quv jarayoni davom etadi, biz dastur tomonidan qancha ko'p ma'lumotlarni tahlil qilsak, u kerakli tasvirlarni shunchalik aniqroq taniydi.
Mashinali o'qitish orqali kompyuterlar nafaqat fotosuratlar va chizmalardagi yuzlarni, balki landshaftlar, ob'ektlar, matn va raqamlarni ham tanib olishga o'rganadilar. Matn haqida gap ketganda, kompyuterda o'rganish ham muhim ahamiyatga ega: grammatikani tekshirish funktsiyasi endi har qanday matn muharririda va hattoki telefonlarda mavjud. Bundan tashqari, nafaqat so'zlarning imlosi, balki kontekst, ma'no soyalari va boshqa nozik lingvistik jihatlar ham hisobga olinadi. Bundan tashqari, inson aralashuvisiz (iqtisodiy va, masalan, sport mavzusida) yangiliklar maqolalarini yozish mumkin bo'lgan dasturiy ta'minot allaqachon mavjud.
1.2 Mashinada o'qitish muammolari turlari
ML bilan hal qilingan barcha vazifalar quyidagi toifalardan biriga kiradi.
1) Regressiya muammosi - bu turli xil xususiyatlarga ega bo'lgan ob'ektlar namunasiga asoslangan prognoz. Chiqarilgan mahsulot haqiqiy songa ega bo'lishi kerak (2, 35, 76.454 va boshqalar), masalan, kvartira narxi, olti oydan keyin xavfsizlik qiymati, do'konning keyingi oy uchun kutilayotgan daromadi, ko'r-ko'rona sinovlarda sharob sifati.
2) Tasniflashning vazifasi - bu xususiyatlar to'plamiga asoslangan kategorik javobni olishdir. Javoblarning cheklangan soniga ega (odatda "ha" yoki "yo'q" formatida): fotosuratda mushuk bormi, inson qiyofasi tasvirlanganmi yoki bemor saraton kasalligiga chalinganmi?
3) Klasterlash vazifasi - bu ma'lumotlarni guruhlarga taqsimlash: uyali aloqa operatorining barcha mijozlarini to'lov qobiliyati darajasiga bo'lish, kosmik ob'ektlarni u yoki bu toifaga (sayyora, yulduz, qora tuynuk va boshqalar) ajratish.
4) o'lchovni qisqartirish vazifasi, keyinchalik ularni vizualizatsiya qilish uchun qulay bo'lishi uchun (masalan, ma'lumotlarni siqish) ko'p sonli xususiyatlarni kichikroq (odatda 2-3) gacha kamaytirishdir.
5) Anomaliyalarni aniqlashning vazifasi anomaliyalarni standart holatlardan ajratishdir. Bir qarashda, bu tasniflash vazifasiga to'g'ri keladi, ammo bitta muhim farq bor: anomaliyalar kamdan-kam uchraydigan hodisa bo'lib, bunday ob'ektlarni aniqlash uchun mashinada o'rganish modelini o'rgatish mumkin bo'lgan o'quv misollari juda g'alati yoki oddiy emas, shuning uchun bu erda tasniflash usullari ishlamaydi. Amalda bunday vazifa, masalan, bank kartalari bilan firibgarlikni aniqlashdir.
Do'stlaringiz bilan baham: |