ammo uning manbalari noma'lum bo'lib
qolmoqda,
chunki
u
etishmayapti satrda
keltirilgan
. Iltimos
yordam
bering takomillashtirish ushbu
bo'lim
tomonidan tanishtirish aniqroq
iqtiboslar.
(Avgust
2019) (Ushbu shablon xabarini qanday va qachon olib
tashlashni bilib oling)
Uchta asosiy o'rganish paradigmalari nazorat ostida o'rganish, nazoratsiz
o'rganish va mustahkamlashni o'rganish. Ularning har biri ma'lum bir o'quv
vazifasiga
mos keladi
Nazorat ostida o'rganish juftlashtirilgan kirish va kerakli natijalar to'plamidan
foydalanadi. O'quv vazifasi har bir kirish uchun kerakli natijani ishlab chiqarishdir.
Bunday holda xarajat funktsiyasi noto'g'ri ajratmalarni yo'q qilish bilan bog'liq.
[53]
Odatda
ishlatiladigan narx bu o'rtacha kvadratik xato, bu tarmoq chiqishi va kerakli chiqish
o'rtasidagi o'rtacha kvadratik xatoni minimallashtirishga harakat qiladi. Nazorat ostida
o'rganish uchun mos vazifalar naqshni aniqlash (shuningdek, tasnif deb ham ataladi)
va regressiya (funktsiyani yaqinlashtirish deb ham ataladi). Nazorat ostidagi ta'lim ketma-
ket ma'lumotlarga ham tegishli (masalan, qo'lda yozish, nutq va imo-ishoralarni aniqlash).
Buni "o'qituvchi" bilan o'rganish, shu vaqtgacha olingan echimlar sifati to'g'risida
uzluksiz teskari aloqani ta'minlaydigan funktsiya shaklida tasavvur qilish mumkin.
Yilda nazoratsiz
o'rganish,
kirish
ma'lumotlari
xarajat
funktsiyasi,
ma'lumotlarning ba'zi funktsiyalari
bilan birga beriladi
va tarmoq chiqishi. Xarajat
funktsiyasi vazifaga (model domeniga) va har qanday narsaga bog'liq
apriori
taxminlar
(modelning yashirin xususiyatlari, uning parametrlari va kuzatilgan o'zgaruvchilar).
Arzimas
misol
sifatida
modelni
ko'rib
chiqing
qayerda
doimiy
va
xarajatdir
. Ushbu xarajatlarni minimallashtirish qiymati hosil qiladi
bu
ma'lumotlarning o'rtacha qiymatiga teng. Xarajat funktsiyasi ancha murakkab bo'lishi
mumkin. Uning shakli dasturga bog'liq: masalan, ichida siqilish bilan bog'liq bo'lishi
mumkin o'zaro ma'lumot o'rtasida
va
, statistik modellashtirishda esa,
bilan
bog'liq bo'lishi mumkin orqa ehtimollik ma'lumotlar berilgan model (ushbu ikkala
misolda ham ushbu miqdorlar minimallashtirilgan emas, balki maksimal darajaga
ko'tarilishini unutmang). Nazorat qilinmagan o'rganish paradigmasiga kiradigan vazifalar
umuman
olganda taxmin
qilish muammolar;
dasturlarga
kiradi klasterlash,
taxminiy statistik taqsimotlar, siqilish va filtrlash.
Kuchaytirishni o'rganish
Asosiy maqola: Kuchaytirishni o'rganish
Shuningdek qarang: Stoxastik nazorat
Video o'yinlarni o'ynash kabi dasturlarda aktyor bir
nechta harakatlarni amalga
oshiradi, har biridan keyin atrof-muhitdan umuman kutilmagan javob oladi. Maqsad -
o'yinni
yutish,
ya'ni eng ijobiy (eng
kam
xarajatli) javoblarni
yaratish.
Yilda mustahkamlashni o'rganish, maqsadi uzoq muddatli (kutilayotgan kümülatif)
xarajatlarni minimallashtiradigan harakatlarni amalga oshirish uchun tarmoqni
og'irlashtirish (siyosat ishlab chiqish). Vaqtning har bir nuqtasida agent harakatni amalga
oshiradi va atrof-muhit kuzatuv va bir zumda xarajatlarni keltirib chiqaradi, ba'zi (odatda
noma'lum) qoidalarga muvofiq. Qoidalar va uzoq muddatli xarajatlarni odatda faqat
taxmin qilish mumkin. Har qanday vaqtda agent o'z xarajatlarini
qoplash uchun yangi
harakatlarni kashf etish yoki tezroq davom etish uchun oldindan o'rganishdan foydalanish
to'g'risida qaror qabul qiladi.
ANNlar
bunday
dasturlarda
o'quv
komponenti
bo'lib
xizmat
qiladi.
[54][55]
Dinamik
dasturlash ANNlar
bilan
birgalikda
(neyrodinamik
dasturlash)
[56]
kabi
muammolarga
nisbatan
qo'llanilgan transport
vositasini
yo'naltirish,
[57]
video O'yinlar, tabiiy resurslarni boshqarish
[58][59]
va Dori
[60]
ANN-larning
aniqligi yo'qotishlarini yumshatish qobiliyati tufayli, diskretizatsiya panjarasi zichligini
kamaytirganda ham, boshqaruv masalalari echimini son jihatdan yaqinlashtirish uchun.
Armaturani o'rganish paradigmasiga kiradigan vazifalar nazorat muammolari, o'yinlar va
boshqa ketma-ket qaror qabul qilish vazifalari.
O'z-o'zini o'rganish
Nerv tarmoqlarida o'z-o'zini o'rganish 1982 yilda "Crossbar Adaptive Array"
(CAA) nomli o'z-o'zini o'rganishga qodir bo'lgan neyron tarmoq bilan birga joriy
qilingan.
[61]
Bu
faqat bitta kirish, vaziyat s va faqat bitta chiqish, harakat (yoki xatti-
harakatlar) ga ega bo'lgan tizim. Unda tashqi maslahat va atrof-muhitning tashqi
mustahkamlovchi ma'lumotlari mavjud emas. CAA shpal shaklida har ikkala qarorni va
duch kelgan vaziyatlarga nisbatan his-tuyg'ularni (hissiyotlarni) hisoblab chiqadi.
Tizim
idrok va hissiyotlarning o'zaro ta'siridan kelib chiqadi.
[62]
Berilgan xotira matritsasi W = ||
w (a, s) ||, har bir iteratsiyada o'zaro faoliyat o'qitish algoritmi quyidagi hisoblashni
amalga oshiradi:
Vaziyatda s harakatni bajaring a; Oqibatlarga olib keladigan vaziyatni oling; V (lar)
holatida bo'lish hissiyotini hisoblash; W '(a, s) = w (a, s) + v (s ’)
xoch xotirasini
yangilang.
Backpropagated qiymati (ikkilamchi mustahkamlash) oqibat vaziyatiga nisbatan
hissiyotdir. CAA ikki muhitda mavjud bo'lib, ulardan biri o'zini tutadigan xulq-atvori
muhiti, ikkinchisi genetik muhit bo'lib, undan dastlab va faqat bir marta xulq-atvor
muhitida yuzaga keladigan vaziyatlarga duch keladigan dastlabki hissiyotlarni oladi.
Genetika muhitidan genom vektorini (turlar vektori) olgan CAA,
istalgan va kiruvchi
vaziyatlarni o'z ichiga olgan xulq-atvor muhitida maqsadga intilishni o'rganadi.
Nazarot savollari
1. Nerv faoliyatining biologik jihatlari va Nerv kletkalarining strukturasi haqida.
2. Dentrit markaziy nerv tizimi.
3 Som markaziy nerv tizimi.
4 Akson markaziy nerv tizimi.
5 Sinapsmarkaziy nerv tizimi.
6 Sun’iy neyronning matematik modeli.
7. Faollashtirish funksiyalari.