Dinamik dasturlash masalasining umumiy qo‘yilishi. Bellmanning funksional tenglamalari
Vaqtga bog„liq ravishda o„zgaruvchan va boshqarish mumkin bo„lgan tizimni ko„rib chiqamiz. Bu tizimni T ta bosqichlarga ajratish mumkin deb faraz qilamiz
t 1,2,...,T . Har bir bosqichning boshidagi tizimning holatini X t bilan belgilaymiz.
Xt X1t , X 2t ,..., X mt .
Тaraqqiyot jarayonida tizimning holati o„zgaradi. Uning
X t 1
holatdan X t
holatga o„tishiga Ut
boshqarish ta‟sir qiladi. Demak,
X t o„zgaruvchi
X t 1
va Ut
o„zgaruvchilarning funksiyasidan iborat bo„ladi, ya‟ni
Xt Xt 1 , Ut .
Bu yerda Ut
mumkin bo„lgan boshqarishlar to„plami Gt
Ut Gt .
ga tegishli, ya‟ni
Bunday aniqlashlarda tizimning butun davr 0, T
ichidagi taraqqiyoti
X 0 , X1 ,..., XT 1 , XT
vektorlar ketma-ketligi orqali aniqlanadi. X X t
X t - tizimning
t
t bosqichda mumkin bo„lgan holatlar to„plami. Тizimning boshlang„ich X 0 holatdan
XT holatga o„tkazish uchun
U0 ,U1 ,...,UT 1 ,UT
boshqarishlar ketma-ketligi, ya‟ni
strategiyalar xizmat qiladi. Тizimni eng yaxshi
XT holatga o„tkazishni ta‟minlash
uchun
fT ( X )
maqsad funksiyani kiritamiz.
fT ( X ) Zt Xt 1 , Xt ,
t 1
bu yerda
Zt Xt 1 , Xt
tizimning
X t 1
holatdan
X t holatiga o„tishida hisoblanadigan
va bu holatlarni solishtirib baholovchi funksiyadir.
Agar tizimning t bosqichdagi holatlar to„plami
X T , mumkin bo„lgan
boshqarishlar to„plami G hamda tizimni bir holatdan ikkinchi holatga o„tkazish
qoidasi hamda bu holatlarni solishtiruvchi funksiya
Zt Xt 1 , Xt
berilgan bo„lsa, T
bosqichli tizim to„la aniqlangan bo„ladi. Bunday tizimni ifodalovchi dinamik dasturlash masalasi quyidagicha yoziladi:
Тizimni boshlang„ich holati X 0 ma‟lum bo„lganda shunday
strategiyani tanlash kerakki, u
Ut U1 ,U 2 ,...,UT
Xt
shartlarni qanoatlantirib
(Xt 1 ,Ut ),
Xt Xt , Ut Gt ,
t 1,...,T
(5.10)
fT ( X ) Zt Xt 1 , Xt
t 1
(5.11)
funksiyaga ekstremal qiymat bersin.
Ushbu munosabatlardan ko„rinadiki, dinamik dasturlash masalasi ko„p
bosqichli tanlash masalasi bo„lib, uning U * optimal yechimi bir necha bosqichlarda
topilgan mumkin bo„lgan Ut boshqarishlar asosida tanlanadi.
Geometrik nuqtai nazardan dinamik dasturlash masalasini quyidagicha talqin
X
qilish mumkin. Umumiy holda tizimning boshlang„ich
* holati va oxirgi
X k holati
0
aniq berilmaydi hamda boshlang„ich holatning butun bir X 0 sohasi va oxirgi
X
k
holatlarning * sohasi ko„rsatiladi.
Umumiy holda dinamik dasturlash masalasi quyidagicha ta‟riflanadi. Biror
boshqariluvchi X tizim boshlang„ich
X X *
holatda bo„lsin. Vaqt o„tishi bilan
0 0
tizimning holati o„zgaradi va u
X X *
oxirgi holatga o„tadi deb hisoblaylik. Тizim
k k
holatlarining o„zgarishi biror miqdoriy W -mezon bilan bog„liq deylik. Тizimning o„zgarish jarayonini shunday tashkil etish kerakki, bunda W -mezon o„zining optimal qiymatiga erishsin.
U - mumkin bo„lgan boshqaruvlar to„plami bo„lsin. U holda, masala X
tizimni
X X * holatdan X X *
holatga o„tkazishga imkon beruvchi shunday
0 0 k k
U * U
boshqaruvni topishdan iboratki, bunda
W (U )
mezon o„zining
W * W (U * )
optimal qiymatiga erishsin.
Odatda tizimning X 0 holatini sonli parametrlar bilan, masalan ajratilgan
fondlar miqdori, jalb qilingan investitsiyalar hajmi, sarflangan yonilg„i miqdori va hokazolar bilan ifodalash mumkin. Bu parametrlarni tizimning koordinatalari deb
ataymiz. U holda tizimning holatini X nuqta bilan va uning
X 1 holatdan
X 2 holatga
o„tishini X nuqtaning trayektoriyasi bilan va uning
X 0 holatdan X k
holatga o„tishini
X nuqtaning trayektoriyasi bilan tasvirlash mumkin. (5.1-rasm). (5.10) – (5.11) masalani yechishdan avval
GT ,GT 1,T ,...,G1,2,...,T G
belgilashlar kiritamiz. Bu yerda GT
masalaning oxirgi T bosqichidagi aniqlanish
sohasi,
GT 1, T
T 1
bosqichlardagi aniqlanish sohasi,
G1,2,..., T G
masalaning aniqlanish sohasi.
X 2
X
* 0
X
X
*
k
0 X1
5.1-rasm. Тizimni bir holatdan boshqasiga o„tishi
Maqsad funksiyaning oxirgi bosqichdagi optimal qiymatini belgilaymiz:
f1 ( XT 1 )
bilan
f1 ( XT 1 ) max(min) ZT XT 1 , UT
UT 1 GT
f2 ( XT 2 ) max(min) ZT 1 XT 2 , UT 1 f1 XT 1
UT 2 GT 1, T
(5.12)
(5.13)
Хuddi shuningdek,
belgilaymiz. U holda
T 1
qadamdagi shartli optimal qiymatni
f2 ( XT 2 )
bilan
f3 ( XT 3 ) max(min) ZT 2 XT 3 ,UT 3 f2 XT 2
UT 3GT 2,T 1,T
(5.14)
fk ( X
T k
) max(min) Z
UT k GT k ,,..., t
T k 1 X
T k
,UT k 1
f
k 1 X
T k 1
,
k 1,T 1
(5.15)
fT ( Xn ) max(min) Z1 Xn ,U1 fT 1 X1
UT GT
(5.16)
Bu yerda (5.12) – (5.16) ifodalar ortimallik tamoyilining matematik formadagi yozilishidan iborat bo„lib, ular “Bellmanning funksional tenglamalari” yoki “Dinamik dasturlashning asosiy funksional tenglamalari” deb ataladi.
Bu tenglamalar yordamida dinamik dasturlashning
T 1
bosqichdagi yechimini
so„nggi T bosqichdagi yechim orqali topiladi. Shuning uchun yuqoridagi munosabatlar Bellmanning rekkurent munosabatlari deb ataladi.
Dinamik dasturlash usuli
Dinamik dasturlashning optimallik tamoyiliga asosan har bir qadamda topilgan yechim faqat shu qadam nuqtai nazaridan emas, balki so„nggi, pirovard maqsad nuqtai nazaridan optimal bo„lishi kerak ekanligini ko„rgan edik. Dinamik dasturlash masalalarini yechish usullari uchun ana shu tamoyil asos qilib olingan.
Faraz qilaylik, birinchi qadamda boshqarish U1
bo„lsin. Buning ta‟sirida tizim
X 0 holatdan
X 1 holatga o„tadi va natijada
Z1 X 0 ,U1
yutuq keltiradi. Ikkinchi
qadamda U 2
boshqarish tizimni
X 1 holatdan
X 2 holatga o„tkazadi va natijada
Z2 X1 ,U 2
foyda keltiradi va hokazo. K qadamda Uk
boshqarish tizimni
X k 1
holatdan
X k holatga ko„chiradi va natijada
Zk Xk 1 ,Uk yutuq keltiradi.
Demak, tizimni
X 0 holatdan
XT holatga ko„chirish uchun shunday
U (U1,U 2 ,...,UT )
boshqarishni (strategiyani) tanlash kerakki, undagi
Z X ,U yutuq
T 0
(zarar) maksimal (minimal) bo„lsin, ya‟ni
fT ( X 0 ) Z (X 0 ,U ) max (min).
Agar
Z X ,U ni
T 0
ZT (X 0 ,U ) Z1 (X 0 ,U1 ) Z2 (X1 ,U2 ) ... ZT (XT 1 ,UT )
yig„indi ko„rinishida ifodalasak, dinamik dasturlash masalasi
fT ( X 0 ) Z( X 0 , U ) Z1 ( X 0 , U1 ) Z2 ( X1 , U2 ) ... ZT ( XT 1 , UT )
funksiyaga maksimal (minimal) qiymat beruvchi
U ( U1, U 2 ,..., UT )
boshqarishni topishga keltiriladi.
Bunday boshqarishni topish jarayoni esa quyidagicha amalga oshiriladi. Eng
avval jarayonni teskari yo„nalishda ( XT 1
dan
X 0 ga tomon) tahlil qilamiz. Buning
uchun oxirgi T bosqich uchun funksional tenglama
ko„rinishda bo„ladi.
f1 ( XT 1 ) max(min) ZT XT 1 ,UT
UT 1GT
Oxirgi T bosqichning boshida jarayon
XT 1,1 , XT 1,2 ,..., XT 1,k
holatlarda bo„lishi
mumkin deb faraz qilamiz. Soddalik uchun faqat butun sonli
ko„ramiz.
XT 1,k XT 1
holatlarni
Bu holatlarning har biri uchun T bosqichdagi shartli optimal UT ,1 ,UT ,2 ,...,UT ,k
yechimlar va ularga mos keluvchi
ZT ,1 , ZT ,2 ,..., ZT ,k
daromad (xarajat) lar topiladi.
UT ,1 ,UT ,2 ,...,UT ,k
yechimlar orasida
f1 XT 1
funksiyaga maksimum (minimum) qiymat
beruvchi va optimal U *
strategiyaning tarkibiga kiruvchi
* yechim topiladi. Lekin
T
U
bu yechim masalani yechish jarayonining ikkinchi bosqichida, ya‟ni jarayon to„g„ri
yo„nalishda ( X 0
dan
XT 1 ga tomon) tekshirilganda topiladi.
Shunday qilib, oxirgi qadam optimallashtiriladi, ya‟ni bu qadamning boshida tizim qanday bo„lishidan qat‟iy nazar qabul qilinadigan yechim aniqlanadi.
So„ngra T 1 bosqichga o„tiladi. Bu qadam uchun funksional tenglama
f2 ( XT 2 ) max(min) ZT 1 XT 2 , UT 1 f1( XT 1)
UT 2 GT 1, T
tuziladi.
Bu bosqichda ham, xuddi yuqoridagidek har bir mumkin bo„lgan
XT 2,k XT 2
holat uchun mumkin bo„lgan
UT 1,k GT 1
yechim va unga mos keluvchi
ZT 1,k
daromad
(xarajat) topiladi. So„ngra
ZT 1,k f1 yig„indilarni o„zaro solishtirib, har bir
XT 2,k
holatga
mos keluvchi yig„indi va unga mos keluvchi shartli optimal yechim UT 1,k topiladi. Bu
yechimlar orasida
f2 XT 2
funksiyaga ekstremal qiymat beruvchi va optimal U *
T 1
strategiyaning tarkibiga kiruvchi U * topiladi.
Shunday yo„l bilan davom etib, jarayonning birinchi bosqichiga o„tiladi. Bu qadamda jarayon faqat bitta aniq holatda bo„lishi mumkin. Shuning uchun bu bosqichda oldingi bosqichlarda topilgan barcha shartli optimal yechimlarni nazarga
oluvchi va X 0 holatga mos keluvchi optimal yechim topiladi.
Shunday qilib, hamma mumkin bo„lgan holatlar uchun ketma-ket
f1 , f2 ,..., fT 1 , fT funksiyalarning qiymatlari va turli bosqich va holatlarga tegishli
yechimlar, shu jumladan U * optimal strategiyaning tarkibiga kiruvchi optimal
U * ,U * ,...,U * yechimlar topiladi. Bu yechimlar asosida tuzilgan U * strategiya f ( X )
T T 1 1 T 0
funksiyaga ekstremal qiymat beradi. Optimal
U * U *,U *,...,U * ,U *
1 2 T 1 T
strategiyani aniqlash uchun jarayonni to„g„ri yo„nalishda ( X 0
dan
XT 1
ga tomon)
yana bir marta tekshirib chiqish kerak. Bunda eng avval aniq boshlang„ich X 0
holatdan va topilgan
fT ( X 0 )
funksiyaning qiymatidan foydalanib,
1
U
U
So„ngra
fT 1
( X1 )
funksiyaning qiymati orqali
T 1
1
2
U
oxirida U *
va f
T 1
( X1 )
orqali U *
topiladi.
T
Dinamik dasturlash masalasini yechish jarayonini quyidagi misolda yaqqol ko„rsatish mumkin.
Masala. Eng qisqa yo„lni tanlash masalasi.
Faraz qilaylik, A va B punktlarni o„zaro bog„lovchi temir yo„llar to„ri berilgan bo„lsin (5.2-rasm).
Do'stlaringiz bilan baham: |