УДК 518.9
П-стратегия при движении игроков со
ускорением
ЛЕКЦИЯ - 1
Аннотация
В настоящей работе исследуется задача преследования-убегания, когда
игроки с течением времени осуществляют свои движения при помощи векторов
ускорения. При этом задача преследования решается посредством стратегии
параллельного преследования, а в задаче убегания устанавливаются нижние
оценки для расстояния между преследователем и убегающим.
Ключевые слова:
дифференциальная игра, задача преследования, задача
убегания,
Π
- стратегия, поимка, уклонения.
1. Постановка задачи
Пусть в пространстве
R
n
управляемый объект
X
, называемый преследователем,
гонится за другим объектом
Y
, называемый убегающим. Обозначим через
x
местоположение преследователя, а через
y
местоположение убегающего в
R
n
. В
настоящей работе рассматривается задача преследования-убегания, когда объекты
двигаются в соответствии с уравнениями
¨
x
=
u,
x
(0) =
x
10
,
˙
x
(0) =
x
11
,
(1)
¨
y
=
v,
y
(0) =
y
10
,
˙
y
(0) =
y
11
,
(2)
где
x, y, u, v
∈
R
n
, n
≥
1;
x
10
, y
10
– начальные положения, а
x
11
, y
11
– начальные
скорости объектов; предполагается
x
10
6
=
y
10
;
u
,
v
– векторы ускорения, которые
служат параметрами управления. При этом временное изменение вектора
u
должно
оказаться измеримой функцией
u
(
·
) : [0
,
∞
)
→
R
n
, для которого налагается
геометрическое ограничение вида
|
u
(
t
)
| ≤
α
почти для всех
t
≥
0
,
(3)
где
α
– неотрицательное параметрическое число, означающое максимальную
величину ускорения преследователя.
Аналогично, временное изменение вектора
v
должно быть измеримой функцией
v
(
·
) : [0
,
∞
)
→
R
n
,
для которого налагается так же геометрическое ограничение вида
|
v
(
t
)
| ≤
β
почти для всех
t
≥
0
,
(4)
где
β
– неотрицательное параметрическое число, которое означает максимальную
величину ускорения убегающего.
Измеримую функцию
u
(
·
)
удовлетворяющую условию (3) назовём допустимым
управлением преследователя класса
U
, а измеримую функцию
v
(
·
)
удовлетворяющую
условию (4) допустимым управлением убегающего класса
V
.
1
В силу уравнений (1)-(2) каждые тройки
(
x
10
, x
11
, u
(
·
))
, где
u
(
·
)
∈
U
, и
(
y
10
, y
11
, v
(
·
))
, где
v
(
·
)
∈
V
, порождают траектории движения игроков
X
и
Y
x
(
t
) =
x
10
+
x
11
t
+
t
Z
0
(
t
−
s
)
u
(
s
)
ds,
(5)
y
(
t
) =
y
10
+
y
11
t
+
t
Z
0
(
t
−
s
)
v
(
s
)
ds
(6)
соответственно.
Целью преследователя
X
является осуществление поимки, т.е. равенства
x
(
t
) =
y
(
t
)
(7)
за возможно короткое время, убегающий
Y
стремится уклониться от встречи, т.е.
осуществить неравенство
x
(
t
)
6
=
y
(
t
)
для всех
t
≥
0
,
а если это невозможно, то как
можно дольше отодвинуть момент встречи (7). Разумеется, такая постановка задачи
является предварительным.
В соответствии с подходами, положенными в основу теории дифференциальных
игр
Л.С.Понтрягиным
[
]
и
Н.Н.Красовским
[
],
дифференциальная
игра
рассматривается либо с точки зрения преследователя, либо с точки зрения
убегающего как задача управления. В соответствии с этим игра сводится или к задаче
преследования (сближения), или же к задаче убегания (уклонения).
К изучению дифференциальных игр с простыми движениями игроков и с
различными ограничениями на управления посвящены достаточно много работ [
]. При этом для решения игр преследования построены стратегии разнотипного
характера [ ]. Среди них в силу наиболее оптимальности и применяемости особое
место имеет стратегия параллельного сближения (П-стратегия [ ]). П-стратегия
применяется для решения таких известных задач, как "Игра с линией жизни"[
], "Простое преследование несколькими объектами"[ ] и в др. Далее, применая
прямые методы преследования Л.С.Понтрягина [ ], задача Б.Н.Пшеничного [ ]
обобщается в работах [ ] для более общих уравнений движений игроков или объектов
с противоположными целями. Однако в этих обобщениях сближения игроков не
всегда осуществляются наилучшим образом. Поэтому в настоящей работе для
решения задачи преследования при инерционных движениях объектов предлагается
применение П-стратегии специальным образом, т.е. сначала для параллельного
сближения скоростей и затем для сближения объектов.
В дальнейшем, при решении задачи преследования с помощью стратегии
параллельного сближения (скоростей, самих объектов) для сокращения записи
водятся обозначения:
z
=
x
−
y,
z
10
=
x
10
−
y
10
,
z
11
=
x
11
−
y
11
. Тогда система
(1)-(2) приводится к следующему редуцированному виду дифференциальной игры
¨
z
=
u
−
v,
z
(0) =
z
10
,
˙
z
(0) =
z
11
,
(8)
где здесь
z
10
– разность начальных состояний, а
z
11
– разность начальных скоростей
игроков. В силу этого при выборе допустимых управлений
u
(
·
)
∈
U
и
v
(
·
)
∈
V
2
решение уравнения (8) имеет вид
z
(
t
) =
z
10
+
z
11
t
+
t
Z
0
(
t
−
s
)(
u
(
s
)
−
v
(
s
))
ds,
(9)
Теперь при введенных новых обозначениях целью преследователя является
осуществление равенства
z
(
t
) = 0
из заданных начальных состояний
z
10
и
z
11
за
возможно кратчайшее время
t
, а целью убегающего достижения неравенства
z
(
t
)
6
= 0
при всех
t
≥
0
.
Решение задачи преследования конструируем исходя из заданных начальных
состояний
z
10
и
z
11
. Отметим, что здесь возможны только два случая:
С л у ч а й 1.
Векторы
z
10
и
z
11
коллениарны, т.е. существует такое конечное
число
k
, что выполняется равенство
z
11
=
kz
10
.
С л у ч а й 2.
Векторы
z
10
и
z
11
неколлениарны т.е. линейно независимы.
2. Решение задачи преследования в случае 1
Для
достижения
преследователем
своего
цели
недостаточно
ему
одних
программных стратегий, т.е. допустимых управлений зависящих только от времени
t
. Поэтому, аналогично работам [ ], в рассматриваемом случае, стратегию
преследователя также можно определить в зависимости только от текущего
состояния функции ускорения
v
(
t
)
, t
≥
0
и от заданных постоянных
z
10
,
α
.
О п р е д е л е н и е 1.
Пусть
α
≥
β
и
z
11
=
kz
10
. Тогда в игре (1)-(4) функцию
u
(
z
10
, v
) =
v
−
λ
(
z
10
, v
)
ξ
10
,
(10)
назовем
Π
-стратегией преследователя
, где
λ
(
z
10
, v
) =
h
v, ξ
10
i
+
p
h
v, ξ
10
i
2
+
α
2
− |
v
|
2
, ξ
10
=
z
10
/
|
z
10
|
;
(11)
а
u
(
z
10
, v
(
t
))
, t
≥
0
–
ее реализацией
для каждого
v
(
·
)
∈
V
.
Нетрудно проверить, что при
α
≥
β
функции (10) и (11) определены и
непрерывны для всех
v,
|
v
| ≤
β
и при этом для функции (10) справедливо равенство
|
u
(
z
10
, v
)
|
=
α.
О п р е д е л е н и е 2.
Π
-стратегия называется
выигрышной для преследователя
в промежутке времени
[0
, T
]
, если для любого
v
(
·
)
∈
V
: а) существует такой момент
времени
t
∗
∈
[0
, T
]
,
что выполнено равенство
z
(
t
∗
) = 0
; б)
u
(
v
(
·
))
∈
U
в промежутке
времени
[0
, t
∗
]
. При этом число
T
принято называть
гарантированным временем
преследования
или
поимки
в случае 1.
Т е о р е м а 1.
Пусть в игре (1)-(4) при случае 1, выполнено хотя бы одно из
условий: а)
α > β
и
k
– произвольное число; или б)
α
=
β
и
k <
0
. Тогда
Π
-стратегия
является выигрышной в промежутке времени
[0
, T
1
]
, где
T
1
=
(
|
z
0
|
k
+
p
|
z
0
|
2
k
2
+ 2
|
z
0
|
(
α
−
β
)
/
(
α
−
β
)
,
если
α > β,
−
1
/k ,
если
α
=
β
и
k <
0
.
3
Доказательство.
Пусть убегающий выбирает произвольное управление
v
(
·
)
∈
V
,
а преследователь реализует
Π
-стратегию (10), то в силу (9) имеем
z
(
t
) =
z
10
+
z
11
t
−
t
Z
0
(
t
−
s
)
λ
(
z
10
, v
(
s
))
ξ
10
ds.
Отсюда и из условия
z
11
=
kz
10
находим
z
(
t
) =
z
10
Λ(
z
10
, t, v
(
·
))
,
(12)
где
Λ(
z
10
, t, v
(
·
)) = 1 +
kt
−
1
|
z
10
|
t
R
0
(
t
−
s
)
λ
(
z
10
, v
(
s
))
ds.
Изучим характер
убывания скалярной части функции сближения (12), т.е.
Λ(
z
10
, t, v
(
·
))
по
t
. В силу
определения функции
λ
(
z
10
, v
)
(см.(10)) она является определенной, непрерывной и
положительной для каждого
v,
|
v
| ≤
β
при
α
≥
β
. Тогда по лемме о минимуме в
элементарной задаче оптимального управления ([4], стр.360) получаем
Λ(
z
10
, t, v
(
·
))
≤
1 +
kt
−
1
|
z
10
|
min
v
(
·
)
∈
V
t
Z
0
(
t
−
s
)
λ
(
z
10
, v
(
s
))
ds
≤
1 +
kt
−
t
2
2
|
z
10
|
min
|
v
|≤
β
λ
(
z
10
, v
)
.
Поскольку,
min
|
v
|≤
β
λ
(
z
10
, v
) =
α
−
β
, то из последнего неравенства находим
Λ(
z
10
, t, v
(
·
))
≤
Λ(
z
10
, t
)
,
(13)
где
Λ(
z
10
, t
) = 1 +
kt
−
t
2
2
|
z
10
|
(
α
−
β
)
.
Функция
Λ(
t
)
−
монотонно убывает по
t
и
обращается в нуль при
t
=
T
1
.
Следовательно , существует такое
t
∗
,
что
Λ(
t
∗
, v
(
·
)) = 0
и это (см. (12)) влечёт
z
(
t
∗
) = 0
,
при этом
t
∗
≤
T
1
,
что завершает доказательство
теоремы 1.
2. Вспомогательные задачи при случае 2
Пусть теперь начальные ненулевые векторы
z
10
и
z
11
неколлениарны и в
дальнейшем всюду будем считать, что
α > β
. Для этих случаев сначала решаем
следующие вспомогательные задачи.
Задача 1.
При произвольном управлении
v
(
·
)
∈
V
убегающего
Y
для
преследователя
X
построить стратегию при помощи которой за некоторое конечное
время
t
∗
было возможно осуществления равенства скоростей, т.е.
˙
x
(
t
∗
) = ˙
y
(
t
∗
)
.
(14)
Задача 2.
В пространстве
R
n
при произвольном управлении убегающего
v
(
·
)
∈
V
,
найти множество точек достижений:
а)
˙
y
(
t
)
– траектории скорости убегающего;
б)
y
(
t
)
– траектории движения убегающего,
при каждом
t
∈
[0
, t
∗
]
.
4
2.1. Решение задачи 1.
Для решении задачи 1 дифференциальная игра второго
порядка (1)-(2) сводится к дифференциальной игре первого порядка. Для этого
выводятся новые переменные
x
1
= ˙
x, y
1
= ˙
y
. Тогда из (1)-(2) имеем уравнения
для изменения скоростей игоков
X
и
Y
˙
x
1
=
u, x
1
(0) =
x
11
,
(15)
˙
y
1
=
v, y
1
(0) =
y
11
,
(16)
соответственно, где
u, v
– скорости изменения векторов
x
1
, y
1
, в зависимости от
времени
t
. Ясно, что
x
11
6
=
y
11
(иначе при
z
10
6
= 0
и
k
= 0
мы возвращаемся к случаю
1), где
x
11
, y
11
– начальные состояния векторов
x
1
, y
1
.
Таким образом мы свели задачу 1 к известной игре простого преследования
с геометрическими ограничениями (3) и (4), которая достаточно полно была
исследована, например, в работах [ ]. Отметим, что в этих работах для решения
задачи преследования применяется стратегия аналогичное к (10), которая позволяет
наилучщое параллельное сближения икроков.
О п р е д е л е н и е 3.
Для задачи 1 функцию
u
1
(
z
11
, v
) =
v
−
λ
1
(
z
11
, v
)
ξ
11
,
(17)
назовем
Π
1
-стратегией преследователя
, где
λ
1
(
z
11
, v
) =
h
v, ξ
11
i
+
p
h
v, ξ
11
i
2
+
α
2
− |
v
|
2
, ξ
11
=
z
11
/
|
z
11
|
, z
11
=
x
11
−
y
11
;
(18)
а
u
1
(
z
11
, v
(
t
))
, t
≥
0
- ее
реализацией
для каждого
v
(
·
)
∈
V
.
Т е о р е м а 2.
Если преследователь применяет
Π
1
-стратегию (17), то
при произвольном управлении
v
(
·
)
∈
V
убегающего
Y
возможно осуществления
равенства (14) за некоторое время
t
∗
∈
(0
, T
∗
]
, где
T
∗
=
|
z
11
|
α
−
β
.
(19)
Доказательство .
Пусть убегающий выбирает произвольное управление
v
(
·
)
∈
V
,
а преследователь реализует
Π
1
-стратегию (17). Тогда вводя обозначение
z
1
=
x
1
−
y
1
,
из (15)-(16) и (17) находим задачу Коши вида
˙
z
1
=
−
λ
1
(
z
11
, v
(
t
))
ξ
11
, z
1
(0) =
z
11
.
(20)
Отсюда получаем функцию сближения скоростей игроков
z
1
(
t
) =
z
11
Λ
1
(
z
11
, t, v
(
·
))
,
(21)
где
Λ
1
(
z
11
, t, v
(
·
)) = 1
−
1
|
z
11
|
t
R
0
λ
1
(
z
11
, v
(
s
))
ds.
Аналогично неравенству (13), из
доказательства теоремы 1, находится оценка вида
Λ
1
(
z
11
, t, v
(
·
))
≤
Λ
1
(
z
11
, t
)
,
5
где здесь
Λ
1
(
z
11
, t
) = 1
−
t
|
z
11
|
(
α
−
β
)
.
Поскольку
α > β,
то функция
Λ
1
(
z
11
, t
)
обращается в нуль при
T
∗
=
|
z
11
|
α
−
β
|
и следовательно, существует такое
t
∗
,
что
Λ
1
(
z
11
, t
∗
, v
(
·
)) = 0
и это влечёт
x
1
(
t
∗
) =
y
1
(
t
∗
)
,
при этом
t
∗
≤
T
∗
,
что завершает
доказательство теоремы 2 и решение задачи А.
2.2. Решение задачи 2.
В работах [ ] для игры простого преследования при
α > β
в пространстве
R
n
при реализации преследователем стратегии параллельного
сближения (
Π
-стратегии) типа (17) выявлено множество достижимости игроков,
граница которого представляет замкнутый шар, ограниченный сферой Апполония.
Аналогично, для состояний
x
1
, y
1
системы игры (15)-(16) можно определить
множество точек "встреч"скоростей в виде
W
∗
(
x
1
, y
1
) =
{
w
:
β
|
w
−
x
1
| ≥
α
|
w
−
y
1
|}
,
(21)
что представляет замкнутый шар с центром в точке
c
∗
(
x
1
, y
1
) = (
α
2
y
1
−
β
2
x
1
)
/
(
α
2
−
β
2
)
,
и радиусом
R
∗
(
x
1
, y
1
) =
αβ
|
x
1
−
y
1
|
/
|
α
2
−
β
2
|
.
Пусть пары
(
y
11
, v
(
·
)
) и
(
x
11
,
u
1
(
z
11
, v
(
·
))
, где
v
(
·
)
∈
V
порождают траектории
изменений скоростей
y
1
(
t
) =
y
11
+
t
Z
0
v
(
s
)
ds,
x
1
(
t
) =
x
11
+
t
Z
0
u
1
(
z
11
, v
(
s
))
ds,
(22)
соответственно. Из вида (21) для каждой пары
(
x
1
(
t
)
, y
1
(
t
))
образуем множество
W
∗
(
t
) =
{
w
:
β
|
w
−
x
1
(
t
)
| ≥
α
|
w
−
y
1
(
t
)
|}
,
(23)
где
W
∗
(
t
) =
W
∗
(
x
1
(
t
)
, y
1
(
t
))
, t
≥
0
.
Для дальнейшего развития решения задачи преследования в рассматриваемом
случае, ниже приводятся важные свойства для множества достижимости
W
∗
(
t
)
при
t
∈
[0
, t
∗
]
, где
t
∗
– время выполнения равенства (14).
Т е о р е м а 3
([ ]). Если
α > β
, то в игре (15)-(16) справедлива формула
W
∗
(
t
) =
x
1
(
t
) + Λ
1
(
z
11
, t, v
(
·
))[
W
∗
(0)
−
x
11
]
(24)
при
t
∈
[0
, t
∗
]
и
W
∗
(0) =
{
w
:
β
|
w
−
x
11
| ≥
α
|
w
−
y
11
|}
.
(25)
Т е о р е м а 4
([ ]). Множество
W
∗
(
t
)
является монотонно убывающим
относительно включения, т.е. если
t
1
≤
t
2
,
то
W
∗
(
t
2
)
⊂
W
∗
(
t
1
)
,
где
t
1
, t
2
∈
[0
, t
∗
]
.
Из вида (25) нетрудно вычислить, что
W
∗
(0) =
x
11
−
c
(
z
11
) +
R
(
z
11
)
S,
(26)
6
где
c
(
z
11
) =
α
2
z
11
α
2
−
β
2
,
R
(
z
11
) =
αβ
|
z
11
|
α
2
−
β
2
и
S
– единичный шар с центром в нуле пространства
R
n
. Тогда из выше предложенных обозначений
˙
x
=
x
1
,
˙
y
=
y
1
и из теорем 3 и 4
получаем
˙
y
(
t
)
∈
˙
x
(
t
) + Λ
1
(
z
11
, t, v
(
·
))(
−
c
(
z
11
) +
R
(
z
11
)
S
)
⊂
W
∗
(0)
,
(27)
для каждого
t
∈
[0
, t
∗
]
. Поскольку, множество
W
∗
(0)
– замкнутый шар с центром в
точке
x
11
−
c
(
z
11
)
и радиусом
R
(
z
11
)
, то интегрируя (27) с обоих сторон в промжутке
[0
, t
]
имеем включение вида
y
(
t
)
∈
y
10
+
tW
∗
(0)
,
(28)
которое выполняется при
t
∈
[0
, t
∗
]
. Последное следует из уравнения (16) и свойств
интегрирования выпуклых замкнутых многозначных отоброжений (см.[ ]).
Л е м м а 1.
При произвольном управлении
u
(
·
)
∈
U
преследователя
X
, функция
скорости
˙
y
(
t
)
убегающего
Y
может попасть в любую точку множества
W
∗
(0)
и до
момента достижения
t
∗
этой точки множества выпольняется неравенство
˙
x
(
t
)
6
= ˙
y
(
t
)
,
(29)
при
t
∈
[0
, t
∗
]
.
Доказательство следует из работы [22].
˙
z
(
t
)
∈
Λ
1
(
z
11
, t, v
(
·
))[
c
(
z
11
) +
R
(
z
11
)
S
]
.
Поскольку, правая часть последнего есть замкнутая, непрерывная по
t
многозначная
функция, то в силу свойств интегрирования таких функций (см. ) имеем
z
(
t
)
∈
z
0
+
t
Z
0
Λ
1
(
z
11
, s, v
(
s
))
ds
[
c
(
z
11
) +
R
(
z
11
)
S
]
.
В силу теорем 3 и 4 получаем следующий ответ к решению задачи 2.
Т е о р е м а 5.
Если в игре (15)-(16) при произвольном управлении
убегающего
v
(
·
)
∈
V
преследователь реализует
Π
1
-стратегию (17), то множество
точек достижений:
а) для
˙
y
(
t
)
есть множество
W
∗
(0)
, т.е. выполняется включение
˙
y
(
t
)
∈
W
∗
(0)
в
промежутке времени
[0
, t
∗
]
;
б) для
y
(
t
)
есть множество
y
10
+
tW
∗
(0)
т.е. выполняется включение
y
(
t
)
∈
y
10
+
tW
∗
(0)
в промежутке
[0
, t
∗
]
.
3. Решение задачи преследования в случае 2
Теперь
начиная
с
момента
времени
t
∗
нами
будет
рассматриватся
дифференциальная игра
¨
x
=
u,
x
(
t
∗
) =
x
∗
,
˙
x
(
t
∗
) =
x
∗∗
,
(26)
¨
y
=
v,
y
(
t
∗
) =
y
∗
,
˙
y
(
t
∗
) =
y
∗∗
,
(27)
где
x
∗
, y
∗
– положения игроков в момент времени
t
∗
, предполагается, что
x
∗
6
=
y
∗
и
x
∗∗
, y
∗∗
– положения скоростей игроков в момент времени
t
∗
. Однако, в системе
7
(26)-(27) выполняется равенство (14) или
x
∗
=
y
∗
, т.е. совпадают скорости в момент
времени
t
∗
и игра сводится к случаю 1, когда
k
= 0
.
О п р е д е л е н и е 4.
Пусть
α > β
и
t
≥
t
∗
. Тогда в игре (26)-(27) функцию
u
2
(
z
∗
, v
) =
v
−
λ
2
(
z
∗
, v
)
ξ
∗
,
(28)
назовем
Π
2
-стратегией преследователя
, где
λ
2
(
z
∗
, v
) =
h
v, ξ
∗
i
+
p
h
v, ξ
∗
i
2
+
α
2
− |
v
|
2
, ξ
∗
=
z
∗
/
|
z
∗
|
, z
∗
=
x
∗
−
y
∗
;
(29)
а
u
2
(
z
∗
, v
(
t
))
–
ее реализацией
для каждого
v
(
·
)
∈
V
при
t
≥
t
∗
.
Т е о р е м а 6.
Если
α > β
и
t
≥
t
∗
, то в игре (26)-(27)
Π
2
-стратегия (28) является
выигрышной в промежутке времени
[
t
∗
, T
∗
]
, где
T
∗
=
t
∗
+
s
2
|
z
∗
|
α
−
β
.
(30)
Доказательство
теоремы проводится аналогично к теореме 1. Только здесь
реализуется стратегия (29) и учитывается, что
k
= 0
.
Теперь для завершения решения задачи преследования в случае 1 остаётся только
оценить расстояние между игроками в момент
t
∗
, т.е.
|
z
∗
|
.
Пусть убегающий выбирает произвольное управление
v
(
·
)
∈
V
, а преследователь
реализует
Π
1
-стратегию (17) в промежутке времени
[0
, t
∗
]
, то в силу (9) имеем
z
(
t
) =
z
10
+
z
11
t
−
t
Z
0
(
t
−
s
)
λ
1
(
z
11
, v
(
s
))
ξ
11
ds.
Откуда находим, что
z
(
t
) =
z
10
+
z
11
Λ
2
(
z
11
, t, v
(
·
))
,
(31)
где
Λ
2
(
z
11
, t, v
(
·
)) =
t
−
1
|
z
11
|
t
R
0
(
t
−
s
)
λ
1
(
z
11
, v
(
s
))
ds
. Нетрудно проверить, что
d
Λ
2
(
z
11
, t, v
(
·
))
dt
= Λ
1
(
z
11
, t, v
(
·
))
(32)
(см. (21). Так как
Λ
1
(
z
11
, t, v
(
·
))
≥
0
при
t
∈
[0
, t
∗
]
, то из (32) следует, что
Λ
2
(
z
11
, t, v
(
·
))
– монотонно возрастающая функция по
t
∈
[0
, t
∗
]
. Тогда имеем, что
Λ
2
(
z
11
, t, v
(
·
))
≤
Λ
2
(
z
11
, t
∗
, v
(
·
))
≤
t
∗
−
1
|
z
11
|
t
∗
Z
0
(
α
−
β
)
sds
=
t
∗
−
α
−
β
2
|
z
11
|
(
t
∗
)
2
.
(33)
Поскольку, при
t
∗
∈
[0
, T
∗
]
(см. теоремы 2) получаем, что правая часть последнего в
(33) достигает своего максимального значения при
t
∗
=
|
z
11
|
α
−
β
. Следовательно, при
произвольном управлении убегающего
v
(
·
)
∈
V
промежуток изменения функции
Λ
2
(
z
11
, t, v
(
·
))
имеет оценку
8
0
≤
Λ
2
(
z
11
, t, v
(
·
))
≤
|
z
11
|
2(
α
−
β
)
.
(34)
Рассмотрим функцию
w
(
τ
) =
z
10
+
τ z
11
при
τ
∈
[0
, T
∗
]
, где
T
∗
=
|
z
11
|
2(
α
−
β
)
представляющий отрезок прямой линии с направляющим вектором
z
11
. Из вида этой
функции можно найти легко проверяемые следующие ее свойства.
С в о й с т в о 1.
Если начальные ненулевые векторы
z
10
и
z
11
неколлениарны, то
w
(
τ
)
6
= 0
при
τ
∈
[0
,
|
z
11
|
2(
α
−
β
)
]
.
С в о й с т в о 2.
Вектор функция
w
(
τ
)
−
z
10
в промежутке
[0
,
|
z
11
|
2(
α
−
β
)
]
остаётся
коллениарной к вектору
z
11
.
С в о й с т в о 3.
а) Если
h
z
10
, z
11
i ≥
0
, то при произвольном управлении убегающего
расстояние между игроками т.е. функция
|
z
(
t
)
|
возрастает и имеет оценку
|
z
10
| ≤ |
z
(
t
)
| ≤ |
z
10
+
|
z
11
|
2(
α
−
β
)
z
11
|
.
(35)
б) Если же
h
z
10
, z
11
i
<
0
, то для расстоянии между игроков в промежутке времени
[0
, t
∗
]
справедлива оценка
min
{|
z
10
|
,
|
z
10
−
h
z
10
, z
11
i
|
z
11
|
2
z
11
|} ≤ |
z
(
t
)
| ≤
max
{|
z
10
|
,
|
z
10
+
|
z
11
|
2(
α
−
β
)
z
11
|}
.
(36)
Доказательство следствий 1 - 3 непосредственно следует из (31), (32) и (34).
Список литературы
[1] Азамов А. О задаче качества для игр простого преследования с ограничением//
Сердика. Българско матем. спис. 1986. Т.12. С.38-43.
[2] Азамов А.А., Кучкаров А.Ш., Саматов Б.Т. О связи между разрешимостью
задач преследования, управляемости и устойчивости в целом в линейных
системах с разнотипными ограничениями// ПММ. 2007. Т. 71. вып.2. С.259-263.
[3] Айзекс Р. Дифференциальные игры. -М.: Мир, 1967.
[4] Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. -М.:
Наука, 1979.
[5] Григоренко
Н.Л.
Математические
методы
управления
несколькими
динамическими процессами. -М.: Изд-во МГУ, 1980.
[6] Ким Д.П.Методы поиска и преследования подвижных объектов. -М:Наука, 1989.
[7] Красовский Н.Н. Управление динамической системой. -М.: Наука, 1985.
[8] Петросян Л.А. Об одном семействе дифференциальных игр на выживание в
пространстве
R
n
.// Докл.АН СССР. 1965. Т.161. №1. С.52-54.
9
[9] Петросян Л.А. Дифференциальные игры преследования. Л.: Изд-во ЛГУ, 1977.
[10] Понтрягин Л.С. Избранные научные труды. -М.: Наука, 1988. ч. II.
[11] Пшеничный Б.Н. Простое преследование несколькими объектами.// Киберн.
1976. №3. С.145-146.
[12] Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. -Киев: Наукова
думка, 1992.
[13] Рихсиев Б.Б. Дифференциальные игры с простыми движениями. -Т.: Фан, 1989.
[14] Сатимов
Н.Ю.
Методы
решения
задачи
преследования
в
теории
дифференциальных игр. -Т.: Изд-во НУУз, 2003.
[15] Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. -М.:
Наука, 1981.
[16] Ушаков
В.Н.
Экстремальные
стратегии
в
дифференциальных
играх
с
интегральными ограничениями// ПММ. 1972. Т.36. вып.1. С.15-23.
[17] Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. -М.:
Наука, 1985.
[18] Формальский А.М. Управляемость и устойчивость систем с ограниченными
ресурсами. -М.: Наука, 1974.
[19] Черноусько Ф.Л., Меликян А.А. Игровые задачи управления и поиска. -М.:
Наука, 1978.
[20] Чикрий
А.А.,Белоусов
А.А.
О
линейных
дифференциальных
играх
с
интегральными
ограничениями//Труды
инс.мат.и
мех.
УрО
РАН.
2009.
Т.15.№4.С.290-301.
[21] Azamov A.A.,Samatov B.T.
Π
-strategy. Tashkent: National Univ. of Uzb., 2000.
[22] Azamov A.A.,Samatov B.T.The П-Strategy: Analogies and Applications// Contri-
butions to game theory and management.The Fourth International Conference Game
Theory and Management, June 28-30, 2010, St. Petersburg, Russia. 2010. V.IV. Р.33-
47.
[23] Chikrii A.A. Conflict-controlled processes. Boston-London-Dordrecht: Kluwer Aca-
dem. Publ., 1997.
[24] Samatov B.T. The Differential Game with "A Survival Zone"with Different Classes
of Admissiable Control Functions// Game Theory and Applications. Nova Science
Publ. 2008. V.13. P.143-150.
10
Саматов Бахром Таджиахматович, Наманганский государственный университет,
заведующий кафедрой "Прикладная математика и информационные технологии",
г.Наманган, Е-mail: samatov57@inbox.ru
11
Do'stlaringiz bilan baham: |