В статье рассматривается нелинейная система обыкновенных дифференциальных уравнений специального вида. Так как число точек переключения оптимального управления для такой системы неизвестно, то исследуются свойства допустимых и удовлетворяющих принципу максимума траекторий движения управляемого объекта. Полученные результаты сформулированы в виде теоремы.
Ключевые слова: принцип максимума; гамильтониан; сопряженная система; оптимальное быстродействие; курсовой угол.
Пусть движение управляемого объекта удовлетворяет следующей системе обыкновенных дифференциальных уравнений
(1)
Данная система обычно может описывать движение самолета при боковом ветре, движение корабля, а так же различные задачи преследования [10,12]. В этом случае, движение управляемого объекта (преследователя) рассматривается в относительной системе координат [7, 8, 11], получаемой путем стандартных преобразований исходной системы. Требуется перевести исходный объект из заданной начальной точки в область , где –– конечный момент времени. Функционалом качества является конечное время, т. е. требуется решить задачу оптимального быстродействия. Управляющая вектор-функция удовлетворяет ограничениям и выбирается из класса кусочно-непрерывных функций Курсовой угол отсчитывается по часовой стрелке от положительного направления оси OY, до вектора скорости и удовлетворяет ограничению . Модуль скорости объекта , где . Последнее равенство означает, что управляемый объект может совершить полный разворот, если его текущая скорость равна начальной, например, при начале движения. Остальные параметры движения являются положительными постоянными, причем возмущения не равны нулю одновременно.
Таким образом, исходная математическая модель описывает физическую задачу захода самолета на взлетно-посадочную полосу при наличии бокового ветра на полетную палубу авианесущего корабля, сближение самолетов при дозаправке в воздухе, т. е. любую задачу «мягкой встречи» (стыковки) Следует отметить, что в несколько иной постановке задача оптимального быстродействия для подобной системы рассматривалось неоднократно. В работах [3, 4] была решена задача вывода объекта в начало координат с произвольным курсовым углом, нулевыми возмущениями и неограниченной скоростью управляемого объекта. В работе [7] для системы с нулевыми возмущениями решается задача разработки алгоритма построения информационного множества. Игровая постановка задачи (игра «шофер-убийца») была предложена и описана Р. Айзексом [1, 12]. Система, наиболее близкая к рассматриваемой в данной работе, решалась в [15]. Различные варианты данной игры, ее модификации, численные методы и алгоритмы ее решения рассматриваются в работах [2, 5, 6, 8, 9, 13, 14]. Отметим, что игра «шофер-убийца» часто рассматривается в качестве модельной задачи в учебных целях [10] и для проверки работы разработанных алгоритмов [5]. Принципиальное отличие рассматриваемой постановки от рассмотренных ранее, заключается в ограничении конечного значения курсового угла и в ограничении скорости объекта.
Итак, гамильтониан исходной системы имеет вид
(2)
а сопряженная система
(3)
Согласно принципу максимума [10], оптимальное управление имеет вид:
Проинтегрируем первые три уравнения системы (3):
(4)
Далее проинтегрируем первые два из уравнений (1) на интервале постоянства управлений :
(5)
Для упрощения дальнейших вычислений введем следующее обозначение:
(6)
Так как количество точек переключения управления на оптимальной траектории для задачи (1) неизвестно, то ниже рассмотрим некоторые свойства допустимых траекторий данной задачи, удовлетворяющих принципу максимума. Пусть момент времени является моментом переключения управлений и , т. е. Предположим, что момент времени является моментом переключения управления . Тогда, с учетом (4), (5), (6) получим, что
и
окончательно
Из условия постоянства гамильтониана (2) по времени [10] следует, что , а т. к. , то . Тогда с учетом того, что , имеем
и
Отсюда следует, что
Если первый сомножитель равен нулю, тогда , где k-целое, т. е. в этом случае момент является и моментом переключения управления . Если равен нулю второй сомножитель, то , k-целое.
Предположим, что — второй момент переключения управления . Тогда и . Рассмотрим последнее равенство подробнее:
и, с учетом равенства (4)
с учетом равенств (5)
и
окончательно
Отсюда следует, что
Первый сомножитель не может быть равен нулю, иначе нарушается ограничение, наложенное на угол При равенстве нулю второго сомножителя, получим, что , где — целое. Подставляя в последнее равенство значение , получим, что
т. е. угол отличается от угла на величину , в зависимости от знака управления , откуда следует, что момент времени является также и моментом переключения управления .
Пусть — момент переключения управления , предшествующий моменту переключения . Тогда , т. е. и
после раскрытия скобок
Отсюда следует, что
и
т. е.
откуда следует, что или , т. е. — также и момент переключения управления курсовым углом, или же Пусть имеет место второй случай. Предположим, что — момент переключения скорости, предшествующий моменту . Тогда
т. к. . Проведя необходимые преобразования, получим:
и
тогда
Полученное выражение равно нулю, тогда
Отсюда следует, что , т. е.
Таким образом, и в данном случае, момент времени является так же моментом переключения и управления . Проведя аналогичные рассуждения, приходим к выводу, что и все остальные точки переключения управления , вплоть до первого переключения, будут являться и моментами переключения управления . Аналогично и в другую сторону: каждый момент времени , где — последний момент переключения управления , является моментом переключения управления .Таким образом, справедлива следующая теорема:
Теорема. Пусть для управляемого объекта, движение которого описывается системой (1), существует допустимая и удовлетворяющая принципу максимуму траектория такая, что моменты времени являются моментами переключения управления . Тогда, если хотя бы один из моментов времени , является так же и точкой переключения управления , то и любой другой момент времени является моментом переключения управления .
В заключение отметим, что мы предполагали, что рассматриваемая траектория существует. Проверка условий существования и, тем более, ее оптимальности требует дальнейших исследований.
Литература:
1. Айзекс Р. Дифференциальные игры. М.: Мир, 1967. — 384 с.
2. Андреева Е. А., Цирулева В. М. Вариационное исчисление и методы опти-мизации. Тверь: Тверской гос. университет, 2004. 575 c.
3. Бердышев Ю. И. Синтез оптимального по быстродействию управления для одной нелинейной системы четвертого порядка // Прикладная математика и механика. 1975. Т. 39, Вып. 6. С. 985–994.
4. Бердышев Ю. И. Синтез оптимального по быстродействию управления движением материальной точки в среде с сопротивлением. Автореферат кандидатской диссертации, Свердловск 1978 (УНЦ АН СССР). — 18 с.
5. Двуреченский П. Е. Алгоритмы построения эпсилон-оптимальных стратегий в нелинейных дифференциальных играх на плоскости. Автореферат кандидатской диссертации, МФТИ (государственный университет), Долгопрудный 2013, 24 с.
6. Кулешов А. В. Некоторые способы численного решения дифференциальной игры «шофер-убийца». Известия Института математики и информатики УдГУ. 2012. Вып. 1 (39). С. 73.
7. Пацко В. С., Пятко С. Г., Кумков С. И., Федотов А. А.. Оценивание движения воздушного судна на основе информационных множеств при неполных замерах координат.: Научные доклады. Академия ГА. С.-Петербург, 1999; ИММ УрО РАН, Екатеринбург. 1999. — 70 с.
8. Пацко В. С., Турова В. Л.. Игра «шофер-убийца» и ее модификации.: Вестник Удмуртского университета. Вып. 2. Ижевск 2008.С. 105–110.
9. Пацко В. С., Турова В. Л. Игра шофер-убийца: история и современные исследования. Научные доклады / Рос. акад. наук, Урал. отд-ние, Ин-т математики и механики. УрО РАН, Екатеринбург. 2009. 43 с.
10. Петросян Л. А., Зенкевич Н. А., Шевкопляс Е. В. Теория Игр. Изд-во «БХВ-Петербург», 2012. — 424 с.
11. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Мате-матическая теория оптимальных процессов. — М.: Наука, 1969, — 384 с.
12. Isaacs R. Games of pursuit. Scientific report of the RAND Corporation. Santa Monica. 1951.
13. Patsko V. S., Turova V. L. Numerical study of the homicidal chaufeur diferential game with the reinforced pursuer // Game Theory and Applications. Vol. 12. N.Y.: Nova Science Publishers. 2007. P. 123152.
14. Patsko V. S., Turova V. L. Level sets of the value function in differential games with the homicidal chauffeur dynamics// Game Theory and Applications. Vol. N.Y.: Nova Science Publishers. 2007. P. 123–152.
15. Reeds J. A., Shepp L. A. Optimal paths for a car that goes both forwards and backwards// Pacific J. Math. 1990. Vol. 145, № 2. P. 367–393.