В работе предложено решать задачу об оптимальной стабилизации для функционально-дифференциального уравнения на основе функционалов Ляпунова со знакопостоянной производной. Для этого используется метод предельных уравнений.
Ключевые слова:оптимальная стабилизация, метод предельных уравнений, функционалов Ляпунова со знакопостоянной производной.
В середине 20-го столетия получила большое развитие теория оптимальных процессов в управляемых динамических системах, которая охватывает широкий круг проблем прикладного характера. Среди этих проблем важное техническое значение имеет поставленная А. М. Летовым [1] проблема аналитического конструирования регуляторов, относящаяся к задачам синтеза оптимальных систем с обратной связью. Развивая идеи А. М. Летова, Н. Н. Красовский разработал теорию оптимальной стабилизации управляемых движений [2]. Это — задача о построении регулирующих воздействий, которые обеспечивают устойчивое осуществление желаемого движения при наилучшем возможном качестве переходного процесса. Задача об оптимальной стабилизации тесно смыкается с общей задачей об устойчивости движения и является дальнейшим развитием проблемы устойчивости в приложении к теории управляемых систем. Методы исследования проблем оптимальной стабилизации переплетаются с классическими методами теории устойчивости Ляпунова. Подход Н. Н. Красовского с успехом применяется при решении оптимальных задач аналитического конструирования регуляторов для линейных систем. Однако при применении этой теории к нелинейным системам с целью получения синтезирующего управления в замкнутой форме возникают серьезные математические трудности, источником которых является отсутствие универсального способа построения функционала Ляпунова в каждом конкретном случае. Ведь, как известно, задача об оптимальной стабилизации движения управляемой системы на бесконечном интервале времени сводится к отысканию оптимального функционала Ляпунова и оптимальных управляющих воздействий, удовлетворяющих уравнению в частных производных типа Беллмана, которое необходимо решить с учетом дополнительного неравенства. В работе [3] предложено решать задачу об оптимальной стабилизации для обыкновенных дифференциальных уравнений на основе функций Ляпунова со знакопостоянной производной. В данной работе предлагается аналогичное решение для функционально-дифференциального уравнения.
Отметим, что структура функционала качества и выбор его коэффициентов не являются фиксированными и могут, вообще говоря, выбираться с определенным произволом, так как основная задача состоит не в минимизации конкретного функционала, а в построении стабилизирующего управления.
1. Постановка задачи об оптимальной стабилизации.
Пусть — линейное действительное пространство
- векторов
,
с нормой
,
> 0 — действительное число,
— банахово пространство непрерывных функций
c нормой
= sup
, для
, если
есть непрерывная функция, тогда для
функция
определяется равенством
, под
понимается правосторонняя производная.
Рассматривается управляемая система, движение которой описывается функционально-дифференциальным уравнением запаздывающего типа:
(1.1)
Здесь , где
есть управляющее воздействие,
— некоторый класс допустимых управлений;
есть непрерывное отображение, удовлетворяющее в
условиям существования, единственности и непрерывной зависимости решений (1.1) от начальных данных.
Пусть есть некоторое выбранное управляющее воздействие, под действием которого уравнения (1.1) принимают вид:
(1.2) .
Предполагаем, что правая часть системы (1.2) удовлетворяет предположениям 1.1–1.3 [4]. Тогда можно построить семейство предельных уравнений к (1.2):
(1.3) ,
где
Рассмотрим функционал:
(1.4)
Здесь есть некоторый непрерывный неотрицательный функционал переменных
, характеризующий качество переходного процесса. Выбор
в конкретной прикладной задаче осуществляется с учетом особенностей ее постановки, ограничения ресурсов управления, требования к оценке переходного процесса и возможностях формы или способа решения задачи.
Введем обозначения: есть движение, удовлетворяющее начальному условию
и порождаемое управляющим воздействием
, где
. Соответственно
порождается управляющим воздействием
.
Определение 1.1. Задача оптимальной стабилизации заключается в нахождении управляющего воздействия , обеспечивающего асимптотическую устойчивость невозмущенного движения
, и такого что по сравнению с любыми другими управляющими воздействиями
, решающими задачу о стабилизации движения
, для всех
выполняется неравенство:
при условиях .
Замечание 1.1. Область в определении 1.1 принята независимой от
.
2. Теорема об оптимальной стабилизации на основе знакоопределенного функционала Ляпунова
Обозначим через непрерывную, строго монотонно возрастающую функцию
.
Пусть :
есть непрерывный знакоопределенный функционал Ляпунова:
.
Определение 2.1. Пусть есть некоторая последовательность. Для каждого
и
определим множество
следующим образом: точка
, если существует подпоследовательность
, такая, что:
.
Введем следующее выражение:
(2.1)
В силу того, что зависит от
, то
также зависит от
. Выражение (2.1) совпадает и близко по смыслу с соответствующим выражением Беллмана в методе динамического программирования. Предположим, что
удовлетворяет вышеупомянутым предположениям 1.1, 1.3.
Теорема 2.1. Предположим, что в некоторой окрестности для системы
можно найти непрерывный функционал
и управляющее воздействие
, удовлетворяющие условиям:
1) движение системы из некоторой окрестности
равномерно ограничены областью
;
1. 2) ;
2) имеет место тождество:
3) существуют предельная пара с множеством
, такие, что для каждого значения
множество
не содержит решений уравнения
.
4) для всех справедливо неравенство:
;
5) для каждого движения , соответствующего управлению
,
,
, имеет место свойство:
,
.
Тогда управляющее воздействие решает задачу об оптимальной стабилизации невозмущенного движения (1.1), а именно: при
решение
асимптотически устойчиво равномерно по
с областью притяжения
и для каждого соответствующего движения
,
выполняется:
.
Доказательство. Согласно условию 3) теоремы:
.
Следовательно:
.
Из теоремы 3.1.2 [5], в силу условий 1), 2) и 4) теоремы, получаем, что решение уравнения (1.1) асимптотически устойчиво равномерно по
с областью притяжения
. Таким образом, для каждого движения системы (1.1) при
имеем:
,
,
. Из условия 4), кроме того, следует, что для каждого решения
,
выполняется:
.
Из условия 3) теоремы следует, что:
.
Интегрируем последнее тождество по от
до
, получаем:
.
Переходим к пределу при , получаем:
.
Пусть есть любое другое управляющее воздействие, для которого соответствующее движение
,
,
. В силу условия 5) теоремы следует неравенство:
.
Интегрируя последнее неравенство по от
до
и переходя к пределу при
из условия 6) теоремы, получаем:
.
Теорема доказана.
Теорема 2.1 дополняет некоторые результаты работы [6].
Замечание 2.1. Из доказательства теоремы 2.1 видно, что важным условием является условие 6) теоремы, так как из первых пяти условий теоремы, вообще говоря, не следует, что ,
когда,
,
. В следующей теореме [6] показано, что условие 6) можно заменить на условие существования бесконечно малого высшего предела у функционала
и при этом видоизменить условие 1.
Теорема 2.2. Предположим, что в некоторой окрестности для системы
можно найти непрерывный функционал
и управляющее воздействие
, удовлетворяющие условиям:
1) 1) ;
2) имеет место тождество:
3) каждая предельная пара такова, что множество
не содержит решений уравнения
, кроме нулевого;
4) для всех справедливо неравенство:
;
Тогда управляющее воздействие решает задачу об оптимальной стабилизации невозмущенного движения (1.1), а именно: при
решение
равномерно асимптотически устойчиво с областью притяжения
и для каждого соответствующего движения
,
выполняется:
.
Доказательство. Согласно условию 2) теоремы:
.
Следовательно:
.
Из теоремы 3.1.3 [5], в силу условий 1) — 3) теоремы, получаем, что решение уравнения (1.1) равномерно асимптотически устойчиво с областью притяжения
. Таким образом, для каждого движения системы (1.1) при
имеем:
,
,
.
Из условия 2) теоремы следует, что:
.
Интегрируем последнее тождество по от
до
, получаем:
.
Переходим к пределу при , учитывая, что функционал
допускает бесконечно малый высший предел, получаем:
.
Пусть есть любое другое управляющее воздействие, для которого соответствующее движение
,
,
. В силу условия 4) теоремы следует неравенство:
.
Интегрируя последнее неравенство по от
до
и переходя к пределу при
из условия 1) теоремы, получаем:
.
Теорема доказана.
Литература:
1. Летов А. М. Аналитическое конструирование регуляторов//АиТ. –1960. — Т.21. –№ 4–6.; 1961. — Т. 22. — № 4.; 1962. — Т.23. — № 11.
2. Красовский Н. Н. Проблемы стабилизации управляемых движений. В кн.:Малкин И. Г. «Теория устойчивости движения», Дополнение 4. –М.:Наука, 1966. — С. 475–515.
3. Ким Е. Б. О моделировании нелинейной управляемой системы //Социально-экономические и технические системы. — 2006. — № 3(19) — Режим доступа: http://kampi.ru/sets/.
4. Павликов С. В. О стабилизации систем, моделируемых функционально-дифференциальными уравнениями второго порядка // Социально-экономические и технические системы. — 2006. — 1(17). — Режим доступа: http://kampi.ru/sets/.
5. Павликов С. В. Метод функционалов Ляпунова в задачах устойчивости и стабилизации. Набережные Челны. — Изд-во Института управления. — 2010. — 394 с.
6. Павликов С. В., Савин И. А., Емельянов Д. В. К методу функционалов Ляпунова в задаче об оптимальной стабилизации управляемых систем // Вестник КГТУ им. А. Н. Туполева. — 2013. — № 4. — С. 170–176.