Бурцев Игорь Олегович

Иркутский национальный исследовательский технический университет, Россия

Позиционный принцип минимума в дискретных задачах оптимального управления

Дискретные процессы управления приобретают все большее значение в теории и практике оптимального управления. Это связано с тем, что многие задачи экономического планирования, технологии и организации производства, исследования операций, военного дела описываются разностными уравнениями, так как на практике чаще всего и информация о состоянии процесса, и управление процессом осуществляются в дискретные моменты времени, т.е. по шагам.

Для решения таких многошаговых задач возможны два подхода. Один из них – вариационный – подход основан на распространении идей и методов математического программирования на многошаговые задачи и смыкается с аппаратом принципа максимума Л.С.Понтрягина, развитого для решения задач оптимального непрерывного управления. Этот подход иногда называют «дискретный принцип максимума».

С изменением характера задачи меняется и ее проблематика. Если для одношаговой задачи основное значение имело нахождение оптимального решения, то для многошаговой задачи наряду с определением самой программы оптимального развития системы не меньшее значение имеет и ее практическая реализация, т.е. собственно задача управления.

Поскольку задачи дискретного оптимального управления фактически являются задачами математического программирования специальной структуры, то для них в общем случае не имеет места аналог принципа максимума Понтрягина – фундаментальное необходимое условие оптимальности в непрерывных задачах оптимального управления. Тем не менее, значительные усилия математиков были посвящены выделению классов задач дискретного оптимального управления, в которых принцип максимума справедлив, возможно в несколько ослабленной форме «квазимаксимума» [1; 2; 3].

Целью данного исследования является распространение на задачи дискретного оптимального управления так называемого позиционного принципа минимума, необходимого условия оптимальности для непрерывных задач оптимального управления, усиливающего принцип максимума Понтрягина.

Рассмотрим задачу оптимального управления ()

где  – последовательности , т.е. фазовая и управляющая траектории. Множества  компактны , функции  гладкие по  при фиксированных , целевая функция  гладкая.

Задача () рассматривается на множестве допустимых пар последовательностей . Через  обозначается допустимая пара последовательностей, исследуемая на оптимальность.

Предположим, что в задаче () выполнено условие выпуклости: при всех  если  и  то найдется такое  что  выполняется условие

Введем в рассмотрение функцию Понтрягина

и сопряженную систему

 – котраектория процесса .

Теорема 1. Если пара  оптимальна в задаче (), тогда функция Понтрягина достигает максимального значения на этом процессе, т.е.

где траектория  находится из фазовой системы, а котраектория  – из сопряженной.

Так как рассматривается задача на минимум, знак траектории сопряженной системы  изменится: . Для удобства будем пользоваться стандартным обозначением , имея в виду .

Введем следующие многозначные отображения на :

 

 
Рассмотрим дискретное включение

 задано

Любая его траектория  есть некоторая траектория исходной дискретной системы задачи . Действительно, т.к.  – траектория , то  существует вектор  такой, что . Поскольку , то последовательность  образует допустимый процесс исходной системы.

Отсюда следует, что траектории дискретного включения  можно сравнивать по функционалу  с исследуемой траекторией , причем в случае оптимальности  среди траекторий сравнения не должно быть “лучшей”. Это дает нам следующее необходимое условие.

Теорема 2. Если процесс  оптимален в задаче  , то для всех траекторий включения  выполняется неравенство

(Заметим, что  не обязана удовлетворять включению ).

Аналогичные результаты были получены в работе [4] для невыпуклых задач дискретного оптимального управления.

В практическом плане теорема 2 неудобна, так как не ясно как “перебрать” все траектории включения. Поэтому изложим конструктивную (но несколько ослабленную) версию необходимого условия. Введем ряд определений.

Определение. Любую однозначную функцию  назовем позиционным управлением (или кратко – стратегией).

Определение. Назовем селектором отображения  любое позиционное управление  со свойством  при . Пусть  – множество всех таких селекторов, которые назовем экстремальными.

Заметим, что для любого  естественным образом можно однозначно найти траекторию системы

(1)

 
После этого можно положить  и тем самым получить пару , удовлетворяющую исходной системе, т.е. допустимый процесс .

Пусть при некотором  – множество процессов сравнения, с управлениями, порожденными экстремальными селекторами. Тогда справедлива

Теорема 3. Если  - оптимальный процесс в задаче , то

т.е. при любом выборе селектора  для соответствующей ему траектории  должно выполняться неравенство

Отметим, что, вообще говоря, , т.е. управление оптимального процесса не обязано порождаться некоторым экстремальным селектором. Кроме того, отметим два обстоятельства:

1)                с помощью отображения  фактически определяется класс позиционных вариаций управления (или класс позиционных управлений сравнения с ); смысл теорем 3, 4 – в этом классе не должно быть управлений спуска по функционалу из ;

2)                теоремы 3, 4 имеют место независимо от справедливости ПМ в задаче , т.е. дают более универсальные необходимые условия оптимальности, чем ДПМ.

Определим более жесткое условие выпуклости для задачи :

Предположим, что в задаче  выполнены условия типа выпуклости (В1), (В2), или же (В2) и  вогнута. Тогда существует селектор  экстремального отображения , порождающий траекторию  в качестве решения системы (1) при . Действительно, положим

Тогда  в силу условия минимума из ПМ, а . Отсюда следует, во-первых, что  – траектория дискретного включения , и, во-вторых, . Это позволяет переформулировать теоремы 2, 3 в вариационной форме, т.е. через вспомогательные экстремальные задачи дискретного управления, в которых траектория  уже допустима.

Теорема 4. Пусть в задаче  выполнены условия выпуклости (В1), (В2). Тогда, если  - оптимальный процесс, то выполняются условия:

а) траектория  оптимальна в задаче минимизации функционала  на траекториях дискретного включения ;

 
б) процесс  оптимален в присоединенной задаче

Конструктивность данных предположений состоит в том, что, если допустимый процесс   оптимален в присоединенной задаче , то мы автоматически получаем улучшение процесса в задаче .

В результате проведенной работы получено нелокальное необходимое условие оптимальности для дискретных задач оптимального управления, основанное на использовании экстремальных позиционных управлений – эти управления не должны улучшать значение функционала по сравнению с исследуемым оптимальным процессом.

 Литература:

1.       Пропой А. И. Элементы теории оптимальных дискретных процессов.– М.: Наука. Гл. ред. физ.-мат. лит., 1973.

2.       Иоффе А. Д., Тихомиров В. М. Теория Экстремальных задач.– М.: Наука, 1974.

3.       Мордухович Б. Ш. Методы аппроксимаций в задачах оптимизации и управления.– М.: Наука. Гл. ред. физ.-мат. лит., 1988. – 360 с.

4.       Сорокин С. П. Необходимое условие оптимальности с позиционными управлениями спуска по функционалу для дискретных задач динамической оптимизации. // Институт динамики систем и теории управления имени В.М. Матросова СО РАН.