Реферат: "Принцип Максимума" Понтрягина

Постановка задачи оптимального управления.

Состояние объекта управления характеризуется <span Romantic",«serif»">n-мерной вектор функцией, например, функцией времени<img src="/cache/referats/8852/image001.gif" v:shapes="_x0000_i1025"><img src="/cache/referats/8852/image002.gif" v:shapes="_x0000_i1026">

<span Romantic",«serif»">Так, шестимерная вектор-функциявремени полностью определяет положение самолета как твердого тела в пространстве.Три координаты определяют положение центра масс, а три — вращение вокруг центрамасс.

<span Romantic",«serif»">От управляющего органа к объектууправления поступает вектор-функция <img src="/cache/referats/8852/image003.gif" v:shapes="_x0000_i1027">

<span Romantic",«serif»">И так, пусть движение управляемогообъекта описывается системой дифференциальных уравнений

<span Romantic",«serif»"><img src="/cache/referats/8852/image004.gif" v:shapes="_x0000_i1028">

<span Romantic",«serif»">где <img src="/cache/referats/8852/image005.gif" v:shapes="_x0000_i1029">
<img src="/cache/referats/8852/image006.gif" v:shapes="_x0000_i1030"><img src="/cache/referats/8852/image007.gif" v:shapes="_x0000_i1031">управленийили просто управление.

<span Romantic",«serif»">В уравнении (1.1) векторы <img src="/cache/referats/8852/image008.gif" v:shapes="_x0000_i1032">t, обозначающей время, причем<img src="/cache/referats/8852/image009.gif" v:shapes="_x0000_i1033"><img src="/cache/referats/8852/image010.gif" v:shapes="_x0000_i1034">
На управление обычно накладывается условие

<span Romantic",«serif»"><img src="/cache/referats/8852/image011.gif" v:shapes="_x0000_i1035"><img src="/cache/referats/8852/image009.gif" v:shapes="_x0000_i1036">

<span Romantic",«serif»">где U(t) — заданное множество в<img src="/cache/referats/8852/image012.gif" v:shapes="_x0000_i1037"><img src="/cache/referats/8852/image009.gif" v:shapes="_x0000_i1038">
Будем называть далее управлением кусочно-непрерывную на отрезке <img src="/cache/referats/8852/image010.gif" v:shapes="_x0000_i1039">Т. Управление и называется допустимым,если оно удовлетворяет ограничению (1.2).
Заметим, что ограничиться рассмотрением непрерывных управлений оказывается невозможным,так как с их помощью трудно моделировать моменты переключения управления такие,как, например, включение и отключение двигателей, отделение ступеней ракеты, поворотрулей и т. д.
Иногда рассматривают и более широкие классы допустимых управлений, например, классвсех ограниченных измеримых управлений, удовлетворяющих условию (1.2).
Покажем, как при произвольном начальном положении <img src="/cache/referats/8852/image013.gif" v:shapes="_x0000_i1040">

<span Romantic",«serif»"><img src="/cache/referats/8852/image014.gif" v:shapes="_x0000_i1041"><img src="/cache/referats/8852/image015.gif" v:shapes="_x0000_i1042">(1.3)

<span Romantic",«serif»">Посколькупри разрывных правых частях классическое понятие решения системы дифференциальныхуравнений неприменимо, поясним, что понимается в данном случае под решением задачи(1.3). Для этого поступим следующим образом.

<span Romantic",«serif»">Пустьфункция и имеет скачки в точках<img src="/cache/referats/8852/image016.gif" v:shapes="_x0000_i1043"><img src="/cache/referats/8852/image017.gif" v:shapes="_x0000_i1044">х, определенное на всем отрезке [to,<img src="/cache/referats/8852/image018.gif" v:shapes="_x0000_i1045"><img src="/cache/referats/8852/image019.gif" v:shapes="_x0000_i1046">

<span Romantic",«serif»"><img src="/cache/referats/8852/image020.gif" v:shapes="_x0000_i1047"><img src="/cache/referats/8852/image021.gif" v:shapes="_x0000_i1048">

<span Romantic",«serif»">Предполагая,что она имеет решение на отрезке [<img src="/cache/referats/8852/image022.gif" v:shapes="_x0000_i1049"><img src="/cache/referats/8852/image023.gif" v:shapes="_x0000_i1050">

<span Romantic",«serif»"><img src="/cache/referats/8852/image020.gif" v:shapes="_x0000_i1051"><img src="/cache/referats/8852/image023.gif" v:shapes="_x0000_i1052">

<span Romantic",«serif»">Еслифункцию х удалось определить указанным способом на всем отрезке [to. Т],то будем называть ее решением задачи (1.3) или фазовой траекторией (иногдапросто траекторией), соответствующей управлению и. Отметим, что x — непрерывнаяпо построению функция, удовлетворяющая на отрезке<img src="/cache/referats/8852/image010.gif" v:shapes="_x0000_i1053">

<span Romantic",«serif»"><img src="/cache/referats/8852/image024.gif" v:shapes="_x0000_i1054">

<span Romantic",«serif»">Привыполнении определенных условий на f решение задачи (1.3), соответствующееуправлению и, существует и единственно при произвольном начальном положении <img src="/cache/referats/8852/image025.gif" v:shapes="_x0000_i1055">

<span Romantic",«serif»">Помимоограничения на управление могут существовать ограничения и на фазовые координаты

<span Romantic",«serif»"><img src="/cache/referats/8852/image026.gif" v:shapes="_x0000_i1056"><img src="/cache/referats/8852/image009.gif" v:shapes="_x0000_i1057">

<span Romantic",«serif»">Ограниченияна концах траектории целесообразно рассматривать отдельно:

<span Romantic",«serif»"><img src="/cache/referats/8852/image027.gif" v:shapes="_x0000_i1058">

<span Romantic",«serif»">
здесь<img src="/cache/referats/8852/image028.gif" v:shapes="_x0000_i1059">
<img src="/cache/referats/8852/image029.gif" v:shapes="_x0000_i1060"> R, причем inf <img src="/cache/referats/8852/image030.gif" v:shapes="_x0000_i1061"><img src="/cache/referats/8852/image031.gif" v:shapes="_x0000_i1062">o<.T.

<span Romantic",«serif»">Такимобразом, начальный и конечный моменты времени не обязательно фиксированы. Случаюфиксированных to, Т соответствуют множества <img src="/cache/referats/8852/image030.gif" v:shapes="_x0000_i1063"><img src="/cache/referats/8852/image031.gif" v:shapes="_x0000_i1064">закрепленным временем.

<span Romantic",«serif»">ЕслиSo (to) = {<img src="/cache/referats/8852/image025.gif" v:shapes="_x0000_i1065"><img src="/cache/referats/8852/image032.gif" v:shapes="_x0000_i1066">закрепленным. Если же So (to) == R" при всех<img src="/cache/referats/8852/image032.gif" v:shapes="_x0000_i1067">свободным. Во всех остальных случаях левый конец называютподвижным. В аналогичных ситуациях говорят о закрепленном, свободном илиподвижном правом конце траектории.

<span Romantic",«serif»">Цельуправления в задаче оптимального управления состоит в минимизации некоторого функционалана множестве допустимых наборов.

<span Romantic",«serif»">Есликаждой функции y=f(x) определенного класса ставится в соответствии по некоторомузакону определенное числовое значение переменной I, то эту переменную называют функционаломот одной функциональной переменной I=I[y]=I[y(x)]=I[f(x)].

<span Romantic",«serif»">Наиболеечасто под задачами управления понимаются задачи, в которых роль функционала выполняетинтегральный функционал

<span Romantic",«serif»"><img src="/cache/referats/8852/image033.gif" v:shapes="_x0000_i1068">

<span Romantic",«serif»">Мыбудем рассматривать задачу с целевым функционалом

<span Romantic",«serif»"><img src="/cache/referats/8852/image034.gif" v:shapes="_x0000_i1069">

<span Romantic",«serif»">представляющимсобой сумму интегрального функционала <img src="/cache/referats/8852/image033.gif" v:shapes="_x0000_i1070">

<span Romantic",«serif»">итерминального

<span Romantic",«serif»">функционала Ф(х(Т), Т). Эта задачаназывается задачей Больца. Ее частными случаями являются задача с интегральнымфункционалом, называемая задачей Лагранжа, и задача с терминальным функционалом,называемая задачей Майера. Задача с интегральным функционалом при <img src="/cache/referats/8852/image035.gif" v:shapes="_x0000_i1071">оптимального быстродействия.

<span Romantic",«serif»">Набор(to, Т, х<img src="/cache/referats/8852/image037.jpg" v:shapes="_x0000_i1072">решением задачи оптимального управления, управлениеи — оптимальным управлением, а траектория х — оптимальной траекторией.Часто решением задачи оптимального управления называют пару (ц, х).

Принцип максимума Понтрягина.

Эффективным средством исследования задач оптимального управления являетсяпринцип максимума Понтрягина, представляющий собой необходимое условиеоптимальности в таких задачах.

Формулировка принципамаксимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаемзадачи, сформулированной выше

<img src="/cache/referats/8852/image038.gif" v:shapes="_x0000_i1073">
<img src="/cache/referats/8852/image014.gif" v:shapes="_x0000_i1074"><img src="/cache/referats/8852/image039.gif" v:shapes="_x0000_i1075">,
где<img src="/cache/referats/8852/image040.gif" v:shapes="_x0000_i1076"> (2.2)
<img src="/cache/referats/8852/image041.gif" v:shapes="_x0000_i1077">

При этом предполагается, что моменты to, Т фиксированы, т. е.рассматривается задача с закрепленным временем; множество U не зависит отвремени, фазовые ограничения отсутствуют. Положим

<img src="/cache/referats/8852/image042.gif" v:shapes="_x0000_i1078">

где <img src="/cache/referats/8852/image043.gif" v:shapes="_x0000_i1079"><img src="/cache/referats/8852/image044.gif" v:shapes="_x0000_i1080">

Функция Н называется функцией Гамильтона.
Система линейных дифференциальных уравнений <img src="/cache/referats/8852/image045.gif" v:shapes="_x0000_i1081"><img src="/cache/referats/8852/image046.gif" v:shapes="_x0000_i1082">сопряженнойсистемой, соответствующей управлению и и траектории х.Здесь 

<img src="/cache/referats/8852/image047.gif" v:shapes="_x0000_i1083">

>В более подробной покоординатной записи сопряженная система принимаетвид

<img src="/cache/referats/8852/image048.gif" v:shapes="_x0000_i1084">

Система (2.3) имеет при любых начальных условиях единственное решение<img src="/cache/referats/8852/image049.gif" v:shapes="_x0000_i1085"><img src="/cache/referats/8852/image010.gif" v:shapes="_x0000_i1086">

Следующая теорема выражает необходимые условия оптимальности в задаче (2.1).

Теорема (принципмаксимума Понтрягина).

Пусть функции<img src="/cache/referats/8852/image050.gif" v:shapes="_x0000_i1087">1,..., gm имеют частные производные по переменным х1, ..., Хnи непрерывны вместе с этими производными по совокупности аргументов х<img src="/cache/referats/8852/image051.gif" v:shapes="_x0000_i1088">, и <img src="/cache/referats/8852/image052.gif" v:shapes="_x0000_i1089"><img src="/cache/referats/8852/image052.gif" v:shapes="_x0000_i1090"><img src="/cache/referats/8852/image049.gif" v:shapes="_x0000_i1091"><img src="/cache/referats/8852/image053.gif" v:shapes="_x0000_i1092">

| <img src="/cache/referats/8852/image054.gif" v:shapes="_x0000_i1093"><img src="/cache/referats/8852/image049.gif" v:shapes="_x0000_i1094"><img src="/cache/referats/8852/image052.gif" v:shapes="_x0000_i1095">

а) (условие максимума) при каждом t<img src="/cache/referats/8852/image052.gif" v:shapes="_x0000_i1096"><img src="/cache/referats/8852/image055.gif" v:shapes="_x0000_i1097"><img src="/cache/referats/8852/image056.gif" v:shapes="_x0000_i1098">

H(x(t), u(t),<img src="/cache/referats/8852/image057.gif" v:shapes="_x0000_i1099">=max H(x(t), v(t),<img src="/cache/referats/8852/image057.gif" v:shapes="_x0000_i1100">(2.4)

б)(условие трансверсальности на левом конце траектории) существуютчисла<img src="/cache/referats/8852/image058.gif" v:shapes="_x0000_i1101">

<img src="/cache/referats/8852/image059.gif" v:shapes="_x0000_i1102">

в) (условие трансверсальности на правом конце траектории) существуютчисла <img src="/cache/referats/8852/image060.gif" v:shapes="_x0000_i1103">

<img src="/cache/referats/8852/image061.gif" v:shapes="_x0000_i1104">

Центральным в теореме является условие максимума -(2.4).
Если отказаться от предположения о том, что конечный момент времени Тфиксирован, то теорема останется справедливой за исключением условиятрансверсальности на правом конце траектории. Условие (2.6) заменим условием

<img src="/cache/referats/8852/image062.gif" v:shapes="_x0000_i1105">

и добавить еще одно условие трансверсальности на правом конце траектории:

<img src="/cache/referats/8852/image063.gif" v:shapes="_x0000_i1106">

Примеры применения принципа максимума.

1. Простейшая задача оптимального быстродействия.

Пусть точка движется по прямой в соответствии с законом

<img src="/cache/referats/8852/image064.gif" v:shapes="_x0000_i1107">

где х — координата. Требуется найти управление и, переводящее точкуиз начального положения в начало координат за минимальное время Т(задача оптимального быстродействия). При этом скорость точки в концетраектории должна быть нулевой, а управление — удовлетворять условию

<img src="/cache/referats/8852/image065.gif" v:shapes="_x0000_i1108">

Применим к сформулированной задаче принцип максимума Понтрягина. Введемфазовые переменные <img src="/cache/referats/8852/image066.gif" v:shapes="_x0000_i1109">. Тогдадвижение управляемого объекта описывается системой двух дифференциальныхуравнений первого порядка:

<img src="/cache/referats/8852/image067.gif" v:shapes="_x0000_i1110">

Начальное положение

<img src="/cache/referats/8852/image068.gif" v:shapes="_x0000_i1111">

при t0=0 и конечное положение (0, 0) фиксированы, аконечный момент времени Т не фиксирован.

В обозначениях п.п. 1, 2 в данной задаче U ==[-1, 1], f0=1,Ф=0, а функция Гамильтона имеет вид

<img src="/cache/referats/8852/image069.gif" v:shapes="_x0000_i1112">

Общее решение сопряженной системы

<img src="/cache/referats/8852/image070.gif" v:shapes="_x0000_i1113"><img src="/cache/referats/8852/image071.gif" v:shapes="_x0000_i1114">

легко выписывается в явном виде  <img src="/cache/referats/8852/image072.gif" v:shapes="_x0000_i1115">

где С, D — постоянные.

Очевидно, что максимум функции Н по и<img src="/cache/referats/8852/image073.gif" v:shapes="_x0000_i1116"> Uдостигается при

<img src="/cache/referats/8852/image074.gif" v:shapes="_x0000_i1117">

Таким образом, оптимальное управление и может принимать лишь двазначения +1.

2.Определить управление u(t), которое дает минимум интегралу

<img src="/cache/referats/8852/image075.gif" v:shapes="_x0000_i1118"><img src="/cache/referats/8852/image076.gif" v:shapes="_x0000_i1119">
Решение.
Введем дополнительную переменную

<img src="/cache/referats/8852/image077.gif" v:shapes="_x0000_i1120">

Для этой переменной имеемдифференциальное уравнение <img src="/cache/referats/8852/image078.gif" v:shapes="_x0000_i1121"><img src="/cache/referats/8852/image079.gif" v:shapes="_x0000_i1122">

с начальными условиями, получаемымииз (2), т.е. х2(0)=0. Минимизирующий функционал, используя (2),можно записать в виде I[T]=x2(T).

Построим функцию Гамильтона

<img src="/cache/referats/8852/image080.gif" v:shapes="_x0000_i1123">

Запишем сопряженную систему <img src="/cache/referats/8852/image081.gif" v:shapes="_x0000_i1124">

Запишем <img src="/cache/referats/8852/image082.gif" v:shapes="_x0000_i1125">

Y1(Т)=0(т.к. с1=0)

Y2(Т)=-1

Из <img src="/cache/referats/8852/image083.gif" v:shapes="_x0000_i1126">Y2(е)=-1. Теперь функцияГамильтона запишется в виде H=-aY1x1+Y1u-0,5x12-0,5u2.

По принципу максимума функция Н прификсированных х1 и Y1достигает максимума по u : <img src="/cache/referats/8852/image084.gif" v:shapes="_x0000_i1127"><img src="/cache/referats/8852/image085.gif" v:shapes="_x0000_i1128"><img src="/cache/referats/8852/image086.gif" v:shapes="_x0000_i1129">

Осталось решить систему уравнений (2)и (3) при условии <img src="/cache/referats/8852/image086.gif" v:shapes="_x0000_i1130">Y2(Т)=-1,

<img src="/cache/referats/8852/image076.gif" v:shapes="_x0000_i1131"><img src="/cache/referats/8852/image087.gif" v:shapes="_x0000_i1132"><img src="/cache/referats/8852/image088.gif" v:shapes="_x0000_i1133">

Сведем данную систему к одномууравнению относительно U.

<img src="/cache/referats/8852/image089.gif" v:shapes="_x0000_i1134"><img src="/cache/referats/8852/image090.gif" v:shapes="_x0000_i1135">

<img src="/cache/referats/8852/image091.gif" v:shapes="_x0000_i1136">

<img src="/cache/referats/8852/image092.gif" v:shapes="_x0000_i1137">

<img src="/cache/referats/8852/image093.gif" v:shapes="_x0000_i1138">

Добавим к этому уравнению граничныеусловия <img src="/cache/referats/8852/image094.gif" v:shapes="_x0000_i1139">2 — (а2+1) =0, к1,2=+(-)<img src="/cache/referats/8852/image095.gif" v:shapes="_x0000_i1140">

<img src="/cache/referats/8852/image096.gif" v:shapes="_x0000_i1141">

Найдем С1 и С2. <img src="/cache/referats/8852/image097.gif" v:shapes="_x0000_i1142"> С2=-с2е<img src="/cache/referats/8852/image098.gif" v:shapes="_x0000_i1143">. Тогда <img src="/cache/referats/8852/image099.gif" v:shapes="_x0000_i1144">

Используя граничные условия найдем С2<img src="/cache/referats/8852/image100.gif" v:shapes="_x0000_i1145">

Таким образом, определено оптимальноерешение

<img src="/cache/referats/8852/image101.gif" v:shapes="_x0000_i1146">

Примеры применения принципа максимума.

1. Простейшая задача оптимального быстродействия.

Пусть точка движется по прямой в соответствии с законом

<img src="/cache/referats/8852/image064.gif" v:shapes="_x0000_i1147">

где х — координата. Требуется найти управление и, переводящее точкуиз начального положения в начало координат за минимальное время Т(задача оптимального быстродействия). При этом скорость точки в концетраектории должна быть нулевой, а управление — удовлетворять условию

<img src="/cache/referats/8852/image065.gif" v:shapes="_x0000_i1148">

Применим к сформулированной задаче принцип максимума Понтрягина. Введемфазовые переменные <img src="/cache/referats/8852/image066.gif" v:shapes="_x0000_i1149">. Тогдадвижение управляемого объекта описывается системой двух дифференциальных уравненийпервого порядка:

<img src="/cache/referats/8852/image067.gif" v:shapes="_x0000_i1150">

Начальное положение

<img src="/cache/referats/8852/image068.gif" v:shapes="_x0000_i1151">

при t0=0 и конечное положение (0, 0) фиксированы, аконечный момент времени Т не фиксирован.

В обозначениях п.п. 1, 2 в данной задаче U ==[-1, 1], f0=1,Ф=0, а функция Гамильтона имеет вид

<img src="/cache/referats/8852/image069.gif" v:shapes="_x0000_i1152">

Общее решение сопряженной системы

<img src="/cache/referats/8852/image070.gif" v:shapes="_x0000_i1153"><img src="/cache/referats/8852/image071.gif" v:shapes="_x0000_i1154">

легко выписывается в явном виде  <img src="/cache/referats/8852/image072.gif" v:shapes="_x0000_i1155">

где С, D — постоянные.

Очевидно, что максимум функции Н по и<img src="/cache/referats/8852/image073.gif" v:shapes="_x0000_i1156"> Uдостигается при

<img src="/cache/referats/8852/image074.gif" v:shapes="_x0000_i1157">

Таким образом, оптимальное управление и может принимать лишь двазначения +1.

2.Определить управление u(t), которое дает минимум интегралу

<img src="/cache/referats/8852/image075.gif" v:shapes="_x0000_i1158"><img src="/cache/referats/8852/image076.gif" v:shapes="_x0000_i1159">
Решение.
Введем дополнительную переменную

<img src="/cache/referats/8852/image077.gif" v:shapes="_x0000_i1160">

Для этой переменной имеемдифференциальное уравнение <img src="/cache/referats/8852/image078.gif" v:shapes="_x0000_i1161"><img src="/cache/referats/8852/image079.gif" v:shapes="_x0000_i1162">

с начальными условиями, получаемымииз (2), т.е. х2(0)=0. Минимизирующий функционал, используя (2),можно записать в виде I[T]=x2(T).

Построим функцию Гамильтона

<img src="/cache/referats/8852/image080.gif" v:shapes="_x0000_i1163">

Запишем сопряженную систему <img src="/cache/referats/8852/image081.gif" v:shapes="_x0000_i1164">

Запишем <img src="/cache/referats/8852/image082.gif" v:shapes="_x0000_i1165">

Y1(Т)=0(т.к. с1=0)

Y2(Т)=-1

Из <img src="/cache/referats/8852/image083.gif" v:shapes="_x0000_i1166">Y2(е)=-1. Теперь функцияГамильтона запишется в виде H=-aY1x1+Y1u-0,5x12-0,5u2.

По принципу максимума функция Н прификсированных х1 и Y1достигает максимума по u : <img src="/cache/referats/8852/image084.gif" v:shapes="_x0000_i1167"><img src="/cache/referats/8852/image085.gif" v:shapes="_x0000_i1168"><img src="/cache/referats/8852/image086.gif" v:shapes="_x0000_i1169">

Осталось решить систему уравнений (2)и (3) при условии <img src="/cache/referats/8852/image086.gif" v:shapes="_x0000_i1170">Y2(Т)=-1,

<img src="/cache/referats/8852/image076.gif" v:shapes="_x0000_i1171"><img src="/cache/referats/8852/image087.gif" v:shapes="_x0000_i1172"><img src="/cache/referats/8852/image088.gif" v:shapes="_x0000_i1173">

Сведем данную систему к одномууравнению относительно U.

<img src="/cache/referats/8852/image089.gif" v:shapes="_x0000_i1174"><img src="/cache/referats/8852/image090.gif" v:shapes="_x0000_i1175">

<img src="/cache/referats/8852/image091.gif" v:shapes="_x0000_i1176">

<img src="/cache/referats/8852/image092.gif" v:shapes="_x0000_i1177">

<img src="/cache/referats/8852/image093.gif" v:shapes="_x0000_i1178">

Добавим к этому уравнению граничныеусловия <img src="/cache/referats/8852/image094.gif" v:shapes="_x0000_i1179">2 — (а2+1) =0, к1,2=+(-)<img src="/cache/referats/8852/image095.gif" v:shapes="_x0000_i1180">

<img src="/cache/referats/8852/image096.gif" v:shapes="_x0000_i1181">

Найдем С1 и С2. <img src="/cache/referats/8852/image097.gif" v:shapes="_x0000_i1182"> С2=-с2е<img src="/cache/referats/8852/image098.gif" v:shapes="_x0000_i1183">. Тогда <img src="/cache/referats/8852/image099.gif" v:shapes="_x0000_i1184">

Используя граничные условия найдем С2<img src="/cache/referats/8852/image100.gif" v:shapes="_x0000_i1185">

Таким образом, определено оптимальноерешение

<img src="/cache/referats/8852/image101.gif" v:shapes="_x0000_i1186">

Ометодах решения задач оптимального управления

Убедимся вначале, что необходимые условия оптимальности в форме принципамаксимума дают, вообще говоря, достаточную информацию для решения задачиоптимального управления (2.1), (2.2).

Условие максимума (2.4) позволяет, в принципе, найти управление и какфункцию параметров х, t, <img src="/cache/referats/8852/image102.gif" v:shapes="_x0000_i1187">

<img src="/cache/referats/8852/image103.gif" v:shapes="_x0000_i1188">(2.7)

Рассмотрим систему дифференциальных уравнений

<img src="/cache/referats/8852/image104.gif" v:shapes="_x0000_i1189">

объединяющюю систему уравнений движения объекта и сопряженную систему.

Как известно, общее решение системы (2.8), состоящей из 2n обыкновенныхдифференциальных уравнений первого порядка, зависит от 2п параметров.Кроме того, система необходимых условий оптимальности содержит тпараметров<img src="/cache/referats/8852/image105.gif" v:shapes="_x0000_i1190">y0. Таким образом, общее числонеизвестных равно 2n+m+1.

Для их определения мы имеем 2п условий (2.5), (2.6) и тусловий (2.2). Еще одно условие определяется из следующих соображений.

Легко понять, что, в силу линейности функции Н по переменным принципмаксимума Понтрягина определяет вектор (<img src="/cache/referats/8852/image102.gif" v:shapes="_x0000_i1191">) сточностью до положительного постоянного множителя. Поэтому если в конкретнойзадаче удается показать, что <img src="/cache/referats/8852/image106.gif" v:shapes="_x0000_i1192"><img src="/cache/referats/8852/image054.gif" v:shapes="_x0000_i1193"><img src="/cache/referats/8852/image107.gif" v:shapes="_x0000_i1194">

Таким образом, общее число условий равно 2n+m+1 и совпадает с числомнеизвестных параметров, что, в принципе, позволяет определить эти параметры.Изложенные соображения дают возможность в простейших случаях решить задачуоптимального управления в явном виде.

Опишем численный метод, основанный на тех же соображениях. Для этогорассмотрим краевую задачу для системы дифференциальных уравнений (2.8) скраевыми условиями (2.5), (2.6), а также выписанными на основе (2.2) краевымиусловиями

<img src="/cache/referats/8852/image108.gif" v:shapes="_x0000_i1195">

Эта задача называется краевой задачей принципа максимума.

Задав произвольные начальные условия<img src="/cache/referats/8852/image109.gif" v:shapes="_x0000_i1196">х(Т),<img src="/cache/referats/8852/image049.gif" v:shapes="_x0000_i1197">(Т). Приэтом на каждом шаге численного интегрирования значение <img src="/cache/referats/8852/image110.gif" v:shapes="_x0000_i1198"><img src="/cache/referats/8852/image054.gif" v:shapes="_x0000_i1199">

Значения х (Г), <img src="/cache/referats/8852/image111.gif" v:shapes="_x0000_i1200">Ь:

<img src="/cache/referats/8852/image112.gif" v:shapes="_x0000_i1201">

<img src="/cache/referats/8852/image113.gif" v:shapes="_x0000_i1202">

<img src="/cache/referats/8852/image114.gif" v:shapes="_x0000_i1203">

<img src="/cache/referats/8852/image115.gif" v:shapes="_x0000_i1204">

Эта система содержит 2п+т неизвестных а, Ь,<img src="/cache/referats/8852/image116.gif" v:shapes="_x0000_i1205">и состоитиз 2п+т уравнений. Ее решение можно находить известными численнымиметодами, например методом Ньютона.

Отметим, что вычисление значений <img src="/cache/referats/8852/image117.gif" v:shapes="_x0000_i1206">

При реализации на ЭВМ методов решения задач оптимального управления,основанных на необходимых условиях экстремума, могут встретиться такжезначительные трудности, вызванные некорректностью постановки исходной ивспомогательных задач и некоторыми особенностями краевой задачи принципамаксимума. Это приводит к необходимости применения методов регуляризации, учетаспецифики конкретной решаемой задачи, ее физического смысла и т. п.

Другие численные методы, не связанные непосредственно с принципом максимума,основаны на редукции исходной задачи к некоторой конечномерной задачематематического программирования. Их называют иногда прямыми методами(впрочем, разделение вычислительных методов на прямые и непрямые довольноусловно). Конечномерные аналоги задач оптимального управления имеютособенности, позволяющие эффективно применять некоторые методы нелинейного,динамического программирования и т. д]. Продемонстрируем пример такого подхода.

Рассмотрим следующую задачу оптимального управления

<img src="/cache/referats/8852/image118.gif" v:shapes="_x0000_i1207"><img src="/cache/referats/8852/image119.gif" v:shapes="_x0000_i1208">

<img src="/cache/referats/8852/image120.gif" v:shapes="_x0000_i1209">

где моменты времени<img src="/cache/referats/8852/image121.gif" v:shapes="_x0000_i1210">, Тфиксированы. Это задача более общего вида, чем (2.1), ибо в (2.10) Uзависит от времени и имеются фазовые ограничения произвольного вида, которые, вчастности, могут содержать ограничения на концах траектории вида (2.2).

Зафиксируем моменты времени <img src="/cache/referats/8852/image122.gif" v:shapes="_x0000_i1211">

<img src="/cache/referats/8852/image123.gif" v:shapes="_x0000_i1212">

<img src="/cache/referats/8852/image124.gif" v:shapes="_x0000_i1213">

Положив <img src="/cache/referats/8852/image125.gif" v:shapes="_x0000_i1214"><img src="/cache/referats/8852/image126.gif" v:shapes="_x0000_i1215">

<img src="/cache/referats/8852/image127.gif" v:shapes="_x0000_i1216">

Мы получили задачу математического программирования с переменными <img src="/cache/referats/8852/image128.gif" v:shapes="_x0000_i1217">

Задав начальное состояние х0и управление (u0, u1,..., uN-1), по формулам <img src="/cache/referats/8852/image129.gif" v:shapes="_x0000_i1218">1, ..., хN). Тем самым (2.12)сводится к задаче с переменными х0, u0, u1, ..., uN-1, и ееразмерность, таким образом, оказывается равной n+Nr.

Для решения задачи (2.11) часто применяют метод динамического программирования.В данном случае этот метод выглядит следующим образом. Ввелем функцию <img src="/cache/referats/8852/image130.gif" v:shapes="_x0000_i1219"><img src="/cache/referats/8852/image131.gif" v:shapes="_x0000_i1220"><img src="/cache/referats/8852/image132.gif" v:shapes="_x0000_i1221">к, ..., uN-1) пусто, тозначение <img src="/cache/referats/8852/image133.gif" v:shapes="_x0000_i1222"><img src="/cache/referats/8852/image134.gif" v:shapes="_x0000_i1223">

где минимум берется по таким <img src="/cache/referats/8852/image135.gif" v:shapes="_x0000_i1224"><img src="/cache/referats/8852/image136.gif" v:shapes="_x0000_i1225">

Положив <img src="/cache/referats/8852/image137.gif" v:shapes="_x0000_i1226">

Действительно, пусть <img src="/cache/referats/8852/image138.gif" v:shapes="_x0000_i1227"><img src="/cache/referats/8852/image139.gif" v:shapes="_x0000_i1228"><img src="/cache/referats/8852/image140.gif" v:shapes="_x0000_i1229"><img src="/cache/referats/8852/image141.gif" v:shapes="_x0000_i1230">

<img src="/cache/referats/8852/image142.gif" v:shapes="_x0000_i1231">

При численной реализации данного метода задаются сеточные аппроксимациимножеств <img src="/cache/referats/8852/image143.gif" v:shapes="_x0000_i1232"><img src="/cache/referats/8852/image144.gif" v:shapes="_x0000_i1233"><img src="/cache/referats/8852/image145.gif" v:shapes="_x0000_i1234"><img src="/cache/referats/8852/image146.gif" v:shapes="_x0000_i1235">

Далее по формулам (2.12) вычисляются значения <img src="/cache/referats/8852/image147.gif" v:shapes="_x0000_i1236"><img src="/cache/referats/8852/image148.gif" v:shapes="_x0000_i1237"><img src="/cache/referats/8852/image149.gif" v:shapes="_x0000_i1238"><img src="/cache/referats/8852/image150.gif" v:shapes="_x0000_i1239"><img src="/cache/referats/8852/image151.gif" v:shapes="_x0000_i1240"><img src="/cache/referats/8852/image152.gif" v:shapes="_x0000_i1241">

Заключение:

Отметим, чтодискретные задачи оптимального управления встречаются на практике ( например,при описании импульсных систем) и потому представляют интерес не только какконечноразностные аналоги непрерывных задач.

Задачи оптимизацииуправляемых процессов, или как они будут в дальнейшем называться, задачиоптимального управления, составляют один из широких классов экстремальных задачи имеют важное прикладное значение.

Структурная схемазадачи управления состоит из двух звеньев: управляющего органа и объектауправления. В качестве объекта управления может служить, например, космическийэксперимент, экономика отрасли промышленности, система машин, семейный бюджет ит. д. Управляющее звено со времени возникновения задач управления претерпелоэволюции от простейшего регулятора до современной ЭВМ.

Кыргызско — РоссийскаяАкадемия образования

Доклад

По дисциплине:

ТУТС

Тема: Принцип максимума Понтрягина.

                                                                Выполнил: Бахарев Д. В.ИВТ-1-98.

                                                                 Проверила: Жданова С. В.

г.Бишкек 2001

еще рефераты
Еще работы по теории систем управления