Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума





Скачать 170.53 Kb.
НазваниеРешение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума
Дата публикации26.05.2015
Размер170.53 Kb.
ТипРешение
100-bal.ru > Математика > Решение

    10 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА


10.1 НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ

В ЗАДАЧЕ С ЗАКРЕПЛЕННЫМИ КОНЦАМИ
Принцип максимума является необходимым условием минимума в задаче оптимального управления. Ввиду сложности, мы не приводим его доказательство, а даем только пояснения, как можно получить соответствующую систему условий из теоремы о достаточном условии минимума в задаче оптимального управления.

Принцип максимума Л.С. Понтрягина (необходимое условие оптимальности).

Если пара есть элемент минимума функционала в задаче оптимального управления с закрепленными концами, то значения при каждом t(t0, t1) есть элемент минимума функции
, (10.1)
где - k - мерная вектор-функция (ее размерность равна размерности вектор-функции фазовых координат y(t)), удовлетворяющая уравнениям
, (10.2)
т. е.

. (10.3)
Функцию H называют гамильтонианом, а систему (10.2) – сопряженной системой.

Пояснение (вместо доказательства).

Примем в виде
,
тогда
R=-ƒ0 (t, y, u) + ψ(t)· ƒ (t, y, u) + ψ(t)·y  H (t, y, u, ψ) + ψ·y. (10.4)
Функция Ф(y(t0),у(t1)) нас не интересует, так как рассматривается задача с закрепленными концами.

Из условия

,

поскольку второе слагаемое в (10.4) от u не зависит, следует
.

Необходимое же условие максимума R по y имеет вид

Ry = 0

Ry = + ψ = 0,

откуда

.

Содержание принципа максимума, таким образом, получено.

Принцип максимума дает следующую схему решения задачи оптимального управления.

  1. Записывается гамильтониан (10.1).

  1. Записывается сопряженная система (10.2) k дифференциальных уравнений 1-го порядка.

  2. Из условий (10.3) находятся r уравнений, связывающих оптимальное значение ũ (t) с переменными t, y, ψ.

  3. Решается полученная система 2k + r уравнений:

  • (k – исходных дифференциальных уравнений,

  • k дифференциальных уравнений сопряженной системы,

  • r уравнений относительно ũ (t), полученных из условия максимума гамильтониана с 2k граничными условиями (заданные значения y(t0) и y(t1) относительно 2k + r неизвестных функций:

  • k функций yi (t), i =1, …, k,

  • k функций ψi (t), i =1,…, k,

  • r функций uj (t), j =1,…, r.

Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума.

  1. Если удастся, то на (ỹ(t), u(t)) проверяются достаточные условия минимума, что позволяет убедиться в том, что (ỹ(t), u(t)) – действительно элемент минимума.


Пример I.

Ј = ;



(см. пример 1 п. 10.2).

  1. H = -y2 – u2 + ψ·u.

  1. .

  2. Hu = -2u + ψ.

Huu = -2.

Hu = -2u + = 0.

Huu < 0, значит, u = - отвечает максимуму H.

  1. ỷ = u.

.

.

y(0) = 0, y(1) = .

Исключая из системы u и ψ, получаем

ÿ = y.

Решение этого уравнения

y = C1et + C2e-t .

Произвольные постоянные определим из граничных условий

0 = С1 + С2

= С1e + C2é,

откуда С1 = ; C2 = - .

Итак, ỹ(t) = (et – e-t); ū(t) = (et + e-t) (10.4)

  1. Проверяем для полученной пары достаточное условие оптимальности (см. пример 1 п.10.2.) и убеждаемся, что полученное решение – действительно элемент минимума.


Пример 2.






  1. H = -y + 2u + ψ(4u - y) = -y – ψy + (2 + 4 ψ)u.

  1. Ψ = 1 + ψ.

  2. Найдем соотношение, определяющее оптимальное значение ū из условия максимума H(t, y, u, ψ) по u при выполнении ограничения 1  u  0. Функция H линейно зависит от u (рис. 10.1),


поэтому

I при 2 + 4 ψ > 0

0 при 2 + 4 ψ < 0

любому значению из [0, I] при 2 + 4 ψ = 0.




Рис. 10.1


Полученное выражение есть искомое соотношение, связывающее u и ψ. Его можно, как и любую зависимость, изобразить графически (рис. 10.2).

4. Составим систему 3-х уравнений с тремя неизвестными.



Рис. 10.2


.
При её решении появятся две произвольные постоянные, которые мы определим из двух граничных условий.

И


Рис. 10.3
з второго уравнения

, ,



Теперь мы можем найти функцию (т.н. функцию переключения), знак которой определяет значение :

.

На отрезке есть монотонная функция (рис.10.3), которая в зависимости от , может менять знак не более одного раза, причём с минуса на плюс.

Значит, возможны следующие три варианта зависимости


  1. на ,

  2. (см. рис. 10.4),

  3. на .

Решаем систему отдельно для каждого из трех случаев.
Вариант 1.

,

;

;

;

.

При такой функции невозможно удовлетворить обоим граничным условиям, поэтому вариант 1 отпадает.




Рис. 10.4


Вариант 2. На участке .

,



Из условия

,

и ,

в частности,

.

На участке , ,

,

,

,

.

По условию задачи оптимального управления - непрерывная функция, поэтому её значения в точке , подсчитанные на одном и втором участках, должны быть равны

.

Из второго граничного условия



Из этих двух уравнений найдем и :



,

.

Итак, из принципа максимума получена пара

;

, (10.5)

на которой может достигаться минимум функционала (рис. 10.5).

Вариант 3.



Рис. 10.5
на .

.

Решение этого уравнения



удовлетворить обоим граничным условиям не может.

Итак, необходимым условиям оптимальности удовлетворяет лишь одна пара (10.5), значит, или элемент минимума в задаче не существует, или им является эта пара.

10.2 ЗАДАЧА С НЕЗАКРЕПЛЕННЫМИ КОНЦАМИ.

УСЛОВИЯ ТРАНСВЕРСАЛЬНОСТИ
Пусть в задаче оптимального управления начальные и конечные значения фазовых координат не заданы однозначно, а подчиняются лишь некоторым условиям.



. (10.6)
Тогда возникает так называемая задача с незакрепленными концами.

Теорема. Для задачи с незакрепленными концами справедлив принцип максимума.

Доказательство. Пусть - элемент минимума в задаче с незакрепленными концами. Рассмотрим задачу оптимального управления с закрепленными концами, отличающуюся от исходной лишь тем, что вместо условий (10.6) заданы



В этой задаче пара также будет элементом минимума (по Лемме о необходимом условии оптимальности), следовательно, для нее справедлив принцип максимума.

Однако в данном случае принцип максимума уже не дает замкнутой системы для определения элемента минимума: при его применении число уравнений равно числу неизвестных функций , но количество граничных условий (10.6) меньше того, которое необходимо .

Недостающие граничные условия называют условиями трансверсальности. Для их нахождения записывают функцию Кротова при условии

(10.7)

и решают задачу об ее минимуме по переменным при условиях (10.6) (задача на условный минимум функции переменных). Из необходимых условий этого минимума получаются условия трансверсальности.
Пример 1.



Принцип максимума





  1. .



  1. .



Полученная на основе принципа максимума система содержит три уравнения с тремя неизвестными. Из них два уравнения – дифференциальные 1-го порядка, значит, необходимы два граничных условия, а есть только одно Для получения второго (условия трансверсальности) составим функцию

Найдем ее минимум по переменной (переменная задана):
,
Соотношение , связывающее конечные значения и , есть недостающее условие трансверсальности.

Решаем систему дифференциальных уравнений



Из граничных условий находим

,



Итак, только пара



может быть элементом минимума.
Пример 2.



Применяем принцип максимума

1.

2.

3..



то есть

.

4.


К полученной системе нужны четыре граничных условия, а даны лишь два. Найдем два недостающих условия трансверсальности.

Функция зависит от линейно; минимум ее будет существовать (рис.10.6) лишь при .




Рис. 10.6


Найдем условия ее минимума по при связи Введем множитель Лагранжа и рассмотрим минимум функции


Необходимые условия минимума



Исключая , придем еще к одному условию трансверсальности:

.

Полученные два условия трансверсальности вместе с двумя заданными граничными условиями полностью определяют однозначное решение.


10.3 ПРИМЕР. ОПТИМИЗАЦИЯ РАЗВИВАЮЩЕЙ ДЕЯТЕЛЬНОСТИ В ОБРАЗОВАТЕЛЬНЫХ СИСТЕМАХ
Рассмотрим упрощенную модель развития научных способностей личности в результате ее исследовательской деятельности. Выделим в этой деятельности лишь два компонента: творческий и ремесленный. Соответствующие переменные обозначим индексами “т” и “р”.

Научную квалификацию будем обозначать переменной , а время, затрачиваемое на исследовательскую деятельность, – переменной . Тогда изменение творческой и ремесленной квалификации в результате удельных затрат времени соответственно и описывается дифференциальными уравнениями

где t –время, I, K – оценки интеллекта и креативности личности, а коэффициенты показывают перекрестное влияние одного вида квалификации на скорость развития другого вида:


Следующие соотношения:

показывают, что общее время занятий исследовательской деятельностью определяется личностью не произвольно, а зависит от того, какого рода эмоции (оцениваемые соответствующими коэффициентами) доставляют ей различные виды деятельности. Кроме того, необходимо учесть, что исследовательская деятельность на ранних стадиях развития личности невозможна без соответствующего научного руководства, которое также требует затрат времени руководителя, а время ограничено. Это находит отражение в соотношениях:


Ставится задача: найти, в каком соотношении следует делить время между творческой и ремесленной составляющими исследовательской деятельности с тем, чтобы за заданный период времени максимально повысить квалификацию личности. В качестве критерия используем значение общей квалификации в конечный момент времени
.
Подобная упрощенная модель в какой-то мере может использоваться при описании развития научных способностей в школьно-вузовский период.

Введем общие затраты времени личностью . Обозначим



Тогда из формулы







или



Если предположить, что максимальная внешняя помощь пропорциональна затратам усилий личностью, то

.

Тогда

,

и



Итак, окончательно:



.

Управлением в этой модели является переменная , удовлетворяющая ограничениям:

,

где некоторые обязательные затраты времени на ремесленную часть, без которых не может быть завершена никакая исследовательская работа.

Пусть

Применим принцип максимума. Гамильтониан равен:



.

Тогда сопряженная система имеет вид:



.

Условия трансверсальности таковы:



Поскольку гамильтониан линейно зависит от управления , то



где функция переключения P имеет вид



Обсудим полученную структуру управления. Оно является регулируемым, т.е. личность одновременно занимается как творческой, так и ремесленной деятельностью, лишь в том случае, когда выполняется условие

P=0.
Чтобы понять его смысл, рассмотрим значение функции переключения в конечный момент. В соответствии с условиями трансверсальности,

.

Каждое слагаемое в этом выражении задает скорость изменения общей квалификации за счет теоретической и ремесленной деятельности. Таким образом, в конечный момент управление будет регулируемым, лишь если эти скорости равны, т.е. ни одному из видов деятельности нельзя отдать предпочтения. Тогда можно представить, что в 6-мерном пространстве развития личности, определяемом координатами , существует поверхность равноценности различных видов деятельности. Если текущие характеристики личности таковы, что изображающая ее точка пространства находится на этой поверхности, то развитие личности происходит путем оптимального сочетания различных видов деятельности таким образом, чтобы оставаться на этой поверхности, пока это не препятствует выполнению конечных условий трансверсальности. Если же в текущий момент точка, характеризующая состояние личности, не находится на поверхности равноценности, развитие происходит путем занятия лишь одним из видов деятельности, в котором развитие личности оказывается более слабым с точки зрения оценки параметра:

,

где индекс “r” принимает значения соответственно “т” или “р”. Образно говоря, если личность находится в состоянии, соответствующем “гармоничной” траектории развития, она продолжает развиваться по “гармоничной” взвешенной стратегии; если же ей не хватает до гармоничного состояния теоретической или ремесленной квалификации, то она вначале усиленно наращивает ее, занимаясь соответствующей деятельностью вплоть до перехода в “гармоничное” состояние.

Применим для определения конкретных числовых значений коэффициентов в данной модели метод ПРИНН. Напомним, что в упрощенной постановке он устанавливает, что "более важный" критерий имеет весовой коэффициент, в три раза больший, чем "менее важный". Введем ряд гипотез, позволяющих оценить на этой основе значения коэффициентов модели:

,

,

,

F = Ст Хтр Хр ;

где Ст, Ср - весовые коэффициенты, соизмеряющие "ценность" различного вида способностей,

mт, mр - время, затрачиваемое на творческую и ремесленную компоненты деятельности: mn+mр=М,

т, р - коэффициенты скорости развития соответствующих видов способностей в зависимости от затрачиваемого времени на развивающую деятельность,

Хт, Хр - коэффициенты влияния уровня способностей одного вида на развитие способностей другого вида,

ао, ат, ар, ах - коэффициенты влияния на мотивацию личности ее чувства "предназначения", вида деятельности, внешнего стимулирования,

Мmах - предельно допустимое время, затрачиваемое на развивающую деятельность.

Примем, что:

1) в общей оценке способностей творческие важнее ремесленных: Ст = 0,75 Ср = 0,25;

2) время, затрачиваемое на освоение ремесленных функций, повышает соответствующую квалификацию быстрее, чем, при прочих равных условиях, время, затрачиваемое на творческую деятельность: р = 3т;

3) творческая квалификация не способствует развитию ремесленных способностей: p = 0;

4) ремесленная квалификация способствует развитию творческих способностей меньше, чем творческая: ;

5) ремесленная деятельность утомляет сильнее, чем стимулирует творческая: ар = -3ат ;

6) чувство предназначения стимулирует меньше, чем полностью творческая деятельность: ;

7) удовлетворение от полностью творческой деятельности больше, чем от максимального стимулирования: ;

8) если для конкретности рассматривать школьно-вузовский период - с 9 класса по 6-й курс, то Ткон == 90 месяцев, Мmax = 80 час/мес.

Рассмотрим развитие ремесленной квалификации при полном выделении времени на нее, т. е. mp = M, М = Мmax, тогда .

С
читая, что за время Ткон достигается квалификация, практически равна 1, получим

.

Э
тот интеграл равен
Если считать Xp нач = 0,1; Xр кон = 0,9; то

= ln(9/0,11) = 4.24.

О





тсюда можно принять
9) будем считать, что при чисто ремесленной работе, начальной квалификации 0,1 и мотивации 8 час/мес эта мотивация за месяц полностью исчезнет:





Б
удем рассматривать стратегию, в соответствии с которой в каждый момент времени управление выбирается из условия максимизации целевой установки

Q = KF F + KM M.

Н
еобходимо соразмерить KF и KM в целевой установке. Связь мотивации с квалификацией из (1) приближенно имеет вид


и
ли, при изменении М на величину М, F= 0,169 ·10-2 М.

Итак, значения КF = 1, Км = 0,169 · 10-2 примем за среднее сочетание, характерное для "умниц". Для придающих большее значение повышению квалификации - "усердных" КF = 3, Км = 0,169 · 10-2. Для тех же, кто придает квалификации меньшее значение, чем удовольствию, получаемому от творческой деятельности - "сибаритов" - KF = 0.333, КM = 0,169 · 10-2.

Тогда






(многоточием обозначены члены, не зависящие от управления ).


Оптимальное управление тогда
где А - квадратная скобка, являющаяся сомножителем mт в правой части уравнения. Например, для "умниц"





А = 4 · 0,169 · 10-2 · 0,0005 (Мmax - М) - 4 · 0,2 ·10-3 [(3+ХР) · ХТ · (1-ХТ) - 3Хр (1-Хр)];
А = 0,338 · 10-5max - М) - 20 · 10-5 ·[(3+ХР)] · ХТ · (1-ХТ) - 3Хр (1-Хр)].

Условие оптимальности управления определяет в фазовом пространстве поверхность переключения уравнением A=0. Из него следует уравнение поверхности переключения

или, с учетом сделанных выше допущений,

для "усердных"

,

для "умниц"

,

для "сибаритов"

.

Соответствующие поверхности переключения представлены на рис.10.7 – 10.9. На них показаны поверхности переключения соответственно для «усердных», «умниц» и «сибаритов». Часть пространства под поверхностью отвечает сугубо творческой деятельности, над поверхностью - сугубо ремесленной, движение по поверхности переключения отвечает гармоничному сочетанию обоих видов деятельности. При любой траектории движения, в соответствии с исходными дифференциальными уравнениями, XT и XP не убывают, уровень же мотивации при XT=M, т.е. при движении под поверхностью переключения, возрастает, над ней - убывает. Таким образом, движение по этой поверхности устойчиво. В начале процесса развития как творческая, так и ремесленная квалификация личности невелика, т.е. начальная точка находится под поверхностью переключения. Таким образом, оптимальное развитие начинается, по возможности, максимально творческой деятельностью, повышающей, наряду с соответствующей компонентой квалификации, уровень мотивации до оптимального значения. Затем следует период выполнения комплексных работ, в которых творческая и ремесленная составляющие находятся в сочетании, отвечающем движению по поверхности переключения. Затем, как показывают расчеты, во многих случаях наступает момент, когда движение по поверхности переключения становится невозможным. Тогда оптимальным оказывается выполнение работ с превалирующей ремесленной составляющей, т.е. наращивание чисто технологических навыков исследовательской деятельности.




Рис. 10.7




Рис.10.8



Рис. 10.9



Такая стратегия развития отличается от практики руководства и оценки исследовательских работ учащихся, особенно школьников. Обычно, ориентируя их на выполнение исследовательских работ, полагают, что им следует (рис. 10.9) давать темы, в основном связанные с изучением литературы, написанием программ по понятным алгоритмам, и оценивать результаты их деятельности по тому, насколько толсты и красиво оформлены рефераты или сложны, трудоемки и красиво оформлены программы для ЭВМ. Практика показывает, что впоследствии, в вузе, большинство таких ребят продолжает идти по проторенной ремесленной стезе или вообще перестает интересоваться исследовательской деятельностью, ограничиваясь обычной учебой. Причина состоит в том, что в них не инициированы механизмы творческого мышления и не развита мотивация.






Добавить документ в свой блог или на сайт

Похожие:

Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconМетодические рекомендации по подготовке к семинару
Семинар является важнейшим элементом системы образования. Семинар – это не столько опрос студентов, сколько совместное с преподавателем...
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconПояснительная записка
Важнейшим элементом технологии является создание проблемной ситуации на основе подводящего диалога. Еще одной особенностью урока...
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconПрограмма по формированию навыков безопасного поведения на дорогах...
Пдд. А ведь соблюдение пдд является основополагающим элементом формирования сознания ребенка – пешехода, а в дальнейшем будущего...
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconПрограмма по формированию навыков безопасного поведения на дорогах...
Математическое образование следует рассматривать как важнейшую составляющую фундаментальной подготовки специалиста. Обусловлено это...
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconЛюцина Станиславовна, 50 лет, учитель географии
Необходимым элементом действия является экран, на который проецируется монитор компьютера
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconФакультет информационных технологий
Создание и исследование моделей является неотъемлемым элементом любой целенаправленной деятельности. У термина «модель» существует...
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconПрограмма по формированию навыков безопасного поведения на дорогах...
Необходимым элементом действия является экран, на который проецируется монитор компьютера
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconПрограмма по формированию навыков безопасного поведения на дорогах...
Одной из основных задач при изучении предметов в образовательных учреждениях является развитие познавательного интереса, интеллектуальных...
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconМетодические указания к написанию курсовых работ курсовая работа
Курсовая работа является важнейшим элементом самостоятельной работы студентов. Основной целью курсовой работы является создание и...
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconО месте мультимедийных программ в обучении лингвострановедению на факультете мэо
Поэтому при обучении иностранным языкам необходимым элементом является обучение культурологическому аспекту
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconПрограмма по формированию навыков безопасного поведения на дорогах...
Театр уникальный метод, рожденный Владиславом Лебедько в 1992 году, дающий шанс окунуться в переживание таинств души является важным...
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconРеферат По предмету: политология на тему: Политические идеологии
Политическая идеология является наиболее влиятельным рационализированным (осознанным) элементом политического сознания, оказывающим...
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconРоссийской федерации
Курс «Маркетинг персонала» является важным элементом процесса подготовки квалифицированных бакалавров, владеющих знаниями в области...
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconСтрахование является неотъемлемым элементом системы социально-экономических...
К. Маркс и А. Маршалл уже относили страхование к необходимым условиям воспроизводства
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconПрограмма по формированию навыков безопасного поведения на дорогах...
Спросите у любого родителя, что он считает важнейшим элементом обучения своего ребенка, и он наверняка ответит: хорошие учителя
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума iconФранция италия
Великолепно по своим вкусовым качествам оливковое масло одно из лучших в стране, абсолютно чистое, прославившееся своим зеленым цветом...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск