Скачать 170.53 Kb.
|
10 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА 10.1 НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В ЗАДАЧЕ С ЗАКРЕПЛЕННЫМИ КОНЦАМИ Принцип максимума является необходимым условием минимума в задаче оптимального управления. Ввиду сложности, мы не приводим его доказательство, а даем только пояснения, как можно получить соответствующую систему условий из теоремы о достаточном условии минимума в задаче оптимального управления. Принцип максимума Л.С. Понтрягина (необходимое условие оптимальности). Если пара есть элемент минимума функционала в задаче оптимального управления с закрепленными концами, то значения при каждом t(t0, t1) есть элемент минимума функции , (10.1) где - k - мерная вектор-функция (ее размерность равна размерности вектор-функции фазовых координат y(t)), удовлетворяющая уравнениям , (10.2) т. е. . (10.3) Функцию H называют гамильтонианом, а систему (10.2) – сопряженной системой. Пояснение (вместо доказательства). Примем в виде , тогда R=-ƒ0 (t, y, u) + ψ(t)· ƒ (t, y, u) + ψ(t)·y H (t, y, u, ψ) + ψ·y. (10.4) Функция Ф(y(t0),у(t1)) нас не интересует, так как рассматривается задача с закрепленными концами. Из условия , поскольку второе слагаемое в (10.4) от u не зависит, следует . Необходимое же условие максимума R по y имеет вид Ry = 0 Ry = + ψ = 0, откуда . Содержание принципа максимума, таким образом, получено. Принцип максимума дает следующую схему решения задачи оптимального управления.
Решение (ỹ(t), (t)) “подозрительно” на то, что является элементом максимума.
Пример I. Ј = ; (см. пример 1 п. 10.2).
Huu = -2. Hu = -2u + = 0. Huu < 0, значит, u = - отвечает максимуму H.
. . y(0) = 0, y(1) = . Исключая из системы u и ψ, получаем ÿ = y. Решение этого уравнения y = C1et + C2e-t . Произвольные постоянные определим из граничных условий 0 = С1 + С2 = С1e + C2é, откуда С1 = ; C2 = - . Итак, ỹ(t) = (et – e-t); ū(t) = (et + e-t) (10.4)
Пример 2.
поэтому I при 2 + 4 ψ > 0 0 при 2 + 4 ψ < 0 любому значению из [0, I] при 2 + 4 ψ = 0. Рис. 10.1 Полученное выражение есть искомое соотношение, связывающее u и ψ. Его можно, как и любую зависимость, изобразить графически (рис. 10.2). 4. Составим систему 3-х уравнений с тремя неизвестными. Рис. 10.2 . При её решении появятся две произвольные постоянные, которые мы определим из двух граничных условий. И Рис. 10.3 з второго уравнения , , Теперь мы можем найти функцию (т.н. функцию переключения), знак которой определяет значение : . На отрезке есть монотонная функция (рис.10.3), которая в зависимости от , может менять знак не более одного раза, причём с минуса на плюс. Значит, возможны следующие три варианта зависимости
Решаем систему отдельно для каждого из трех случаев. Вариант 1. , ; ; ; . При такой функции невозможно удовлетворить обоим граничным условиям, поэтому вариант 1 отпадает. Рис. 10.4 Вариант 2. На участке . , Из условия , и , в частности, . На участке , , , , , . По условию задачи оптимального управления - непрерывная функция, поэтому её значения в точке , подсчитанные на одном и втором участках, должны быть равны . Из второго граничного условия Из этих двух уравнений найдем и : , . Итак, из принципа максимума получена пара ; , (10.5) на которой может достигаться минимум функционала (рис. 10.5). Вариант 3. Рис. 10.5 на . . Решение этого уравнения удовлетворить обоим граничным условиям не может. Итак, необходимым условиям оптимальности удовлетворяет лишь одна пара (10.5), значит, или элемент минимума в задаче не существует, или им является эта пара. 10.2 ЗАДАЧА С НЕЗАКРЕПЛЕННЫМИ КОНЦАМИ. УСЛОВИЯ ТРАНСВЕРСАЛЬНОСТИ Пусть в задаче оптимального управления начальные и конечные значения фазовых координат не заданы однозначно, а подчиняются лишь некоторым условиям. . (10.6) Тогда возникает так называемая задача с незакрепленными концами. Теорема. Для задачи с незакрепленными концами справедлив принцип максимума. Доказательство. Пусть - элемент минимума в задаче с незакрепленными концами. Рассмотрим задачу оптимального управления с закрепленными концами, отличающуюся от исходной лишь тем, что вместо условий (10.6) заданы В этой задаче пара также будет элементом минимума (по Лемме о необходимом условии оптимальности), следовательно, для нее справедлив принцип максимума. Однако в данном случае принцип максимума уже не дает замкнутой системы для определения элемента минимума: при его применении число уравнений равно числу неизвестных функций , но количество граничных условий (10.6) меньше того, которое необходимо . Недостающие граничные условия называют условиями трансверсальности. Для их нахождения записывают функцию Кротова при условии (10.7) и решают задачу об ее минимуме по переменным при условиях (10.6) (задача на условный минимум функции переменных). Из необходимых условий этого минимума получаются условия трансверсальности. Пример 1. Принцип максимума
Полученная на основе принципа максимума система содержит три уравнения с тремя неизвестными. Из них два уравнения – дифференциальные 1-го порядка, значит, необходимы два граничных условия, а есть только одно Для получения второго (условия трансверсальности) составим функцию Найдем ее минимум по переменной (переменная задана): , Соотношение , связывающее конечные значения и , есть недостающее условие трансверсальности. Решаем систему дифференциальных уравнений Из граничных условий находим , Итак, только пара может быть элементом минимума. Пример 2. Применяем принцип максимума 1. 2. 3.. то есть . 4. К полученной системе нужны четыре граничных условия, а даны лишь два. Найдем два недостающих условия трансверсальности. Функция зависит от линейно; минимум ее будет существовать (рис.10.6) лишь при . Рис. 10.6 Найдем условия ее минимума по при связи Введем множитель Лагранжа и рассмотрим минимум функции Необходимые условия минимума Исключая , придем еще к одному условию трансверсальности: . Полученные два условия трансверсальности вместе с двумя заданными граничными условиями полностью определяют однозначное решение. 10.3 ПРИМЕР. ОПТИМИЗАЦИЯ РАЗВИВАЮЩЕЙ ДЕЯТЕЛЬНОСТИ В ОБРАЗОВАТЕЛЬНЫХ СИСТЕМАХ Рассмотрим упрощенную модель развития научных способностей личности в результате ее исследовательской деятельности. Выделим в этой деятельности лишь два компонента: творческий и ремесленный. Соответствующие переменные обозначим индексами “т” и “р”. Научную квалификацию будем обозначать переменной , а время, затрачиваемое на исследовательскую деятельность, – переменной . Тогда изменение творческой и ремесленной квалификации в результате удельных затрат времени соответственно и описывается дифференциальными уравнениями где t –время, I, K – оценки интеллекта и креативности личности, а коэффициенты показывают перекрестное влияние одного вида квалификации на скорость развития другого вида: Следующие соотношения: показывают, что общее время занятий исследовательской деятельностью определяется личностью не произвольно, а зависит от того, какого рода эмоции (оцениваемые соответствующими коэффициентами) доставляют ей различные виды деятельности. Кроме того, необходимо учесть, что исследовательская деятельность на ранних стадиях развития личности невозможна без соответствующего научного руководства, которое также требует затрат времени руководителя, а время ограничено. Это находит отражение в соотношениях: Ставится задача: найти, в каком соотношении следует делить время между творческой и ремесленной составляющими исследовательской деятельности с тем, чтобы за заданный период времени максимально повысить квалификацию личности. В качестве критерия используем значение общей квалификации в конечный момент времени . Подобная упрощенная модель в какой-то мере может использоваться при описании развития научных способностей в школьно-вузовский период. Введем общие затраты времени личностью . Обозначим Тогда из формулы или Если предположить, что максимальная внешняя помощь пропорциональна затратам усилий личностью, то . Тогда , и Итак, окончательно: . Управлением в этой модели является переменная , удовлетворяющая ограничениям: , где некоторые обязательные затраты времени на ремесленную часть, без которых не может быть завершена никакая исследовательская работа. Пусть Применим принцип максимума. Гамильтониан равен: . Тогда сопряженная система имеет вид: . Условия трансверсальности таковы: Поскольку гамильтониан линейно зависит от управления , то где функция переключения P имеет вид Обсудим полученную структуру управления. Оно является регулируемым, т.е. личность одновременно занимается как творческой, так и ремесленной деятельностью, лишь в том случае, когда выполняется условие P=0. Чтобы понять его смысл, рассмотрим значение функции переключения в конечный момент. В соответствии с условиями трансверсальности, . Каждое слагаемое в этом выражении задает скорость изменения общей квалификации за счет теоретической и ремесленной деятельности. Таким образом, в конечный момент управление будет регулируемым, лишь если эти скорости равны, т.е. ни одному из видов деятельности нельзя отдать предпочтения. Тогда можно представить, что в 6-мерном пространстве развития личности, определяемом координатами , существует поверхность равноценности различных видов деятельности. Если текущие характеристики личности таковы, что изображающая ее точка пространства находится на этой поверхности, то развитие личности происходит путем оптимального сочетания различных видов деятельности таким образом, чтобы оставаться на этой поверхности, пока это не препятствует выполнению конечных условий трансверсальности. Если же в текущий момент точка, характеризующая состояние личности, не находится на поверхности равноценности, развитие происходит путем занятия лишь одним из видов деятельности, в котором развитие личности оказывается более слабым с точки зрения оценки параметра: , где индекс “r” принимает значения соответственно “т” или “р”. Образно говоря, если личность находится в состоянии, соответствующем “гармоничной” траектории развития, она продолжает развиваться по “гармоничной” взвешенной стратегии; если же ей не хватает до гармоничного состояния теоретической или ремесленной квалификации, то она вначале усиленно наращивает ее, занимаясь соответствующей деятельностью вплоть до перехода в “гармоничное” состояние. Применим для определения конкретных числовых значений коэффициентов в данной модели метод ПРИНН. Напомним, что в упрощенной постановке он устанавливает, что "более важный" критерий имеет весовой коэффициент, в три раза больший, чем "менее важный". Введем ряд гипотез, позволяющих оценить на этой основе значения коэффициентов модели: , , , F = Ст Хт +Ср Хр ; где Ст, Ср - весовые коэффициенты, соизмеряющие "ценность" различного вида способностей, mт, mр - время, затрачиваемое на творческую и ремесленную компоненты деятельности: mn+mр=М, т, р - коэффициенты скорости развития соответствующих видов способностей в зависимости от затрачиваемого времени на развивающую деятельность, Хт, Хр - коэффициенты влияния уровня способностей одного вида на развитие способностей другого вида, ао, ат, ар, ах - коэффициенты влияния на мотивацию личности ее чувства "предназначения", вида деятельности, внешнего стимулирования, Мmах - предельно допустимое время, затрачиваемое на развивающую деятельность. Примем, что: 1) в общей оценке способностей творческие важнее ремесленных: Ст = 0,75 Ср = 0,25; 2) время, затрачиваемое на освоение ремесленных функций, повышает соответствующую квалификацию быстрее, чем, при прочих равных условиях, время, затрачиваемое на творческую деятельность: р = 3т; 3) творческая квалификация не способствует развитию ремесленных способностей: p = 0; 4) ремесленная квалификация способствует развитию творческих способностей меньше, чем творческая: ; 5) ремесленная деятельность утомляет сильнее, чем стимулирует творческая: ар = -3ат ; 6) чувство предназначения стимулирует меньше, чем полностью творческая деятельность: ; 7) удовлетворение от полностью творческой деятельности больше, чем от максимального стимулирования: ; 8) если для конкретности рассматривать школьно-вузовский период - с 9 класса по 6-й курс, то Ткон == 90 месяцев, Мmax = 80 час/мес. Рассмотрим развитие ремесленной квалификации при полном выделении времени на нее, т. е. mp = M, М = Мmax, тогда . С читая, что за время Ткон достигается квалификация, практически равна 1, получим . Э тот интеграл равен Если считать Xp нач = 0,1; Xр кон = 0,9; то = ln(9/0,11) = 4.24. О тсюда можно принять 9) будем считать, что при чисто ремесленной работе, начальной квалификации 0,1 и мотивации 8 час/мес эта мотивация за месяц полностью исчезнет: Б удем рассматривать стратегию, в соответствии с которой в каждый момент времени управление выбирается из условия максимизации целевой установки Q = KF F + KM M. Н еобходимо соразмерить KF и KM в целевой установке. Связь мотивации с квалификацией из (1) приближенно имеет вид и ли, при изменении М на величину М, F= 0,169 ·10-2 М. Итак, значения КF = 1, Км = 0,169 · 10-2 примем за среднее сочетание, характерное для "умниц". Для придающих большее значение повышению квалификации - "усердных" КF = 3, Км = 0,169 · 10-2. Для тех же, кто придает квалификации меньшее значение, чем удовольствию, получаемому от творческой деятельности - "сибаритов" - KF = 0.333, КM = 0,169 · 10-2. Тогда (многоточием обозначены члены, не зависящие от управления ). Оптимальное управление тогда где А - квадратная скобка, являющаяся сомножителем mт в правой части уравнения. Например, для "умниц" А = 4 · 0,169 · 10-2 · 0,0005 (Мmax - М) - 4 · 0,2 ·10-3 [(3+ХР) · ХТ · (1-ХТ) - 3Хр (1-Хр)]; А = 0,338 · 10-5 (Мmax - М) - 20 · 10-5 ·[(3+ХР)] · ХТ · (1-ХТ) - 3Хр (1-Хр)]. Условие оптимальности управления определяет в фазовом пространстве поверхность переключения уравнением A=0. Из него следует уравнение поверхности переключения или, с учетом сделанных выше допущений, для "усердных" , для "умниц" , для "сибаритов" . Соответствующие поверхности переключения представлены на рис.10.7 – 10.9. На них показаны поверхности переключения соответственно для «усердных», «умниц» и «сибаритов». Часть пространства под поверхностью отвечает сугубо творческой деятельности, над поверхностью - сугубо ремесленной, движение по поверхности переключения отвечает гармоничному сочетанию обоих видов деятельности. При любой траектории движения, в соответствии с исходными дифференциальными уравнениями, XT и XP не убывают, уровень же мотивации при XT=M, т.е. при движении под поверхностью переключения, возрастает, над ней - убывает. Таким образом, движение по этой поверхности устойчиво. В начале процесса развития как творческая, так и ремесленная квалификация личности невелика, т.е. начальная точка находится под поверхностью переключения. Таким образом, оптимальное развитие начинается, по возможности, максимально творческой деятельностью, повышающей, наряду с соответствующей компонентой квалификации, уровень мотивации до оптимального значения. Затем следует период выполнения комплексных работ, в которых творческая и ремесленная составляющие находятся в сочетании, отвечающем движению по поверхности переключения. Затем, как показывают расчеты, во многих случаях наступает момент, когда движение по поверхности переключения становится невозможным. Тогда оптимальным оказывается выполнение работ с превалирующей ремесленной составляющей, т.е. наращивание чисто технологических навыков исследовательской деятельности. Рис. 10.7 Рис.10.8 Рис. 10.9Такая стратегия развития отличается от практики руководства и оценки исследовательских работ учащихся, особенно школьников. Обычно, ориентируя их на выполнение исследовательских работ, полагают, что им следует (рис. 10.9) давать темы, в основном связанные с изучением литературы, написанием программ по понятным алгоритмам, и оценивать результаты их деятельности по тому, насколько толсты и красиво оформлены рефераты или сложны, трудоемки и красиво оформлены программы для ЭВМ. Практика показывает, что впоследствии, в вузе, большинство таких ребят продолжает идти по проторенной ремесленной стезе или вообще перестает интересоваться исследовательской деятельностью, ограничиваясь обычной учебой. Причина состоит в том, что в них не инициированы механизмы творческого мышления и не развита мотивация. |
Методические рекомендации по подготовке к семинару Семинар является важнейшим элементом системы образования. Семинар – это не столько опрос студентов, сколько совместное с преподавателем... | Пояснительная записка Важнейшим элементом технологии является создание проблемной ситуации на основе подводящего диалога. Еще одной особенностью урока... | ||
Программа по формированию навыков безопасного поведения на дорогах... Пдд. А ведь соблюдение пдд является основополагающим элементом формирования сознания ребенка – пешехода, а в дальнейшем будущего... | Программа по формированию навыков безопасного поведения на дорогах... Математическое образование следует рассматривать как важнейшую составляющую фундаментальной подготовки специалиста. Обусловлено это... | ||
Люцина Станиславовна, 50 лет, учитель географии Необходимым элементом действия является экран, на который проецируется монитор компьютера | Факультет информационных технологий Создание и исследование моделей является неотъемлемым элементом любой целенаправленной деятельности. У термина «модель» существует... | ||
Программа по формированию навыков безопасного поведения на дорогах... Необходимым элементом действия является экран, на который проецируется монитор компьютера | Программа по формированию навыков безопасного поведения на дорогах... Одной из основных задач при изучении предметов в образовательных учреждениях является развитие познавательного интереса, интеллектуальных... | ||
Методические указания к написанию курсовых работ курсовая работа Курсовая работа является важнейшим элементом самостоятельной работы студентов. Основной целью курсовой работы является создание и... | О месте мультимедийных программ в обучении лингвострановедению на факультете мэо Поэтому при обучении иностранным языкам необходимым элементом является обучение культурологическому аспекту | ||
Программа по формированию навыков безопасного поведения на дорогах... Театр уникальный метод, рожденный Владиславом Лебедько в 1992 году, дающий шанс окунуться в переживание таинств души является важным... | Реферат По предмету: политология на тему: Политические идеологии Политическая идеология является наиболее влиятельным рационализированным (осознанным) элементом политического сознания, оказывающим... | ||
Российской федерации Курс «Маркетинг персонала» является важным элементом процесса подготовки квалифицированных бакалавров, владеющих знаниями в области... | Страхование является неотъемлемым элементом системы социально-экономических... К. Маркс и А. Маршалл уже относили страхование к необходимым условиям воспроизводства | ||
Программа по формированию навыков безопасного поведения на дорогах... Спросите у любого родителя, что он считает важнейшим элементом обучения своего ребенка, и он наверняка ответит: хорошие учителя | Франция италия Великолепно по своим вкусовым качествам оливковое масло одно из лучших в стране, абсолютно чистое, прославившееся своим зеленым цветом... |