当前位置:首页 >> 电力/水利 >>

极大值原理


Ch.7 最优控制原理

目录(1/1)


? ? ? ? ? ? ? ?



7.1 最优控制概述 7.2 变分法 7.3 变分法在最优控制中的应用 7.4 极大值原理 7.5 线性二次型最优控制 7.6 动态规划与离散系统最优控制 7.7 Matlab问题 本章小结


极大值原理(1/4)

7.4 极大值原理
? 前一节讨论的最优控制问题都基于这样一个基本假定:

? 控制量u(t)的取值范围U不受任何限制,即控制域U充满
整个r维控制空间,或者U是一个开集。 ? 即控制量u(t) 不受等式条件约束

? 但是,大多数情况下控制量总是受限制的。
例如,控制量可能受如下大小限制 |ui(t)|?a i=1,2…,r

式中,a为常数。

极大值原理(2/4)

? 上述约束条件即相当于容许控制空间U是一个超方体。
? 甚至,有些实际控制问题的控制量为某一孤立点集。 例如,继电器控制系统的控制输入限制为

ui(t)=±a i=1,2…,r
? 一般情况下,总可以将控制量所受的约束用如下不等式来表示 Mi(u(t),t)?0, i=1,2,… ? 当控制变量u(t)受不等式约束条件限制时,古典变分法就 无能为力了。 ? 以后,还会看到,最优控制u(t)往往需要在闭集的边界上 取值。 ? 这就要求人们去探索新的理论和方法。

极大值原理(3/4)

? 应用古典变分法的另一个限制条件是要求函数L(x,u,t), f(x,u,t), S(x(tf),tf)对其自变量的连续可微性,特别是要求

?H/?u存在。
? 因此,类似

J ? ? | u (t ) | dt
t0

tf

这样的有较大实际意义的性能指标泛函就无能为力了。
? 所以,类似消耗燃料最小这类常见最优控制就无法用 古典变分法来解决。

极大值原理(4/4)

? 鉴于古典变分法的应用条件失之过严 , 引起了不少数学界和 控制界学者的关注。
? 其中 , 贝尔曼的动态规划和庞特里亚金的极大值原理是 较为成功的,应用也很广泛,成为解决最优控制问题的有 效工具。 ? 本节主要介绍极大值原理的结论及其启发性证明。

? 讲授内容为
? 自由末端的极大值原理 ? 极大值原理的证明

? 极大值原理的几种具体形式
? 约束条件的处理

自由末端的极大值原理(1/8)

7.4.1 自由末端的极大值原理
? 最优控制问题的具体形式是多种多样的,在7.2节的讨论中可 知,3种泛函问题(拉格朗日问题、波尔扎问题和麦耶尔问题) 的表达形式可以互相转换。 ? 因此,与前面的方法一致,我们先研究泛函为定常的末值 型性能指标的最优控制问题 ( 麦耶尔问题 ), 然后将结论 逐步推广至其他最优控制问题。 ? 下面 , 就定常的末值型性能指标、末态自由的控制问题 来叙述极大值原理。

自由末端的极大值原理(2/8)—定理7-9

? 定理7-9(极大值原理) 设u(t)?U,t?[t0,tf],是一容许控制。 ? 指定的末值型性能指标泛函为 J[u(· )]=S(x(tf)) 式中,x(t)是定常的被控系统 ? (t ) ? f ( x(t ), u(t )), x

x(t0 ) ? x0

相应于控制量u(t)的状态轨线,tf为未知的末态时刻。
? 设使该性能指标泛函极小的最优控制函数为u*(t)、最优 状态轨线为x*(t)。

? 则必存在不恒为零的n维向量函数?(t),使得
1) ?(t)满足规范方程
τ ( x (t ), u(t )) ? H ? f ?(t ) ? ? λ ?? λ(t ) ?x ?x

自由末端的极大值原理(3/8)

满足 2) 边界条件
λ(t f ) ? ?S ( x (t f )) ?x (t f )

的解,其中哈密顿函数为
H ( x(t ), λ(t ), u(t )) ? λ? (t ) f ( x(t ), u(t )) 3)则有哈密顿函数取极小

H ( x * (t ), λ(t ), u* (t )) ? min H ( x* (t ), λ(t ), u(t )) 取代?H/?u=0 u ( t )?U


H ( x* (t ), λ(t ), u* (t )) ? H ( x* (t ), λ(t ), u(t ))

?t ?[t0 , t f ], ?u(t ) ?U

自由末端的极大值原理(4/8)

4) 沿最优轨线哈密顿函数应满足
* * * * * ? H ( x ( t ), λ ( t ), u (t f )) ? 0 t f自由 ? f f * * H ( x (t ), λ(t ), u (t )) ? ? * * H ( x ( t ), λ ( t ), u (t f )) ? 常 t f 固定 ? f f ?

???

? 下面先对上述极大值原理的涵义作简单的解释, 再给出该定理的启发性证明。

自由末端的极大值原理(5/8)

1) 容许控制条件的放宽。

? 古典变分法应用于最优控制问题 ,要求控制域 U=Rn,即控制 域U充满整个r维控制空间。
然后,从控制量的变分 ?u(t)的任意性出发 ,导出极值条件 ?H/?u=0。 这一条件是非常严格的。 ? 其一,它要求哈密顿函数H对控制量u(t)连续可微; ? 其二 , 它要求控制量的变分 ? u(t) 具有任意性 , 即控制量 u(t) 不受限制 , 或仅在受等式约束条件限制的开集中取 值。

τ ( x (t ), u(t )) ? H ? f ?(t ) ? ? λ ?? λ(t ) ?x ?x ?S ( x (t f )) λ(t f ) ? ?x (t f )
u ( t )?U

(6/8) 协态方程 自由末端的极大值原理 (7 ? 93)

横截条件

(7 ? 94) (7 ? 96)
?H/?u=0

H ( x * (t ), λ(t ), u* (t )) ? min H ( x * (t ), λ(t ), u(t ))

极值条件

2)

定理7-9中的式(7-93)和(7-94)同样称为协态方程和横 截条件,其相应求解方法与基于古典变分法的最优控制求 解方法类似。 ? 变分法的极值条件是一种解析形式, ?H/?u=0

? 而极大值原理的极值求解条件(7-96)是一种定义形式, 不需要哈密顿函数H对控制量u(t)的可微性加以约束, 而且对于通常的对u(t)的约束都是适用的, ? 例如,u(t)受不等式约束条件约束,即在闭集中取 值。

自由末端的极大值原理(7/8)

H ( x * (t ), λ(t ), u* (t )) ? min H ( x* (t ), λ(t ), u(t )) (7 ? 96)
u ( t )?U

?H/?u=0

3) 由极值求解条件(7-96)可知, 极大值原理得到的是全局最小值, 而非局部极值, 而古典变分法中由极值条件?H/?u=0得到的是局部极小值。 再则,如果把条件(7-96)仍称为极值条件, 则极大值原理得到的是强极值。 而古典变分法在欧拉方程推导时,对极值曲线x*(t)和其导 数都引入变分,得到的是弱极值。 ? 不难理解,当满足古典变分法的应用条件时,极值条件 ?H/?u=0只是极大值原理的极值求解条件(7-96)的一个 特例。

自由末端的极大值原理(8/8)

4) 在上述定理中,最优控制u*(t)使哈密顿函数取最小值。 ? 所谓“极小值原理”一词正源于此,称“极大值原理” 是习惯性叫法。 ? 若实际控制问题需求极大值,可将极值求解条件的求 最小(min)改为求最大(max)即可。

5) 极大值原理只给出最优控制的必要条件,并非充分条件。
? 得到的解是否能使泛函J最小,还有待证实。 ? 极大值原理更没有涉及解的存在性问题。 ? 如果实际问题的物理意义已经能够判定所讨论的问 题的解是存在的,而由极大值原理所求出的控制又只 有一个,可以断定,此控制就是最优控制。 ? 实际遇到的问题往往属于这种情况。

极大值原理的证明(1/2)

7.4.2 极大值原理的证明
? 庞特里亚金对极大值原理作了严格的证明 ,涉及拓扑学、实 函数分析等很多数学问题 ,这是作为工科教材难以详细论述 的。 ? 本教材利用增量法给出极大值原理的一个启发性证明。 ? 证明中所作的假设是: 1) 函数f(x,u)和S(x(tf))都是其自变量的连续函数; 2) 函数f(x,u)和S(x(tf))对于x是连续可微的,即?f/?x和?S/?x(tf) 存在且连续,但并不要求函数f(x,u)对u可微;

极大值原理的证明(2/2)

3) 为了保证微分方程解的存在和惟一性 ,假定f(x,u)在任意 有界集上对自变量x满足如下李卜希茨(Lipschitz)条件 ‖f(x1,u)-f(x2,u)‖??‖x1-x2‖ ??>0,?x1,x2?X?Rn,?u?U?Rr ? 下面叙述用增量法证明极大值原理的过程,证明步骤为: ? 泛函J的增量 ? ?x(t)的表达式 ? 对x(t)的估计

? 极值条件的推证
? ?tf的考虑 然后介绍一基于极大值原理的最优控制算例

J[u(· )]=S(x(tf))

泛函J的增量(1/2)

(1) 泛函J的增量 ? 假定末态时刻 tf已知 ,根据S(x(tf))对x(tf)的连续可微性泛函 J 的增量?J可表示为
?J ? J u* (?) ? ?u(?) ? J u* (?)
* f f * *

? ? ? ? ? S ?x (t ) ? ?x (t ) ? ? S ?x (t ) ? ?S ?x (t ) ? ? ?x (t ) ? o? ?x (t ) ?
f f

?x? (t f )

f

f

式中u*(t)和x*(t)分别表示最优控制函数及相应的最优轨线; ? ?x(t)为x(t)在最优轨线x*(tf)附近的变分; ? o(‖?x(tf)‖)表示泰勒展开式中?x(tf)的高阶项。

泛函J的增量(2/2)

? 要从?J[u*(· )]?0的条件导出最优控制必要条件, ? 首先应找出?x(t)与控制量u(t)的变分?u(t)的关系, ? 进而对?x(t)作出估计。 ? 下面为表述更简洁 , 时间函数 x(t) 与 u(t) 的时间变量 t 略去 不写。

? (t ) ? f ( x (t ), u(t )) (7 ? 92) x

?x(t)的表达式(1/3)

(2) ?x(t)的表达式 ? 根据 f(x,u) 对 x 的可微性 , 由状态方程 (7-92) 可得如下由控制 量的变分?u(t)引起的状态方程(7-92)的变分
? ? f ( x * ? ?x , u* ? ?u) ? f ( x * , u* ) ?x ?f ( x * , u* ? ?u) ? f ( x , u ? ?u) ? f ( x , u ) ? ?x ? o( ?x ) ? ?x ?f ( x* , u* ) * * * * ? ? x ? f ( x , u ? ? u ) ? f ( x , u ) ? ?x ? ?f ( x* , u* ? ?u) ?f ( x * , u* ) ? ?? ? ? ?x ? o( ?x ) ? ? ?x ?x ? ?
* * * *

?x(t)的表达式(2/3)

? 令矩阵函数Φ(t,s)为线性状态方程
?f ( x* (t ), u* (t )) ? (t ) ? ?x ?x(t ) ? ?x

的状态转移矩阵,即Φ(t,s)满足如下微分方程组
? d?(t , s) ?f ( x * (t ), u* (t )) ? ? ?(t , s) ? ? dt ?x ? ??(s, s) ? I

? 考虑到?x(t0)=0,则?x(t)在t=tf时的解为
* * * * ?x (t f ) ? ? ? (t f , s) ? f ( x ( s ), u ( s ) ? ? u ( s )) ? f ( x ( s ), u ( s)) ? ? ? ds t0 tf

??

tf

t0 tf

? ?f ( x* ( s), u* ( s) ? ?u( s)) ?f ( x * ( s), u* ( s)) ? ? (t f , s) ? ? ? ?x ( s)ds ? ? ?x ?x ? ?

? ? ? (t f , s)o( ?x ( s ) )ds
t0

?J ?

?S ? x* (t f ) ? ?x? (t f )

?x(t f ) ? o ?x(t f )

?

?

(7 ? 98)

?x(t)的表达式(3/3)

? 将上述方程代入式(7-98),则得泛函J的增量?J为
?J ? ?S ? x * (t f ) ? ?x (t f ) ? ?
?

?

tf

t0

* * * * ? (t f , s ) ? f ( x , u ? ? u ) ? f ( x , u )? ? ? ds

?S ? x * (t f ) ? ?x? (t f ) ?S ? x * (t f ) ? ?x (t f )
?

? ?

tf

t0

? ?f ( x * , u* ? ?u) ?f ( x * , u* ) ? ? (t f , s ) ? ? ? ?x ( s )ds ? ? ?x ?x ? ? ? (t f , s )o( ?x ( s ) )ds ? o ?x (t f )

tf

t0

?

?

上式虽然给出了泛函增量 ?J与?u和?x的关系,但是对一般形 式的?u,还很难估计上式的?J。

? 因为对任意的?u,上式成立,故对特定的?u也应成立。
? 为此,下面讨论取一特定的变分?u,以利于对上式的估计。

对x(t)的估计(1/11)

(3) 对x(t)的估计 ? 设 ?u(t) 是控制 u(t) 的任意变分 , 对应x(t) 的增量 ?x(t)应满足如 下方程
? (t ) ? f ( x ? ?x, u ? ?u) ? f ( x, u) ??x ? ??x (t0 ) ? 0

? 将上式的第一式改写为
? ? f ( x ? ?x, u ? ?u) ? f ( x, u ? ?u) ? f ( x, u ? ?u) ? f ( x, u) ?x

? ? f ( x ? ?x, u ? ?u) ? f ( x, u ? ?u) ? f ( x, u ? ?u) ? f ( x, u) (7 ? 105) 对x(t)的估计(2/11) ?x

? 对于给定的 u(t) 和 ? u(t), 由于它们的分段连续性 , 必存在有界 的 U1?U 及 X?Rn, 使 u(t)+?u(t)?U1,x(t)?X, 对所有的 t?[t0,tf], 根 据李卜希茨条件,必存在?>0,满足 ‖f(x+?x,u+?u)-f(x,u+?u)‖<?‖?x‖ ? 且由f(x,u) 对 u 的连续性 , 对有界的 u(t) 和 ?u(t), 存在 b(t)>0, 则 ‖f(x,u+?u)-f(x,u)‖?|b(t)| ?t?[t0,tf] 其中
?u(t ) ? 0 ?0 b(t ) ? ? ?b ? 0 ?u(t ) ? 0

? 于是由式(7-105)可知,?x(t)满
? (t ) ? a ?x(t ) ? b(t ) ?x

对x(t)的估计(3/11)—引理7-2

? 为了作进一步的估计,下面先引入一个引理。 ? 引理7-2
d ? ?x ? ?x dt

? 证明 由欧几里德范数(2-范数)的定义,有
? n ? ?x ? ? ? ?xi2 ? ? i ?1 ?
1/ 2

? 从而有
d 1 ?x ? dt 2 ?x ? ?x ?x ? ?x? ?x ? ?i ? 2?xi ?x ? ? ?x ? ?x ?x i ?1
n

证毕

? (t ) ? a ?x(t ) ? b(t ) (7 ? 109) ?x d ? ?x ? ?x dt 引理7 ? 2

对x(t)的估计(4/11)

? 因此,由引理7-2和式(7-109),有
d ?x(t ) ? a ?x(t ) ? b(t ) dt


d ?x(t ) ? a ?x(t ) ? b(t ) dt

? 将两边乘以e-?t,得
d ? at e ?x(t ) ? ? e?at b(t ) ? dt

? 解得
?x (t ) ? ? e a (t ?s )b(s)ds
t0 t

对x(t)的估计(5/11)

? 至今我们还没有对?u(t)作任何限制。 ? 为了使变分后的控制u(t)仍属于容许控制空间,即u(t)?U, 对所有的t?[t0,tf],并且利于导出极值求解条件,采用一种 异于古典变分的特定形式的变分--针状变分。 ? 令σ为最优控制u*(t)的任意一个 连续点,l>0是某一确定的数,?>0 是一个充分小的数。

? 可将控制量的变分?u(t)取成一 个依赖于σ,l和?的针状变分,如图 7-5所示。
图7-5 针状变分示意图

对x(t)的估计(6/11)

? 上述针状变分记为?σ?u(t),可表示为
t ? [? , ? ? ?l ] ?u u (t ) ? ??? u(t ) ? ? * ?u (t ) 其它
*

式中, u ?U表示任意容许控制,这就是说,在充分小的时间区 间[σ,σ+?l]内, 可以取控制域 U内的任何点。 u ? 当然,也可以取闭集上的点。 ? 所以变分
??? u(t ) ? u ? u* (t ) t ?[? ,? ? ? l ]

? 是一个有限量。 ? 但当?是一个充分小的量时,则由?σ?u(t)所引起的变分 ?σ?x(t)仍可能是一个充分小的量。

?u(t ) ? 0 ?0 b(t ) ? ? (7 ? 108) ?b ? 0 ?u(t ) ? 0 ?x (t ) ? ? ea (t ? s ) b( s )ds
t0 t

对x(t)的估计(7/11)

(7 ? 111)

? 下面证明由针状变分?σ?u(t)引起的状态增量?σ?x(t)是一个与? 同阶的无穷小量。
? 事实上,当控制量作针状变分时,式(7-108)可表示为
?b ? 0 t ? [? , ? ? ? l ] b(t ) ? ? 其它 ?0

? 于是,由式(7-111)可知,由针状变分?σ?u(t)引起的状态增量 ?σ?x(t)为
??? x (t ) ? ? e
t0 t a (t ? s )

b( s )ds ? ? e
t0 at f

tf

a (t f ? s )

b(s )ds
at f

?e

at f

?

tf

t0

b( s)ds ? e

??

? ?? l

bds ? b? le

? 上式表明,‖?σ?x(t)‖与?>0是同阶无穷小量。

?J ?

?S ? x * (t f ) ? ?x? (t f ) ? ?

?

tf

t0

? (t f , s ) ? ? f ( x , u ? ?u) ? f ( x , u ) ? ? ds
* * * *

对x(t)的估计(8/11)

?S ? x * (t f ) ? ?x? (t f ) ?S ? x * (t f ) ? ?x? (t f )

? ?

tf

t0

? ?f ( x* , u* ? ?u) ?f ( x * , u* ) ? ? (t f , s ) ? ? ? ?x ( s)ds ?x? ?x? ? ? ? (t f , s )o( ?x ( s ) )ds ? o ?x (t f )

tf

t0

?

?

(7 ? 103)

? 据此,由式(7-103)可得如下由针状变分?σ?u(t)所引起的泛函 J的变分?σ?J的表达式
??? J ? ?S ? x* (t f ) ? ?x? (t f ) ? ?

??

? ?? l

* * * * ?(t f , s ) ? f ( x , u ? ? u ) ? f ( x , u )? ?? ? ? ds

?S ? x* (t f ) ? ?x? (t f ) ?S ? x* (t f ) ? ?x (t f )
?

?? ??

? ?? l

? ?f ( x * , u* ? ?u) ?f ( x * , u* ) ? ?(t f , s ) ? ? ? ??? xds ? ? ?x ?x ? ? ?(t f , s )o( ?x?? ( s ) )ds ? o ??? x (t f )

? ?? l
?? l

?

?

??? J ?

?S ? x* (t f ) ? ?x? (t f ) ? ?

??

? ?? l

?(t f , s ) ? ? f ( x , u ? ??? u) ? f ( x , u ) ? ? ds
* * * *

对x(t)的估计(9/11)

?S ? x* (t f ) ? ?x? (t f ) ?S ? x* (t f ) ? ?x? (t f )

?? ??

? ?? l

? ?f ( x * , u* ? ?u) ?f ( x * , u* ) ? ?(t f , s ) ? ? ? ??? xds ?x? ?x? ? ? ?(t f , s )o( ?x?? ( s ) )ds ? o ??? x (t f )

? ?? l
?? l

?

?

? 上式中后 3 项都是 ? 的高阶无穷小量 , 可归并成一项 , 则上 式可记为
??? J ? ?
? ?? l

?S ? x* (t f ) ? ?x? (t f )

?

* * * * ?(t f , s) ? f ( x , u ? ? u ) ? f ( x , u )? ?? ? ? ds ? o ?? ?

对x(t)的估计(10/11)

? 上式中后 3 项都是 ? 的高阶无穷小量 , 可归并成一项 , 则上 式可记为
λ? (s) ? ?S ? x* (t f ) ? ?x (t f )
?

?(t f , s)

? 则向量?(t)必满足状态方程的协态方程及边界条件
τ ( x * (t ), u* (t )) ? f ?(t ) ? ? λ λ(t ) ?x

λ (t f ) ?

?

?S x * (t f ) ?x? (t f )

?

?

??? J ? ?

? ?? l

?S ? x* (t f ) ? ?x? (t f )

?

?(t f , s) ? ? f ( x , u ? ??? u) ? f ( x , u ) ? ? ds ? o ?? ? (7 ? 116)
* * * *

对x(t)的估计(11/11)

?f τ ( x * (t ), u* (t )) ? λ(t ) ? ? λ(t ) (7 ? 118) ?x

? 若记
H ( x(t ), λ(t ), u(t )) ? λ? (t ) f ( x(t ), u(t ))

则共轭方程(7-118)可写成
* * H ( x ( t ), λ ( t ), u (t )) ? λ(t ) ? ? ?x

? 于是,泛函增量表达式(7-116)可改写成
??? J ? ? ??
? ?? l ? ?? l ? ?
* * * * λ? ? f ( x , u ? ? u ) ? f ( x , u )? ?? ? ? ds ? o ? ? ? * * * * ? H ( x , λ , u ? ? u ) ? H ( x , λ , u )? ?? ? ? ds ? o ? ? ?

??? J ? ?

? ?? l

?

* * * * ? H ( x , λ , u ? ? u ) ? H ( x , λ , u )? ?? ? ? ds ? o ?? ? (7 ? 122)

极值条件的推证(1/4)

(4) 极值条件的推证

? 已假设u*(t)是使泛函J取最小值的最优控制,x*(t)为相应的轨 线,而?(t)是协态方程的解。
? 所以,对任意的控制变分,当然也包含对u(t)的针状变分,泛 函的增量(7-122)必满足
??? J ? ?
? ?? l ?
* * * ? H ( x , λ , u ? ? u ) ? H ( x , λ , u )? ?? ? ? ds ? o ? ? ? ? 0

? 因为x*(t)和?(t)在t?[t0,tf]范围内是连续函数,而u*(t)和 u =u*(t)-?σ?u(t)在上式的积分范围内也是连续的 ,所以哈 密顿函数H是一连续函数。

??? J ? ?

? ?? l

?

* * * ? ? H ( x , λ, u ? ??? u) ? H ( x, λ, u ) ? ? ds ? o ? ? ? ? 0 (7 ? 123)

极值条件的推证(2/4)

? 根据中值定理及H的连续性,则有

??

? ?? l

* * * * ? H ( x ( s ), λ ( s ), u ( s ) ? ? u ( s )) ? H ( x ( s ), λ ( s ), u ( s)) ? ?? ? ? ds * * * * ? ?l ? H ( x ( t ), λ ( t ), u ( t ) ? ? u ( t )) ? H ( x ( t ), λ ( t ), u (t )) ? ?? ? ?

t ?? ? ?? l

* * * * ? ?l ? H ( x ( ? ), λ ( ? ), u ( ? ) ? ? u ( ? )) ? H ( x ( ? ), λ ( ? ), u (? )) ? ?? ? ? ? o(? )

式中,0<β<1。
? 将上式代入式(7-123),可得
* * * * ??? J ? ? l ? H ( x ( ? ), λ ( ? ), u ( ? ) ? ? u ( ? )) ? H ( x ( ? ), λ ( ? ), u (? ))? ?? ? ? ? o ?? ? ? 0

? 用?除上式的两边,得
o ?? ? * * * * ? ? l ? H ( x (? ), λ(? ), u (? ) ? ??? u(? )) ? H ( x (? ), λ(? ), u (? )) ? ? ?0 ?

l? ? H ( x (? ), λ(? ), u (? ) ? ??? u(? )) ? H ( x (? ), λ(? ), u (? )) ? ??
* * * *

o ?? ?

?

?0

极值条件的推证(3/4)

? 当?→0时,考虑到l>0,则有
H ( x* (? ), λ(? ), u(? )) ? H ( x* (? ), λ(? ), u* (? )) ? 0

或写作
H ( x* (? ), λ(? ), u* (? )) ? H ( x* (? ), λ(? ), u(? ))

? 上式对于区间[t0,tf]内u*(t)的所有连续点都成立。

? 考虑到 u 要取遍容许控制域 U中所有的点,因此,上式也 可表示为
H ( x * (? ), λ(? ), u* (? )) ? min H ( x * (? ), λ(? ), u (? ))
u (? )?U

? 式中,σ同样是区间[t0,tf]内u*(t)的任意连续点。

H ( x* (? ), λ(? ), u* (? )) ? min H ( x* (? ), λ(? ), u (? )) (7 ? 127)
u (? )?U

极值条件的推证(4/4)

? 由于假定u(t)是分段连续函数,而u*(t)的不连续点上的函 数值如何,并不影响控制效果,因此,不妨认为(7-127)对于 任意的σ?[t0,tf]都成立。

? 这就是说,如果u*(t)?U,t?[t0,tf]是最优控制,则对所有 t?[t0,tf]都必须满足
H ( x * (t ), λ(t ), u* (t )) ? min H ( x* (t ), λ(t ), u(t ))
u ( t )?U

从而证明了极值条件。

J[u(· )]=S(x(tf))

?tf的考虑(1/9)

(5) ?tf的考虑

? 前面仅仅考虑了末态时刻tf已经给定的情况。
? 当 tf 可变时 , 还要考虑由 tf 的改变量 ? tf 所引起的泛函改变 量。

? 设u*(t)、是使性能指标泛函最小的最优解 ,x*(t)是相应的 最优轨线。
? 若令tf的改变量?tf=?T1,其中T1为任意常数 ,并同时考虑控 制u(t)的针状变分?σ?u(σ)。

J[u(· )]=S(x(tf))

?tf的考虑(2/9)

? 根据S(x(tf))的可微性 ,则有
?J ? ? ? ?S ? x * (t * f )? ?x? ?S ? x * (t * f )? ?x? ?S ? x * (t * f )? ?x? ?x (t * f ? ?t f ) ? o(? )

? ?x(t

* f

? * (t * )? x f ) ?t f ? ? o(? )

* * * * * ? ? x ( t ) ? f ( x ( t ), u (t f ))? T1 ? f f ? ? ? o(? )

? 上式对任意T1及任意控制变分均成立,自然对?u(t)?0时也 成立。 ? 当?u(t)?0时,显然有?u(tf)=0。 ? 考虑到T1为任意实数,于是可得
?S x * (t * f ) ?x?

?

? f ( x (t
*

* f

), u* (t * f )) ? 0

* * * * * ? t f自由 ? H ( x (t f ), λ(t f ), u (t f )) ? 0 H ( x (t ), λ(t ), u (t )) ? ? (7 ? 97) * * H ( x ( t ), λ ( t ), u ( t )) ? constant t 固定 ? f f f f ? * *

?tf的考虑(3/9)

?S ? x* (t * f )? ?x
?

* * f ( x* (t * f ), u (t f )) ? 0

? 因此,有
* * * ? * * * * H ( x* (t * ), λ ( t ), u ( t )) ? λ ( t ) f ( x ( t ), u (t f )) f f f f f

?

?S ? x* (t * f )? ?x?

* * f ( x* (t * (7 ? 128) f ), u (t f )) ? 0

从而证明了式(7-97)的第1部分。 ? 当取T1=0,对于针状变分?σ?u(t)应有
??? J ? ?S x * (t * f ) ?x
?

?

? ?x(t

* f

) ? o(? ) ? 0

? 因此,依上述证明过程(1)~(4),同样可以证明式(7-128)成 立。

* * * * * ? t f自由 ? H ( x (t f ), λ(t f ), u (t f )) ? 0 H ( x (t ), λ(t ), u (t )) ? ? (7 ? 97) * * H ( x ( t ), λ ( t ), u ( t )) ? constant t 固定 ? f f f f ? * *

?tf的考虑(4/9)

? 下面证明当tf固定,x(tf)自由时,式(7-97)的第2部分的证明。 ? 哈密顿函数H的增量可表示为
?H ( x* (t ), λ(t ), u* (t )) ? H ( x* (t ? ?t ), λ(t ? ?t ), u* (t ? ?t )) ? H ( x* (t ), λ(t ), u* (t )) ? H ( x* (t ? ?t ), λ(t ? ?t ), u* (t ? ?t )) ? H ( x* (t ), λ(t ), u* (t ? ?t )) ? H ( x* (t ), λ(t ), u* (t ? ?t )) ? H ( x* (t ), λ(t ), u* (t ))

? 考虑到哈密顿函数 H(x,?,u)对x和u的连续可微性 ,因此, 由泰勒展开式可得哈密顿函数的一阶增量表示式

?tf的考虑(5/9)

?H ( x* , λ, u* ) * * ? ?H ( x (t ), λ(t ), u (t )) ? x ( t ? ? t )) ? x (t ) ? ? ? ? ?x ?H ( x* , λ, u* ) ? ? λ(t ? ?t )) ? λ(t )? ? ?λ ? H ( x* (t ), λ(t ), u* (t ? ?t )) ? H ( x* (t ), λ(t ), u* (t )) ?(t ) x ?(t )?t ? * (t )?t ? x ? * (t ) λ ? ?λ
* *

? H ( x* (t ), λ(t ), u* (t ? ?t )) ? H ( x* (t ), λ(t ), u* (t )) ? H ( x* (t ), λ(t ), u* (t ? ?t )) ? H ( x* (t ), λ(t ), u* (t ))

? 若定义u =u*(t+?t),则由上式有如下H的一阶增量式
?H ( x* (t ), λ(t ), u* (t )) ? H ( x* (t ), λ(t ), u(t )) ? H ( x* (t ), λ(t ), u* (t ))

? 因此,考虑到u*(t)是最优控制函数,由极值条件则有
?H ( x* (t ), λ(t ), u* (t )) ? 0

* * * * * ? H ( x ( t ), λ ( t ), u (t f )) ? 0 t f自由 ? f f H ( x* (t ), λ(t ), u* (t )) ? ? (7 ? 97) * * ? ? H ( x (t f ), λ(t f ), u (t f )) ? constant t f 固定 * * * H ( x* (t * (7 ? 128) f ), λ(t f ), u (t f )) ? 0

?tf的考虑(6/9)

? 考虑到时间增量?t的任意性,其值可正可负。 ? 因此,由上式可知,当?t>0时,?H?0,则意味着哈密顿函 数H随时间t递增;

? 而当?t<0时,?H?0则意味着哈密顿函数H随时间t 递减。
? 故证明了
H ( x* (t ), λ(t ), u* (t )) ? 常数

即证明了式(7-97)的第2部分。 ? 综合式(7-128)和上式,即证明了式(7-97)。
□△

?tf的考虑(7/9)—例7-10

? 例7-10 给定被控系统
?1 ? ? x1 ? u ?x , ? ?2 ? x1 ?x ?1 ? x (0) ? ? ? ?0 ?

控制变量u(t)受不等式约束
-1?u(t)?1 约束,试求最优控制函数u*(t)和最优轨线x*(t),使性能指标泛函 J=x2(1) 最小。

?1 ? ? x1 ? u ?x , ? ? x ? x ? 2 1

?1 ? x (0) ? ? ? ?0 ?

-1?u(t)?1 J=x2(1)

? 解 该问题的哈密顿函数为 则协态方程是

τ ?(t ) ? ? ?H ? ? ?f ( x (t ), u(t )) λ(t ) λ (7 ? 93) ?tf的考虑(7/9) ?x ?x ?S ( x (t f )) λ(t f ) ? (7 ? 94) ?x (t f ) H ( x* (t ), λ(t ), u* (t )) ? min H ( x* (t ), λ(t ), u(t )) (7 ? 96)
u ( t )?U

H ? ?1 (? x1 ? u ) ? ?2 x1
?H ? ?1 ? ? ? ?1 ? ?2 ?x1 ?H ? ?2 ? ? ?0 ?x2

其末端条件(横截条件)为
?1 (1) ?
?S ?0 ?x1

?2 (1) ?

解之得

?S ?1 ?x2

?1(t)=1-et-1 ?2(t)=1

?1(t)=1-et-1 ?2(t)=1

?tf的考虑(8/9)
H ? ?1 (? x1 ? u ) ? ?2 x1

? 运用极大值原理
H ( x* (t ), λ(t ), u* (t )) ? min H ( x* (t ), λ(t ), u(t ))
u ( t )?U * * ? min ?1 (? x1 ? u ) ? ?2 x1 1? u ( t ) ?1 1? u ( t ) ?1 * * ? min ? ?1 x1 ? ?2 x1 ? ?1u * * ? ??1 x1 ? ?2 x1 ? min ?1u 1? u ( t ) ?1

-1?u(t)?1

解得
??1 ?1 (t ) ? 0 u * (t ) ? ? ??1 ?1 (t ) ? 0

? 由于?1(t)=1-et-1>0,t?[0,1],于是,可得 u*(t)=-1 t?[0,1]

?1

(t)=1-et-1

?2(t)=1

?tf的考虑(9/9)

? 因此,由
* * * ?1 x ? ? x1 ? u* ? ? x1 ?1

x1 (0) ? 1


* x1 (t ) ? 2e?t ? 1

? 同样,可求得
* x2 (t ) ? ?2e?t ? t ? 2

? 因此,该问题的最优控制函数u*(t)和最优轨线x*(t)分别为
u * (t ) ? ?1
* x1 (t ) ? 2e ? t ? 1 * x2 (t ) ? ?2e ? t ? t ? 2

极大值原理的几种具体形式 (1/1)

7.4.3 极大值原理的几种具体形式
? 前面讨论了定常系统的定常末值型性能指标、末态自由的最 优控制问题的极大值原理。 ? 经数学变换,上述最优控制问题的极大值原理的结论可以 推广至

? 时变系统、
? 积分型或复合型性能指标 等控制问题的最优控制中,无需重新进行细致的证明。 ? 下面将给出几种具体的极大值原理形式和分析证明的思 路。

时变情况(1/7)

1. 时变情况
? 如果描述最优控制问题的一些函数,如状态方程的f(· )中显含 时间t,或末值型性能指标S(· )中显含时间tf,则该问题称为时变 (非定常)的,并可描述如下。 ? 时变系统最优控制问题 对时变的被控系统
? (t ) ? f ( x(t ), u(t ), t ), x x(t0 ) ? x0

? 求一容许控制u(t)?U,t?[t0,tf],使如下末值型性能指标 泛函取极值。 J[u(· )]=S(x(tf),tf))

时变情况(2/7)

? 对于时变问题, 可以先通过引进新的状态变量的方法将时变的问题变换 成定常的问题, 再应用定常问题的极大值原理 ( 定理 7-9), 便可推导出时 变问题的极大值原理。 ? 对时变的状态方程和性能指标,引入如下辅助状态变量 xn+1(t)=t 使其满足辅助状态方程 和初始条件

?n ?1 (t ) ? 1 x
xn+1(t0)=t0 xn+1(tf)=tf

? (t ) ? f ( x(t ), u(t ), t ), x

x(t0 ) ? x0

?n ?1 (t ) ? 1 x

时变情况(3/7)

J[u(· )]=S(x(tf),tf))

? 则上述时变的状态方程和性能指标泛函可分别变换为如下 定常的状态方程和性能指标泛函
? (t ) ? ? f ( x (t ), u(t ), t ) ? ? x ?? ?x ? ? ? ( t ) 1 ? ? n ?1 ? ? J [u(?)] ? S ( x (t f ), xn ?1 (t f ))

? 对上述辅助的定常最优控制问题 , 应用极大值原理 ( 定理 7-9),则有如下时变最优控制问题的极大值原理。

时变情况(4/7)—定理7-10

? 定理 7-10( 时变系统极大值原理 ) 时变系统最优控制问题的 最优控制函数 u*(t) 、最优状态轨线 x*(t) 和协态向量函数 ? (t) 使得:

1) x*(t)和?(t)满足规范方程
?H ( x, u, λ, t ) ? f ( x (t ), u(t ), t ) ?λ τ ( x (t ), u(t ), t ) ? H ( x , u , λ , t ) ? f ?(t ) ? ? λ ?? λ(t ) ?x ?x ? (t ) ? x

式中,哈密顿函数为

H ( x(t ), λ(t ), u(t ), t ) ? λ? (t ) f ( x(t ), u(t ), t )

时变情况(5/7)

2) 边界条件
x(t0 ) ? x, λ(t f ) ? ?S ( x(t f ), t f ) ?x (t f )

3) 哈密顿函数H作为u(t)?U的函数,在u(t)=u*(t),t?[t0,tf]时取 绝对极小,即
H ( x * (t ), λ(t ), u* (t ), t ) ? min H ( x* (t ), λ(t ), u(t ), t )
u ( t )?U


H ( x* (t ), λ(t ), u* (t ), t ) ? H ( x* (t ), λ(t ), u(t ), t ) ?t ?[t0 , t f ], ?u(t ) ?U

4) 在最优轨线的末端,哈密顿函数应满足
* * * * H ( x * (t * ), λ ( t ), u ( t ), t f f f f )?? * ?S ( x * (t * ), t f f )

?t f

时变情况(6/7)

5) 沿最优轨线哈密顿函数满足如下关系
H ( x (t ), λ(t ), u (t ), t ) ? H ( x (t ), λ(t ), u (t ), t ) ? ? *
* * * * f * f * * f * f tf t

?H ( x* , λ, u* , s) ds ?s

??? ? 定理7-10的证明可直接应用定常情况的极大值原理(定理7-9) 给出(略)。

时变情况(7/7)

? 比较定理 7-10 和定理 7-9可知, 时变性并没有改变极大值原理的规 范方程、横截条件及极值条件 , 却改变了最优轨线末端哈密顿函 数的值。

? 在定常情况下,沿最优轨线哈密顿函数的值为常数(当tf自由时 * * * * * 为零), ? t f自由 ? H ( x (t f ), λ(t f ), u (t f )) ? 0
H ( x* (t ), λ(t ), u* (t )) ? ? * * H ( x ( t ), λ ( t ), u (t f )) ? 常 t f 固定 ? f f ?

而时变时却不是常数,它由定理7-10的条件5)决定。
H ( x (t ), λ(t ), u (t ), t ) ? H ( x (t ), λ(t ), u (t ), t ) ? ? *
* * * * f * f * * f * f tf t

?H ( x* , λ, u* , s) ds ?s

? 值得指出的是 , 定理 7-10 的条件 (5) 不是求解该最优控制问题的必 要条件,只是描述最优轨线上哈密顿函数的一个性质。 ? 定理 7-10 的前 4 个条件才是必要的 , 由它们已经能决定出最优 控制函数u*(t)、最优轨线x*(t)和最优末态时刻tf*。

2. 积分型性能指标
? 最优控制的极大值原理讨论的性能指标泛函为末值型的, 实际上许多控制问题的指标函数为积分型。 ? 对该类性能指标函数的控制问题可描述如下。 ? 积分型泛函最优控制问题 对定常的被控系统(7-92),求容 许控制 u(t)?U,t?[t0,tf], 使如下积分型性能指标泛函取极 值。 ? (t ) ? f ( x (t ), u(t )) (7 ? 92) x
J [u(?)] ? ? L( x (t ), u(t ), t )dt
t0 tf

J[u(· )]=S(x(tf))

J [u(?)] ? ? L( x(t ), u(t ), t )dt (7 ? 138)
t0

tf

积分型性能指标(2/7)

? 对积分型泛函指标(7-138),引入辅助状态变量x0,使其满足 则有
?0 (t ) ? L( x(t ), u(t )). x0 (t0 ) ? 0 x

J [u(?)] ? ? L( x(t ), u(t ))dt ? x0 (t f )
t0

tf

J[u(· )]=S(x(tf))

则上述积分型性能指标泛函的最优控制问题可变换成状态方程 和末值型性能指标泛函分别为
?0 (t ) ? ? L( x (t ), u(t )) ? ?x ?? ?x ? ? ? ( t ) f ( x ( t ), u ( t )) ? ? ? ? J [u(?)] ? x0 (t f )

的最优控制问题。

积分型性能指标(3/7)—定理7-11

? 对上述辅助的最优控制问题 ,应用极大值原理 (定理7-9),则 有如下积分型性能指标泛函的最优控制问题的极大值原理。

? 定理7-11(积分型泛函极大值原理) 积分型泛函最优控制问 题的最优控制函数u*(t)、最优状态轨线x*(t)和协态向量函数 ?(t),使得:
1) x*(t)和?(t)满足规范方程
?H ( x, u, λ) ? f ( x (t ), u(t )) ?λ τ ( x (t ), u(t )) ? H ( x , u , λ ) ? L ( x ( t ), u ( t )) ? f ?(t ) ? ? λ ?? ? λ(t ) ?x ?x ?x ? (t ) ? x

式中,哈密顿函数为
H ( x(t ), λ(t ), u(t )) ? L( x(t ), u(t )) ? λ? (t ) f ( x(t), u(t))

积分型性能指标(4/7)

2) 边界条件
x(t0 ) ? x, λ(t f ) ? 0

3) 哈密顿函数H作为u(t)?U的函数,在u(t)=u*(t),t?[t0,tf]时取 绝对极小,即
H ( x * (t ), λ(t ), u* (t )) ? min H ( x* (t ), λ(t ), u(t ))
u ( t )?U


H ( x* (t ), λ(t ), u* (t )) ? H ( x* (t ), λ(t ), u(t )) ?t ?[t0 , t f ], ?u(t ) ?U

4) 在最优轨线的末端,哈密顿函数应满足
* * * * * ? t f自由 ? H ( x (t f ), λ(t f ), u (t f )) ? 0 H ( x (t ), λ(t ), u (t )) ? ? * * H ( x ( t ), λ ( t ), u (t f )) ? constant t f 固定 ? f f ? * *

积分型性能指标(5/7)

? 定理7-11的证明可直接应用定常情况的极大值原理(定理7-9) 给出(略)。 ? 比较定理7-11和定理7-9可知,积分型性能指标泛函的极 大值原理与末值型性能指标的极大值原理相比 , 除哈密 顿函数H的定义和协态变量向量函数?(t)的边界条件有一 定区别之外,其他条件与结论基本一致。

积分型性能指标(6/7)

? 不难验证,若性能指标泛函为复合型的,即
J [u(?)] ? S ( x(t f )) ? ? L( x(t ), u(t ))dt
t0 tf

则相应的哈密顿函数为 H ( x(t ), λ(t ), u(t )) ? L( x(t ), u(t )) ? λ? (t ) f ( x(t ), u(t ))

? 复合型性能指标泛函的最优控制问题的极大值原理与积 分型性能指标泛函的基本一致,
但协态变量向量函数?(t)的边界条件(横截条件)变为
λ(t f ) ? ?S ( x (t f )) ?x (t f )

? 可见末值型性能指标不影响哈密顿函数的定义,但会影响 边界条件(横截条件)。

积分型性能指标(7/7)

? 上面讨论的是时变的、末值型性能指标泛函的最优控制问题, 和定常的、积分型性能指标泛函的最优控制问题的极大值原 理。

? 由于前面所述的各种最优控制问题经数学变换都可等效 到同一类型的最优控制问题来处理,故其他情况的最优控 制问题的极大值原理可由定理 7-9、定理7-10和定理7-11 推广而得。

自由末端的极大值原理(1/1)

7.4.4 自由末端的极大值原理
? 前面讨论了自由末端问题的极大值原理,下面考虑存在 ? 末态约束及 ? 积分型限制 的最优控制问题。

末态约束问题(1/6)

1. 末态约束问题
? 末态x(tf)受约束的控制问题可描述如下。
? 末态约束最优控制问题 对定常的被控系统(7-92),其末态 满足约束(目标集M)
M :{g1 (x(t f ))=0, g2 (x(t f )) ? 0}

式中,g1(x(tf))和g2(x(tf))分别表示p维和q维关于x(tf)的连续可 微向量函数。

? 求一容许控制 u(t)?U,t?[t0,tf], 使末值型性能指标 (791)取极值。
J [u(?)] ? S ( x (t f )) ? (t ) ? f ( x (t ), u(t )) x (7 ? 91) (7 ? 92)

M :{g1 (x(t f ))=0,

g2 (x(t f )) ? 0} (7 ? 144)

末态约束问题(2/6)

? 末态约束(7-144)中末态时刻tf是状态轨线x(t)与目标集M首次 相遇的时刻。 ? 若式(7-144)中性能指标含有末值项tf , p<n;否则,p?n。 ? 而维数q不受限制。 ? 与自由末端问题不同 , 现在要求末态 x(tf) 只能落在由约束条 件(7-144)所规定的目标集上。 ? 对于这种约束条件下的泛函极值问题 , 如同等式和不等 式约束下求函数极值一样 ,通过引入拉格朗日乘子 ?和?, 将末态约束化为等价的末值型性能指标 J1[u(· )]=S(x(tf)) + ?? g1(x(tf)) + ?? g2(x(tf)) 式中,?和?为不同时为零的p维和q维常向量。

末态约束问题(3/6)

? 类似不等式约束的函数极值问题的库恩-塔克尔定理 , 考虑不等式约束条件的乘子要满足约束条件

? i g2i ( x(t f )) ? 0

? i ? 0, i ? 1,2,..., q

? 类似于前面定常的末值型性能指标泛函的最优控制问题的 极大值原理的证明,有如下末态受等式和不等式条件约束的 定常末值型性能指标泛函的最优控制问题的极大值原理。

末态约束问题(4/6)—定理7-12

? 定理7-12(末态约束极大值原理)末态约束最优控制问题的最 优控制函数为 u*(t) 、最优状态轨线为 x*(t) 和协态向量函数 ?(t),以及不同时为零的p维常向量?和q维常向量?,使得:

1) x*(t)和?(t)满足规范方程
?H ( x, u, λ) ? f ( x (t ), u(t )) ?λ τ ( x (t ), u(t )) ? H ( x , u , λ ) ? f ?(t ) ? ? λ ?? λ(t ) ?x ?x ? (t ) ? x

式中,哈密顿函数为
H ( x(t ), λ(t ), u(t )) ? λ? (t ) f ( x(t ), u(t ))

末态约束问题(5/6)

2) 边界条件
x (t0 ) ? x, λ(t f ) ? ?S ( x (t f )) ?x (t f ) ?
? ?g1 ( x (t f ))

?x (t f )

μ?

?g? 2 ( x (t f )) ?x (t f )

ν

g1 (x (t f ))=0

g2 (x (t f )) ? 0

? i g 2i ( x (t f )) ? 0

? i ? 0, i ? 1, 2,..., q

? 3) 哈密顿函数H作为u(t)?U的函数,在u(t)=u*(t),t?[t0,tf]时 取绝对极小,即
H ( x * (t ), λ(t ), u* (t )) ? min H ( x* (t ), λ(t ), u(t ))
u ( t )?U


H ( x* (t ), λ(t ), u* (t )) ? H ( x* (t ), λ(t ), u(t )) ?t ?[t0 , t f ], ?u(t ) ?U

末态约束问题(6/6)

4) 在最优轨线的末端,哈密顿函数应满足
* * * * * ? H ( x ( t ), λ ( t ), u (t f )) ? 0 t f自由 ? f f * * H ( x (t ), λ(t ), u (t )) ? ? * * H ( x ( t ), λ ( t ), u (t f )) ? constant t f 固定 ? f f ?

? 上面给出的是末态受约束的定常性能指标泛函的最优控制问 题的极大值原理,对于其他情况, ? 如时变的、积分型的或复合型的性能指标泛函的最优控 制问题的极大值原理, ? 可参照定理7-12及相应的定理7-10或定理7-11得到。 ? 这里不再进行详细讨论。

积分约束问题(1/7)

2. 积分约束问题
? 实际被控系统由于所处环境的复杂性 ,所受的限制、约束条 件是各异的。
? 例如,航天器材上要求总的消耗能量是有限的。 ? 这些约束条件有时可用对状态变量x(t)和控制变量u(t)的 积分型约束条件来表示。 ? 这类有积分型约束条件的最优控制问题可描述如下。

? (t ) ? f ( x (t ), u(t )) x
tf t0

(7 ? 92)

积分约束问题(2/7)

J [u(?)] ? ? L( x (t ), u(t ), t )dt (7 ? 138)

? 积分型约束最优控制问题 对定常的被控系统(7-92),其系统 状态轨线x(t)和控制函数u(t)满足积分型约束
J1 ? ? L1 ( x (t ), u(t ))dt ? 0
t0 tf tf

J 2 ? ? L2 ( x (t ), u(t ))dt ? 0
t0

式中,L1(x(t),u(t))和L2(x(t),u(t))分别为k维和l维向量函数。
? 求一容许控制 u(t)?U,t?[t0,tf], 使积分型性能指标 (7-138) 取极值。 ? 处理这类问题与前面类似 ,同样可以先采用引进新的状态变 量的方法将受上述积分限制的最优控制问题转换到前面已 经讨论过的最优控制问题 ,从而获得该最优控制问题的极大 值原理。

积分约束问题(3/7)
J ? ? L( x(t ), u(t ))dt
t0 tf

J1 ? ? L1 ( x(t ), u(t ))dt ? 0 J 2 ? ? L2 ( x(t ), u(t ))dt ? 0
t0 t0

tf

tf

? 如,引入辅助状态变量x0,x1和x2如下
?0 (t ) ? L( x (t ), u(t )), x ?1 (t ) ? L1 ( x (t ), u(t )), x

x0 (t0 ) ? 0 x1 (t0 ) ? 0 x2 (t0 ) ? 0

? 2 (t ) ? L2 ( x (t ), u(t )), x

则积分型性能指标泛函变换为辅助末值型性能指标泛函 J[u(· )]=x0(tf) 上述积分型约束变换为如下辅助状态变量的末端条件

x1(tf)=J1=0 x2(tf)=J2?0
那么,再应用极大值原理 , 可推导得受积分限制的、积分型 性能指标泛函指标的最优控制的极大值原理。

积分约束问题(4/7)—定理7-13

? 定理7-13(积分型约束极大值原理) 积分型约束最优控制问题 的最优控制函数 u * (t) 、最优状态轨线 x * (t) 和协态向量函数 ?(t),以及k维常向量?1和l维常向量?2,使得:

1) x*(t)和?(t)满足规范方程
?H ( x, u, λ) ? f ( x (t ), u(t )) ?λ τ ( x (t ), u(t )) ? H ( x , u , λ ) ? L ( x ( t ), u ( t )) ? f ?(t ) ? ? λ ?? ? λ(t ) ?x ?x ?x ? (t ) ? x

式中,哈密顿函数为
H ( x(t ), λ(t ), λ1 , λ2 , u(t )) ? L( x(t ), u(t )) ? λ? (t ) f ( x(t ), u(t ))
? ? ? λ1 L1 ( x(t ), u(t )) ? λ2 L2 ( x(t ), u(t ))

积分约束问题(5/7)

2) 边界条件
x (t0 ) ? x0
tf t0

λ (t f ) ? 0

J1 ? ? L1 ( x (t ), u(t ))dt ? 0 J 2 ? ? L2 ( x (t ), u(t ))dt ? 0
t0 tf

?2i J 2i ? 0

?2i ? 0, i ? 1, 2,..., l

3) 哈密顿函数H作为u(t)?U的函数,在u(t)=u*(t),t?[t0,tf]时取 绝对极小,即
H ( x * (t ), λ(t ), λ1 , λ2 , u* (t )) ? min H ( x* (t ), λ(t ), λ1 , λ2 , u(t ))
u ( t )?U


H ( x* (t ), λ(t ), λ1 , λ2 , u* (t)) ? H ( x* (t ), λ(t), λ1 , λ2 , u(t)) ?t ?[t0 , t f ], ?u(t) ?U

积分约束问题(6/7)

4) 在最优轨线的末端,哈密顿函数应满足
* * * * * ? H ( x ( t ), λ ( t ), λ , λ , u (t f )) ? 0 t f自由 ? f f 1 2 * * H ( x (t ), λ(t ), λ1 , λ2 , u (t )) ? ? * * H ( x ( t ), λ ( t ), λ , λ , u (t f )) ? constant t f 固定 ? f f 1 2 ?

? 综上所述,积分型约束限制条件可通过拉格朗日乘子向量转 化成等价的积分型性能指标泛函。 ? 因此,相应的哈密顿函数的定义中,引进了乘子向量?1和 ? 2。

积分约束问题(7/7)

? 上面讨论的是带积分约束限制条件的、定常的积分型性能指 标泛函的最优控制问题。 ? 对其他类型的被控系统和性能指标泛函,带积分型约束限 制条件的最优控制问题,可类似于上述定理7-13给出。


相关文章:
小波变换模极大值的求取
小波变换模极大值的求取 如何实现呢?按照对小波变换,以及模极大值的理论,对应于信号的奇异点,是 有相对应的模极大值的。 如此的话,如何求取模极大值呢。 ...
自控原理1
极大值原理、动态规划理论等;重点是最优 控制、随机控制和自适应控制;核心控制装置是电子计算机; 第三阶段是七十年代的大系统理论时期,着重解决生物系统、社会系 ...
天气学原理
天气学原理 Char1 大气运动的基本特征 1、真实力:气压梯度力、地心引力、摩擦...(3)气旋中心气压梯度和风速可无极限,而在反气旋中则有极限,梯度风有极大值。...
最优控制
当 控制有约束时,采用极大值原理或动态规划。如果系统是线性的,性能指标是二 次型形式的, 则采用线性二次型最优控制间题求解。 同时将小波分析方法引入这 一...
注塑原理
注塑原理注塑机的注塑过程包括预塑计量、注射充模、保压补缩、冷却定型过程。 ...达到最大值时,模腔压力只达到 B 点,模腔中的压力并没有达到极大值, 也就...
电化学原理思考题答案
电化学原理思考题答案_教育学_高等教育_教育专区。电化学原理思考题答案 (注:...为什么电毛细曲线是具有极大值的抛物线形状? 答:电毛细现象是指界面张力随电极...
最优控制概述
动态最优问题的目标函数是一个泛函, 求解最优控制问题常用的方法有经典 变分法、极大(极小)值原理、动态规划和线性二次型最优控制法等。对于动态 系统 ,当...
遗传求函数的极大值11
3.05 3 2.95 2.9 2.85 x 10 -4 是 输出最优结果 图 1 遗传算法的工作原理框图 2 遗传算法求函数的极大值 Best J 利用遗传算法求 Rosenbrock 函数的...
极值分布
即这种极大值的概率分布密度函数可以从最 复杂原理和三个约束条件推导出来。 约束条件(18.45)是一切概率密度分布函数都具有的,不必多解释。约束 条件(18.8.2)...
最优控制理论课件
静态和动态最优化问题 三 最优化问题的求解方法 1 间接法(解析法)无约束:经典微分法、经典变分法 有约束:极大值原理、动态规划 2 直接法(数值解法) 函数逼近...
更多相关标签:
庞特里亚金极大值原理 | 最优控制理论 | 极大值极小值 | 极小值原理 | 最大值原理 | 极大值 | pontryagin极大值原理 | 极大值与极小值 |