动态过程的另一类问题是所谓的动态优化问题,这类问题一般要归结为求最优控制函数使某个泛函达到极值。当控制函数可以事先确定为某种特殊的函数形式时,问题又简化为求普通函数的极值。求解泛函极值问题的方法主要有变分法和最优控制理论方法。
§1 变分法简介
变分法是研究泛函极值问题的一种经典数学方法,有着广泛的应用。下面先介绍变分法的基本概念和基本结果,然后介绍动态系统最优控制问题求解的必要条件和最大值原理。
1.1 变分法的基本概念1.1.1 泛函设S 为一函数集合,若对于每一个函数S t x ∈)(有一个实数J 与之对应,则称J 是对应在S 上的泛函,记作))((t x J 。S 称为J 的容许函数集。通俗地说,泛函就是“函数的函数”。
例如对于xy 平面上过定点),(11y x A 和),(22y x B 的每一条光滑曲线)(x y ,绕x 轴旋转得一旋转体,旋转体的侧面积是曲线)(x y 的泛函))((x y J 。由微积分知识不难写出
1)容许函数集可表示为
}y )y(x ,)(],,[)(|)({2211211==∈=y x y x x C x y x y S (2)最简单的一类泛函表为
∫=2
1),,())((t t dt x x t F t x J (3)被积函数F 包含自变量t ,未知函数x 及导数x
。(1)式是最简泛函。1.1.2泛函的极值
泛函))((t x J 在S t x ∈)(0取得极小值是指,对于任意一个与)(0t x 接近的S t x ∈)(,都有))(())((0t x J t x J ≥。所谓接近,可以用距离ε<))(),((0t x t x d 来度量,而距离定义为
|})()(||,)()({|max ))(),((0002
1t x t x t x t x t x t x d t t t −−=≤≤泛函的极大值可以类似地定义。)(0t x 称为泛函的极值函数或极值曲线。
1.1.3泛函的变分
如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为泛函的自变量,函数)(t x 在)(0t x 的增量记为
)
()()(0t x t x t x −=δ也称函数的变分。由它引起的泛函的增量记作
))
(())()((00t x J t x t x J J −+=∆δ如果J ∆可以表为
其中L 为x δ的线性项,而)(0t x 的变分,记作))((0t x J δ。用变动的4)根据L 和
利用变分的表达式(4)可以得到泛函极值与变分的关系:
若))((t x J 在)(0t x 达到极值(极大或极小),则
0))((0=t x J δ (5)
这是因为对任意给定的x δ,)(0x x J αδ+是变量α的函数,该函数在0=α处达到极
于是由(4)式直接得到(5)式。
1.1.5. 变分法的基本引理
引理 ],[)(21x x C x ∈ϕ,],[)(211
x x C x ∈∀η,0)()(21==x x ηη,有∫≡2
10)()(x x dx x x ηϕ,
则。
1.2 无约束条件的泛函极值
求泛函
∫=f
t t dt t x t x t F J 0))(),(,( (6)的极值,一般是用泛函极值的必要条件去寻找一条曲线)(t x ,使给定的二阶连续可微函数F 沿该曲线的积分达到极值。常称这条曲线为极值曲线(或轨线),记为)(*
t x 。
1.2.1 端点固定的情况
设容许曲线)(t x 满足边界条件
00)(x t x =,f f x t x =)( (7)
且二次可微。
8)因为x δ的任意性,及9)它是这类最简泛函取极值的必要条件。
(9)式又可记作 0=−−−x F x
F F F x x x x x t x (10)通常这是)(t x 的二阶微分方程,其通解的两个任意常数由(7)式中的两个端点条件确定。
1.2.2 最简泛函的几种特殊情形
(i) F 不依赖于x
,即),(x t F F = 这时0≡x F ,欧拉方程为0),(=x t F x ,这个方程以隐函数形式给出)(t x ,但它一般不满足边界条件,因此,变分问题无解。
(ii) F 不依赖x ,即),(x
t F F =欧拉方程为
,由此可求出),(1c t x ϕ= ,积分后得到可能的极值曲线族
()dt c t x ∫=
1,ϕ(iii) F 只依赖于x ,即)(x F F =这时0,0,0===x x x t x F F F ,欧拉方程为
=x x F x
由此可设0=x 或0=x x F ,如果0=x
,则得到含有两个参数的直线族21c t c x +=。另外若0=x x F 有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数c 的直线族c kt x +=,它包含于上面含有两个参数的直线族 21c t c x += 中,于是,
在)(x
F F =情况下,极值曲线必然是直线族。(iv )F 只依赖于x 和x
,即),(x x F F =这时有0=x t F ,故欧拉方程为
0=−−x x x x x F x
F x F 此方程
例1 (最速降线问题)最速降线问题是历史上变分法开始发展的第一个问题。它是约法是这样的:设A 和B 是铅直需时间最短。
下,B 点为),(22y x B 。根满足(s 为弧长) 2
2)(,0)0(y x y y ==最速降
不含自变量x ,所以方程(10)可写作
''''''=−−y F y F F y y yy y 等价于
令
又因
得这是摆线(圆滚线)的参数方程,其中常数1c 可利用另一边界条件22(y x y =)
来确定。
消 1.2.3 最简泛函的推广
最简泛函取极值的必要条件可以推广到其它情况。
(ⅰ)含多个函数的泛函使泛函
∫=2
1)',,',,())(),((x x dx z z y y x F x z x y J
(ii )含高阶导数的泛函
使泛函
∫=2
1)
J 知值的极值函数),(y x z z =必满足方程上式称为奥
式方程。1.2.4 端点变动的情况(横截条件)
设容许曲线)(t x 在0t 固定,在另一端点f t t =时不固定,是沿着给定的曲线)(t x ψ=上变动。于是端点条件表示为
==)
()()(00t t x x t x ψ这里t 是变动的,不妨用参数形式表示为
f
f dt t t α+=导,即有
11)再对(11)式做如下分析:
(i )对每一个固定的f t ,)(t x 都满足欧拉方程,即(11)式右端的第一项积分为零;
(ii 间的关系,因为对α求导并即
12)把(12)代13)
(13)式就是确定欧拉方程通解中另一常数的定解条件,称为横截条件。
横截条件有两种常见(i )当)(t x ψ=是垂直横固定,)(f t x 自由,并称)(f t x 为自由端点。此时(11)式中0=f dt 及横截条件
14)
(ii )当)(t x ψ=是平行横自由,)(f t x 固定,并称)(f t x 为平动
端点。此时0=ψ
,(13
15)
注意,横截条件与欧拉方程联立才能构成泛函极值的必要条件。
1.3 有约束条件的泛函极值
在最优控制系统中,常常要涉及到有约束条件泛函的极值问题,其典型形式是对动态系统
))(),(,()(t u t x t f t x
= (16)寻求最优性能指标(目标函数)
∫+=f
t t f f dt t u t x t F t x t t u J 0
))(),(,())(,())((ϕ (17)
其中)(t u 是控制策略,)(t x 是轨线,0t 固定,f t 及)(f t x 自由,n
R t x ∈)(,
m R t u ∈)((不受限,充满m R 空间),F f ,,ϕ连续可微。
下面推导取得目标函数极值的最优控制策略)(*
t u 和最优轨线)(*
t x 的必要条件。采用拉格朗日乘子法,化条件极值为无条件极值,即考虑
∫−++=f
t t T f f dt x
u x t f t u x t F t x t u x J 0
)]),,()((),,([))(,(),,(1 λϕλ (18)-214-
的无条件极值,首先定义(16)式和(17)式的哈密顿(Hamilton )函数为 ),,()(),,(),,,(u x t f t u x t F u x t H T
λλ+= (19)将其代入(18)式,得到泛函
∫−+=f
t t T f f dt x
u x t H t x t u x J 0
]),,,([))(,(),,(1 λλϕλ (20)
如果受控系统
),,(u x t f x
= ,00)(x t x =其控制策略)(t u 的全体构成有界集U ,求U t u ∈)(,使性能指标
-215-
∫+=f
t t f f dt
u x t F t x t t u J 0
),,())(,())((ϕ和),,(u x t F 都是连续可微的,那么最优控制决定:
(i 决定:
(ii )哈密顿函数
),,()(),,(),,,(*
**
*
*
u x t f t u x t F u x t H T
λλ+=作为)(t u 的函数,最优策略)(*
t u 必须使
),,,(max ),,,(*
****λλu x t H u x t H U
u ∈=或使
),,,(min ),,,(*
****λλu x t H u x t H U
u ∈=(最小值原理)(iii )满足相应的边界条件
① 若两端点固定,则正则方程的边界条件为 0)0(x x =,f f x t x =)(。
② 若始端固定,终端f t 也固定,而)(f t x 自由,则正则方程的边界条件为 0)0(x x =,))(,()()(f f t x f t x t t f ϕλ=。
③ 若始端固定,终端)(,f f t x t 都自由,则正则方程的边界条件为 0)0(x x =,))(,()()(f f t x f t x t t f ϕλ=,
0))(,())(),(),(,(=+f f t f f f f t x t t t u t x t H f ϕλ。
§2 生产设备的最大经济效益
某工厂购买了一台新设备投入到生产中。一方面该设备随着运行时间的推移其磨损程度愈来愈大,因此其转卖价将随着使用设备的时间增加而减小;另一方面生产设备总是要进行日常保养,花费一定的保养费,保养可以减缓设备的磨损程度,提高设备的转卖价。那么,怎样确定最优保养费和设备转卖时间,才能使这台设备的经济效益最大。
2.1 问题分析与假设
(i )设备的转卖价是时间t 的函数,记为)(t x 。)(t x 的大小与设备的磨损程度和保养费的多少密切相关。记初始转卖价0)0(x x =。
(ii )设备随其运行时间的推移,磨损程度越来越大。t 时刻设备的磨损程度可以用t 时刻转卖价的损失值来刻划,常称其为磨损函数或废弃函数,记为)(t m 。
(iii )保养设备可以减缓设备的磨损速度,提高转卖价。如果)(t u 是单位时间的保
-216-
养费,)(t g 是t 时刻的保养效益系数(每用一元保养费所增加的转卖价),那么单位时间的保养效益为)()(t u t g 。另外,保养费不能过大(如单位时间保养费超过单位时间产值时,保养失去了意义),只能在有界函数集中选取,记有界函数集为W ,则W t u ∈)(。
(iv )设单位时间的产值与转卖价的比值记为p ,则)(t px 表示在t 时刻单位时间的产值,即t 时刻的生产率。
(v )转卖价)(t x 及单位时间的保养费)(t u 都是时间t 的连续可微函数。为了统一标准,采用它们的贴现值。对于贴现值的计算,例如转卖价)(t x 的贴现
值计算,如果它的贴现因子为δ(经过单),那么由
解得
)
(11)(t t e t x −−=δ令01=t ,便得t 时刻单位费用的贴现(称贴现系数)为t e δ−,所以设备在t 时刻转卖
价)(t x 的贴现为t
e
t x δ−)(。仿此计算,)(t u 的贴现为t
e
t u δ−)(,单位时间产值的贴现为
t e t px δ−)(。
(vi )欲确定的转卖时间f t 和转卖价)(f t x 都是自由的。
2.2 模型构造
根据以上的分析与假设可知:考察的对象是设备在生产中的磨损—保养系统;转卖价体现了磨损和保养的综合指标,可以选作系统的状态变量;在生产中设备磨损的不可控性强,其微弱的可控性也是通过保养体现,加之保养本身具有较强的可控性,所以选单
位时间的保养费)(t u 作为控制策略。这样,生产设备的最大经济效益模型可以构成)状态方程
21)
策略)(*
t u ,使系统的经济效
益这一性能指标
∫−−−+=f
f
t t t f dt e t u t px e
t x t u J 0
)]()([)())((δδ (22)
为最大,其中)(,f f t x t 都是自由的。
2.3 模型求解
首先写出问题的哈密顿函数 )]()()([)]()([t m t g t m e
t u t px H t
+−+−=−λδ (23)
再由协态方程及边界条件求出)(t λ,即由
-217-
解得
显然,H是对
24)或
25)
换点s t在什么位置,即s t等
转换
即
26)
从而可解出s t。
因为)(t
g是时间t的减函数,所以(26)式的左端也是时间t的减函数,也就是说)(*t
u随时间应由U到0。于是最优控制策略的具体表达式为
≤
<
<
≤
=
f
s
s
t
t
t
t
t
U
u
,0
,
*
至于f t,)
(
f
t
x的求法,请见下面的例子。
例3 的问题中,设100
)0(=
x,1
=
U,2
)(=
t
m,
1.0
=
p,)
(
f
t x和)(*t
u。
27)
-218-
当s t t <时,
当s t t >时,于是s t t >时,有
解得
28)
于是
当f t t =时,由(28)式有
即
29)
将(27)和(29)联立求解,编写如下Matlab 程序
[x,y]=solve('(1+ts)^(1/2)=4-2*exp(0.05*(ts-tf))','tf=2*(1+ts)^(1/2)+28')求得
6.10=s t ,8.34=f t 于是,最优控制策略(保养费)为
≤<<≤=8
.346.10,06
.100,1)(*t t t u -219-
习 题 六
1.求自原点(0,0)到直线01=−+y x 的最速降线。
2.求概率密度函数)(x ϕ,使得信息量
∫+∞
∞−−=dx
x x J )](ln[)(νϕϕ取最大值,且满足等周条件 1)(=∫+∞
∞−dx x ϕ ,22)(σϕ=∫+∞∞
−dx x x (常数)。3. 在生产设备或科学仪器中长期运行的零部件,如滚珠、轴承、电器元件等会突然发生故障或损坏,即使是及时更换也已经造成了一定的经济损失。如果在零部件运行一定时期后,就对尚属正常的零件做预防性更换,以避免一旦发生故障带来的损失,从经济上看是否更为合算?如果合算,做这种预防性更换的时间如何确定呢?
-220-