空 军 工 程 大 学 学 报(自然科学版)Vol .7No .32006年6月JOURNAL OF A I R FORCE ENGI N EER I N G UN I V ERSITY (NAT URAL SC IENCE ED I TI O N )Jun .2006
多人微分对策Paret o 最优解的最优均衡值算法
寇光兴1, 李炳杰1,2, 赵惠文2
(11空军工程大学理学院,陕西西安 710051;21西安电子科技大学理学院,陕西西安 710071)
摘 要:引入多人微分对策的最优均衡值和最优均衡解概念。在某种凸性条件下最优均衡解集是Paret o 最优解的凸本质连通区域。利用最优均衡解将问题等价地转化为求解单目标最优控制问
题。该方法可推广到求解局中人拥有不同权重的情形,为求解多人合作微分对策问题提供了一种简单的、新的途径。
关键词:微分对策;最优均衡解;Paret o 最优解;Ha m ilt on -Jacobi 方程
中图分类号:O225TP273 文献标识码:A 文章编号:1009-3516(2006)03-0082-03
多人微分对策中,局中人的支付函数相互冲突,不可公度。求解该问题的Paret o 最优解集需结合多目标
决策理论进行研究。近年来已取得了不少成果[1-5],其中文献[1]引进了最优均衡解求解了实空间上的群
体决策问题,该方法有其独到之处。本文受文献[1]思想的启发,引进一个求解合作微分对策问题Paret o 最优解集的全新的方法———最优均衡值算法,引进一个求解该问题的单目标最优控制。该方法使局中人之间达成某种妥协,进一步寻找最优妥协值,使所有局中人的支付泛函非劣。并且对所有局中人是公平的,但仍可推广到求解具有主从性质的拥有不同权重的情形。该方法克服了以往算法的主观性、复杂性和特殊性,但其结论均适合求解这些问题。
1 最优均衡解
考虑N 人微分对策问题(P )
m in u i J i (x,u 1,u 2,…,u N )=g i (x (T 0))+∫T 00h i (t,x (t ),u 1(t ),u 2(t ),…,u N (t ))d t (1)
x (t )=f (t,x (t ),u 1(t ),u 2(t ),…,u N (t )); x (0)=x 0
(2)设集合X 为对任意(t,x,u 1,u 2,…,u N )∈[0,T 0]×R m ×U 1×U 2×…×U N 且满足式(2)的函数x (t )构
成的集合,显然对满足控制集的任意控制函数,其轨迹x (t )可表示为
x (t )=x 0+∫t 0f (τ,x (τ),u 1(τ),u 2(τ),…,u N (τ))d τ(3)
定义1 称S =X ×U 1×U 2×…×U N 为问题(P )的可行函数集。
定义2 设s =(x (t ),u 1(t ),u 2(t ),…,u N (t ))∈S ,如果存在实数J ≥0对任意s ∈S 满足
J i (s )-J i (s )≤J (i =1,2,…,N )(4)
则称s 为问题(P )的J 均衡解,称J 为均衡值。均衡值J 是所有局中人就本身的支付函数而言给出的统一妥协值,如果s 为问题(P )的J 均衡解,则对任意J ′>J ,s 为问题(P )的J ′均衡解。
定义3 称集合G ={J |J i (s )-J i (s )≤J;s ∈S,I =1,2,…,N }为s ∈S 的均衡集。
定理1 对任意s ∈S ,G 非空,对任意J 0∈G,水平集G (J 0)={J ∈G |J ≤J 0}是闭集,均衡集G 存在最小值J 3s 。
收稿日期:2005-06-10
基金项目:陕西省自然科学基金资助项目(2004A05)
作者简介:寇光兴(1965-),男,陕西扶风人,副教授,主要从事分布参数最优控制算法研究.
证明 构造局中人i 的理想策略问题(P i )
m in s ∈S J i (x,u 1,u 2,…,u N ) i =1,2,…,N (5)
由假设条件式(1)-式(4)知,问题(P i )存在最优目标值J 3i (i =1,2,…,N )。
对任意s ∈S,令J =max {J i (s )-J 3i ,i =1,2,…,N },显然J ≥0,对任意s ∈S ,J 3i ≤J (s )(i =1,2,…,N
),即J i (s )-J i (s )+J 3i ≤J (s ),因此,J i (s )-J (s )≤J i (s )-J 3
i ≤J (s )。故有J ∈G,所以G 非空,而水平集G (J 0)有界是显然的。
由假设条件式(1)-(4)知,支付函数J i (i =1,2,…,N )是连续泛函,可行函数集S 是紧集。对任意s ∈S,假定均衡值序列{J k } 。 定义5 设J 3是G 的最小值,如果s 3∈S,对任意s ∈S 满足J i (s 3)-J i (s )≤J 3(I =1,2,…,N ),则称 s 3∈S 是(P )的J 3最优均衡解,J 3是问题(P )的最优均衡值。显然,最优均衡值J 3是每个局中人针对自己的支付函数给出的最小统一妥协值。最优均衡值J 3是惟一的,但对应的最优均衡解s 3 不一定惟一。2 主要结论 定理3 设f,h i ,g i (i =1,2,…,N )满足假设条件式(1)-式(4),控制集U i (i =1,2,…,N )是凸集,则由所有J 3最优均衡解构成的集合是凸集。J 3 最优均衡解集与Paret o 最优解集的凸本质连通区等价。如果 Ha m ilt on 函数均关于(x,u i )是严格凸函数,g i (x )关于x 是严格凸函数,则问题(P )存在惟一J 3最优均衡 解。 证明 显然泛函J i (i =1,2,…,N )是凸泛函,可行函数集S 是凸集。设s 31,s 32,是问题(P )的J 3最优均 衡解,则对任意s ∈S,J i (s 31)-J i (s )≤J 3,J i (s 32)-J i (s )≤J 3(i =1,2,…,N )。对任意θ∈(0,1),θs 31+(1 -θ)s 32∈S,并且满足J i (θs 31+(1-θ)s 32)≤θJ i (s 31)+(1-θ)J i (s 32)(i =1,2,…,N ),因此对任意s ∈S 有J i (θs 31+(1-θ )s 32)≤θ(J 3+J i (s ))+(1-θ)(J 3+J i (s ))=J 3+J i (s ),显然θs 31+(1-θ )s 32)也是问题(P )的J 3最优均衡解,故J 3最优均衡解构成的集合是凸集。J 3最优均衡解集是凸本质连通区域是显然 的[2],以下证明它与Paret o 最优解集等价。 设s 3=(x 3,u 31,u 32,…,u 3N )是问题(P )的J 3最优均衡解,s 3i 是问题(P i )的最优解,如果J 3=0,则J i (s 3)=J i (s 3i )(i =1,2,…,N ),s 3是问题(P )的绝对最优解,因此,s 3是问题(P )的Paret o 最优解[6,7]。 如果J 3>0,则J i (s 3)>J i (s 3i )且J 3=J i (s 3)-J i (s 3i )(i =1,2,…,N ),假设s 3不是问题(P )的Pa 2 ret o 最优解,则至少存在一个j ∈{1,2,…,N }(不妨设只有一个并且j =1),存在v 1∈U 1,s 1=(x 3v 1,v 1,u 2,…, u N )∈S ,使得J 1(s 1) (1-θ)J 1(s 3) 半径的闭球B (s 3,δ1)以及0<θ1<1,使得当0<θ2<θ1时,s 2=θ2s 1+(1-θ2)s 3∈B (s 3,δ1)∩S 1∩S 2,J i (s 2) 同理可证存在闭球B (s 3,δ2),其中δ2>0,以及0<θ3<1,使得s 2=θ3s 1+(1-θ3)s 3∈B (s 3,δ2)∩S 1 ∩S 2∩S 3,J i (s 2) 得s N =θN s N -1+(1-θN )s 3∈B (s 3,δN -1)∩S 1∩…∩S N ;J i (s N ) 3 8第3期寇光兴等:多人微分对策Paret o 最优解的最优均衡值算法 是J3最优均衡解,设s3的若s3是问题(P)的Paret o最优解,假设s3不是问题(P)的J3最优均衡解,s3 均衡集合为G3,由定理1必存在最小均衡值J′。而J′>J3,否则s3是J3最优均衡解。因此,由定理2可知J i(s30) 定理4 如果问题(P )存在最优目标值J3i(i=1,2,…,N),则s3是问题(P)的J3最优均衡解的充分必 i 是问题(P) 要条件是(s3,J3)∈S×R + m in J (6) s1t1J i(s)-J3i≤J(i=1,2,…,N);(s,J)∈S×R+(7)的最优轨线、最优控制以及最优目标值。 3 结束语 对多人合作微分对策问题(P),通过求解一个单目标最优控制问题求出与Paret o最优解等价的J3最优均衡解。该方法克服了传统方法的种种局限性,将复杂问题变简单了。 参考文献: [1] 孟志青,胡奇英.群体决策问题的一种最优均衡解[J].系统科学与数学,2004,24(1):28-33. [2] Yang H,Yu J.On Essential Components of the Set ofW eakly Paret o-Nash Equilibriu m Points[J].App lied Mathe matical Let2 ter,2002,15(3):553-560. [3] W eeren A J T M,Schu macher J M,Eng werda J C.A sy mp t otic Analysis of L inear Feedback Nash Equilibriu m in Nonzer o- Su m L inear Quadratic D ifferential Games[J].Journal of Op ti m izati on Theory and App licati ons,1999,101(3):693-722. [4] Eng werda J C.Feedback Nash Equilibriu m in the Scalar I nfinite Horizon LQ-Ga mes[J].Aut omatic Contr ol,2000,36(1): 135-139. [5] Bens oussan A.St ochastic Ga mes f or N Players[J].Journal of Op ti m izati on Theory and App licati ons,2000,105(3):567- 5. [6] 李登峰.微分对策及其应用[M].北京:国防工业出版社,2002. [7] 张学铭,李训经.最优控制系统的微分方程理论[M].北京:高等教育出版社,19. [8] 李炳杰,周宏安.多目标分层规划问题的最优均衡值序列算法[J]1空军工程大学学报(自然科学版),2005,6(1):83- 871 (编辑:田新华) An O pti m a l Equ ili br i u m Pay m en t A lgor ith m for Pareto O pti m a l Soluti on s of M any-person D i fferen ti a l Gam es K OU Guang-xing1,L IB ing-jie1,2,ZHAO Hui-wen2 (1.The Science I nstitute,A ir Force Engineering University,Xi′an,Shaanxi710051,China;2.School of Sci2 ence,Xidian University,Xi′an,Shaanxi710071,China) Abstract:The concep ti ons called op ti m al equilibriu m pay ment and op ti m al equilibrium s oluti on f or many-pers on differential ga mes are intr oduced.The op ti m al equilibrium s oluti ons set is a connected convex set consisting of the Paret o op ti m al s oluti ons in a certain convex conditi on.This result p r oves that the op ti m al s oluti ons of ga mes p r oble m are equivalent t o the s oluti ons of single object op ti m al contr ol p r oble m.The op ti m al strategies of ga mes p r oble m un2 der different weights can als o be obtained by means of this algorith m.This algorithm gives a si m p le and ne w way t o s olve the many-pers on cooperative differential ga mes. Key words:differential ga mes;op ti m al equilibrium s oluti on;Paret o op ti m al s oluti on;Ha m ilt on-Jacobi equati on