
基于不确定性分析技术的两种水质模型率定方法比较
曾思育1,陈吉宁1,王志石2
(1.清华大学环境系系统分析研究所,北京,100084; 2.澳门大学科技学院,澳门)
摘要: 以澳门南湾湖为例,对一个小型湖泊水质模拟模型的基本结构功能进行了描述.并且在进行水
质模拟过程中,比较了两种用于参数率定的不确定性分析算法,讨论了参数不确定性,以及传递到计算
结果中对水质模拟的不确定性影响.
关键词: 湖泊模型;不确定性分析;G L U E算法;HSY算法
中图分类号: X52;X832 文献标识码: A
Compariso n betw een Tw o Calibratio n M eth ods fo r Water
Quality Model Based o n Uncertainty Analysis Tech nique
ZEN G Si-yu1,C HEN J i-ning1,W ANG Zhi-shi2
(1.Envir onmental Depar tment,Tsingh ua U niv ersit y,Beijing100084,China; 2.Fa culty of Science and Techno log y, Univ ersity o f M acao,China)
Abst ract: With the ca se study o n Lake N amV am in M acao,the paper described the func tion and
str uctur e of w ate r qua lity mo del fo r a sma ll-scale lake.During the w ater qualit y simulatio n,tw o
unce rtainty a na ly sis to ols w ere at tempted to ca librate model para meters,w hich w as G LU E alg o rithm
and HSY alg orithm.Accor ding to unce rtainty estimation of param eters,uncertainty tr ansfe r to
simulatio n results w as discussed.
Key words: la ke model;uncer tainty a na ly sis;G L U E alg orithm;HSY algo rithm
1 引言
澳门南湾湖是人工开挖而成的小型湖泊,既没有上游来水和支流汇入,又没有常规的下游出流;因此与外界环境中物质能量的交换比较少,可以说整个湖泊构成了一个较为封闭的生态系统.针对这样的小型湖泊,以藻类的生长死亡为核心,模拟湖泊生态系统所涉及的生物化学过程,从而预测湖泊的水质变化,是建立湖泊生态系统模型的任务.由于南湾湖的形成时间短,相关的监测资料和监控数据不多,尤其是有关污染物来源和污染负荷的信息量比较少,在运用湖泊模型模拟水质的动态变化时,无疑存在很大的不确定性,例如模型参数的不确定性和污染物总量输入上的不确定性,为此,对模型不确定性的分析也成为本文讨论的内容之一.
2 模型基本功能与结构
笔者针对澳门南湾湖开发了水质模拟模型.对湖泊水体本身而言,这是一个单箱动态模型,但同时考虑了底泥对湖泊水质的影响.具体来说,模型的功能可以分成三个部分,即1)水文过程模拟.2)热动力学过程模拟.3)生物过程及水质模拟.
2.1 水文过程模拟
对南湾湖而言,它是一个小型的人造湖体,其环境功能主要是作为景观娱乐,对湖泊基本不存在人工调度,与外界没有频繁的水量交换,由于地理位置的关系,湖泊冬季不会出现结冰现象,因此影响它水位变
收稿日期:2003-01-12
资助项目:与澳门市政总署的合作项目《澳门南湾湖生态保护规划研究》
作者简介:曾思育(1973-),女,山西长治人,讲师,博士,主要研究方向为环境系统分析,Email:szeng@tsing hua.edu.cn
化的主要是湖面降雨和蒸发这两个因素.因此,水文模拟子模型的主要任务就是,描述南湾湖水体体积和水位随着湖面降雨量和蒸发量变化的动态变化过程.在模拟过程中,每日降雨量是作为已知条件输入的,而湖面的每日蒸发量则是根据日平均风速、日平均气温和日平均露点等已知的气象数据计算出来的.2.2 热动力过程模拟
在这一部分,模型主要是模拟计算湖泊水温的动态变化,而不必考虑冬季结冰对湖内生态系统的影响.之所以要模拟计算湖水温度,是因为水温的变化直接会影响到湖泊生态系统的状态以及污染物的降解速率.另外,由于南湾湖水深较浅,在模型概化时可以把湖体看成完全混合的单箱,而不必考虑因水温在竖向分布上的实际差异引起的水体分层现象.根据以上特点,南湾湖的热动力学子模型主要描述了由于湖体中水量变化引起的热交换、湖泊表面与大气之间的热交换以及因日照引起的热交换等,包括长波辐射方程、短波辐射方程、气-水对流传热方程、以及蒸发和降雨引起的热量传递.通过热量的动态平衡变化,可以
推算出水温的动态变化,进而计算出当前的湖泊温度.2.3 生物过程及水质模拟
根据南湾湖现有的监测数据以及未来管理的需要,以藻类新陈代谢过程为主线构建的南湾湖水质模型包括了以下水质项目:藻类、慢速碳(Slo w Ca rbo n,相当于COD 和BOD 的差值)、快速碳(Fast Carbon,相当于BOD)、CO D 、有机氮、氨氮、盐氮(包括亚盐氮部分)、总氮、总磷、溶解氧、大肠杆菌和挥发酚.在这12个水质项目之间存在着错综复杂的关系,尤其是再加上底泥与水体之间的相互作用.湖体内发生的主要生化反应关系可以用图1来表示
.
图1 模型中各组分之间的主要关系
注 图中“硝氮”指盐氮与亚盐氮之和.
3 参数率定及其不确定性分析
3.1 两种参数率定算法
由于整个水质模拟过程比较复杂,因而涉及到众多的参数,参数率定成为该模型构建过程中一个非常重要的环节.针对这种结构复杂的模型,笔者采用了基于不确定性分析(Uncertainty Analysis)技术的参数率定方法,具体地,尝试了GLUE 算法和HSY 算法.图2表示的就是GLU E 算法和HSY 算法的基本过程.
3.2 率定算法的比较
由于两种算法的原理不同,对参数不确定性的度量和描述方法不同,因此参数率定的结果及其表达形式不同,最终反映到水质预测结果上也会有所不同.以“藻类生长最大速率”这一参数的率定为例,两种算法的应用比较见表1和图 3.
139
第2期基于不确定性分析技术的两种水质模型率定方法比较
G LU E算法HSY算法
率定条件:
1)参数“藻类生长最大速率”的先验分布:(0.35,3.5)区间上的均匀分布;
2)观测数据:用2001年1月至3月期间的湖体藻类监测数据(叶绿素a浓度);
3)参数空间的采样次数均设定为10000次.
度量似然度的方法定义:
1∑m
i=1
(y ij-x i)2
∑n j=11∑m
i=1
(y ij-x i)2
∑n
j=1
1∑m
i=1
(y ij-x i)2
∑n
j=1
1∑
m
i=1
(y ij-x i)2
可信区域的定义:
对任意采样参数,要求满足,计算值y ij(藻类计算
浓度)与观测值x i(藻类监测浓度)之间的绝对误
差落在±0.0045mg/L范围内,即|y ij-x i|≤
0.0045mg/L
率定结果:
采样时所取的10000次参数值及其对应的似然度率定结果:
使运算结果落在可信区域内的参数值(本次算例中获得865个可信参数取值,即纵坐标值不为零的参数)
注1 还可以采用其它方式来度量似然度、定义可信区域,上述表达式仅为本案例所采用的方法.
注2 设x i为第i个观测值(藻类监测浓度);y ij为采用第j次采样参数计算出的与第i个观测值对应的计算值(藻类计算浓度);i=1,2,…,m;j=1,2,…,n.
图2 G L U E算法的基本过程(左)和HSY算法基本过程(右)
3.3 参数不确定性引起的预测结果不确定性
由于参数取值本身存在着不确定性,水质模拟过程中,参数的不确定性必然会传递到预测结果当中去.对于传统的确定性模拟(Deterministic Simulatio n)计算来说,水质预测值是一个确定的取值;而在基于不确定性分析的模拟计算中,还必须包含有对水质预测结果的不确定性做出的估算.具体来说,基于HSY算法的模型结果应该是由上下限框定的水质预测的取值范围;而基于GLUE算法的计算成果则是水质预测值的概率分布,若给定相应的置信度(例如80%),也可以获得一个取值范围(置信区间).利用率定的参数结果,可以“预测”2001年4月至6月期间的水质状况.不同的算法结果如图4和图 5.
从上图可以看出,HSY算法对应的计算结果中,有1/3的藻类浓度监测值落在了上下限之外;而在140系统工程理论与实践2004年2月
图3 用GL U E 算法(左)和HSY 算法(右)率定藻类最大生长速率的结果
图4 利用HSY 算法获得的叶绿素a 浓度
不确定性分析结果
GLU E 算法对应的结果中,只有1/12的监测值落在了置信区间上下限之外.当然,图中仅为置信度
80%的情况,如果提高置信度,会有更多的监测点落在置信区间内.从跟计算值(上下限)之间的关系看,在本算例中,HSY 算法对应的结果要差于GLU E 算法.两种算法出现这种结果差异,有一个重要的原因在于,利用GLU E 算法考察预测值的不确定性时,从采样空间中取出的所有10000个参数都参与了传递计算,只是各参数的权重跟似然度的大小有关;而在HSY 算法中,采样空间中取出的10000个参数要么被认为是可信参数而被选中,要么被抛弃,因此仅有筛选出的865个可信参数等权地参与了不图5 利用G LU E 算法获得的叶绿素a 浓度
不确定性分析结果(80%置信度)
确定性的传递计算,也就是说,在本算例中,HSY 算法丢弃了一些参数的信息.但这并不能由此而简单地得出HSY 算法劣于GLUE 算法的结论.两种算法的有效性不仅跟似然度及可信区域定义的具体方法有关,还取决于对率定参数前验概率分布的设定、模型本身的结构、监测数据的准确程度等诸多因素,这都会影响到对参数不确定性估算的差异,进而影响到不确定性向预测结果的传递.
4 小结
本文以澳门南湾湖为例,探讨了一个小型湖泊水质模型构建过程中的重要环节:参数率定.在参数
率定过程中,本文以单个参数率定为例,介绍了两种不确定性分析算法.实际应用中,参与率定的是几十个参数构成的参数组,观测值本身又是多个水质指标组成的向量,再加上模型的非线性特征极为突出,因此给参数的不确定性分析带来了相当的难度;由此引出,多个参数一起进行率定时应该采取什么样的策略,成为下一步的研究课题.
参考文献:
[1] Stev en Cha pr a.Sur fa ce-Wa ter Quality M odeling [M ].New Yor k :M c Graw -Hill Companies Inc.,1997.[2] N eil M c Inty r e,
How ar d W heater ,M a tthew Lees.
Estimation and pr opaga tio n o f pa rame tric uncer tainty in
e nviro nmental mo dels [J ].Jour nal o
f Hy droinfo r ma tics ,2002,4(3):177-198.
[3] Stev en Cha pr a ,Ra ymo nd Ca na le .Numerical M ethods fo r Engineers [M ].New Y or k :M c Graw -Hill Co mpa nies Inc ,
1998.
141
第2期基于不确定性分析技术的两种水质模型率定方法比较
