张磊,杨杰
武汉理工大学信号与信息处理专业,湖北武汉 (430063)
E-mail:inoir@163.com
摘要:这篇论文提出了一个增强的率控制框架为H.2视频编码框架。由于高运动或者场景变化,使用传统的线性MAD预测框架会使得MAD的预测不准确。通过分析已编码帧的实际平均复杂度的均值与最后一帧编码MAD的关系,一个更精确的MAD预测框架被提出代替MAD线性预测框架。根据图像质量与QP值变化的关系,我们使用了一个自适应QP 调整的方法。试验结果显示新的MAD预测算法比现有的MAD预测更为精准,并且本文的帧层码率控制框架与现有的H.2码率控制框架相比能达到更好的视觉效果(JVT-G012)。
关键词:平均绝对误差;H.2;码率控制;量化参数;率失真优化;峰值信噪比
中图分类号:TP2
1.引言
H.2是ISO/IEC 和ITU-T 专家组共同开发的继MPEG4编码标准之后的一种编码效率更高的视频编码。它具有低码流,高质量的图象,容错能力强,网络适应性强等特点,在多媒体领域被广泛的应用。
码率控制是视频编码中的重要部分。由于在编码过程中,量化参数在执行率控制算法和RDO时都需要用到,量化参数需要通当前帧MAD的得到,而当前帧的MAD只能在执行RDO后才能得到,因此与以往的编码相比H.2的码率控制更难。在参考文献[1]中,以前一帧相同位置的基本单元的MAD为基础,使用线性模型预测当前帧基本单元的MAD,然而这种方法在高运动或者场景变化的情况下会出现很大的误差。在参考文献[3]中,提出用RatioPSNR来表示图像的复杂度,实际上PSNR的计算与MAD的计算是基本一致的,因为PSNR 是用MSE来计算的,这种方法与原有的MAD表达复杂度的方式没有很大的不同。在现有的许多图像复杂度的预测算法中,对于当前帧图像复杂度的算法主要是根据准确计算前一帧的复杂度来预计的。然而单靠前一帧的复杂度差异是很难估计出下一帧复杂度的。一个更好的方法就是通过之前已编码帧的平均MAD结合之前帧的实际MAD来估计当前帧的MAD。
在JVT-G012中,为了保持连续的帧之间视频观看质量的平滑,量化参数QP被在了2的变化范围内,然而当QP的变化远远大于2时,这样的一个会导致编码出来码率与实际估计的码率差异过大。为改进这样一种情况,本文又增加了一个QP的调整框架。
接下来的文章组织如下:第二部分介绍了一种改进的MAD预测方法,第三部分描述了自适应QP调整方法,第四部分是试验结果。本文的结论为第五部分.
2.改进的MAD预测算法
MAD是公认的一种比较好的图像复杂度的表示方法,在码率控制的算法中,MAD被使用在quadratic rate-quantizer(R-Q) 模型中代替编码的复杂度。那么MAD值的准确度将直接影响到执行R-Q模型之后能否得到准确的量化参数。由于在H.2编码中当前帧的复杂度只能在编码后得到,JVT-G012中使用线性模型预测当前帧的MAD。然而当高运动和场景变化时预测的MAD值是不准确的。
实验显示单通过前一帧来预测下一帧的复杂度是很困难的,这样我们想到用一定数量的已编码帧的特性来估计下一帧的复杂度。当选取一定数量的帧为基本单位进行分析的时候,
很多情况下,即使出现高运动或者场景变化的情况,这样的一个基本单位会呈现出一定的规律性和统计特性。通过分析一定数量的已编码帧的平均MAD 与前一帧编码的MAD 的关系,就可以得到改进的MAD 预测,公式如下:
∑∑−−×=1k j
j
k
j
j madp madp a madc (1)
其中,madc 表示预测的当前帧的MAD ,j madp 表示之前已编码P 帧j 的实际MAD ,k 表示的是所选取的之前已编码p 帧的数量,我们考虑到太大的k 值不能很好反映平均MAD 与当前帧的联系,而太小的k 值又体现了较少的统计特性。所以我们选取k 为5.a 是预测模型的系数。在每次编码完当前帧之后a 值都要变化。a 值的计算格式如下
⎪⎩
⎪⎨
⎧<<+=else
,10
.10.95 if ,05.02
ratio ratio
ratio MADM MADM
MADM a (2)
MADT ratio 被定义为之前已编码帧的实际MAD 与表示之前已编码两帧的MAD 平均值的变化率,计算公式如下
2
/)2,1(−−=
i i MADT MADP MADM
j
ratio
(3)
其中,j
madp 表示之前已编码P 帧j 的实际MAD .在视频序列开始的前五帧里面我们
仍然使用[1]中的线性模型来预测当前帧的MAD 。
Frame Number
M A D
Foreman QCIF 15Hz GOP=200
Frame Number
M A D
Trevor QCIF 15Hz GOP=150
图1. 实际的MAD ,[1]
中线性模型预测的MAD 和我们建议的模型预测的MAD 的比较
图1表示的是实际的MAD ,[1]中线性模型预测的MAD 和我们建议的模型预测的MAD 的比较。我们很容易的看到出现高运动的情况,比如在foreman 序列中的87到92帧, 150到159帧,以及出现场景变化的情况,比如trevor 中第60帧,使用本文的模型预测MAD 是更准确的。在接下来的码率控制中,就使用本文所用方法预测得到的预测MAD 代替原有预测的值。
3.自适应量化参数QP 调整算法
在[1]的QP 调整框架中,限定了QP 的变化范围为2,这样的有利于保证图像可视质量的平滑在连续帧之间。但是我们通过分析PSNR 的变化率与QP 变化率之间的关系,发现QP 取值在不同的范围内的变化对PSNR 的影响是不同的。图2显示在不同固定QP 下编码foreman 视频序列后所得到的序列的平均y-PSNR 。可以看到当QP 取值在0−20左右的范围时,
曲线的斜率是近似为−1的,当QP 取值在30-51左右的范围时,曲线的斜率是近似为−0.5的,并且整个曲线的斜率是随着QP 的增大而逐渐减小的。也就是说QP 的取值越大对y-PSNR 取值的变化影响越小。
Foreman QCIF 30Hz
QP
A v e r a g e Y -P S N R (d
B )
图 2 “Foreman”序列中QP 和平均Y-PSNR 之间的关系
根据这样一个变化规律,一个修正的QP 调整model 如下:
⎪⎩⎪
⎨⎧≤<−+≤<≤<−+−+=5132 if }},,3max{,3min{3218 if 180 if }},,2max{,3min{}},,1max{,1min{P cc p p P P cc p p cc p p c Q Q Q Q Q Q Q Q Q Q Q Q Q (4)
其中,
pc Q ~是调整后的量化参数。
pp Q 是前一P 帧的量化参数。
pc
Q ˆ是由目标比特通过
二进制R-D 模型计算出来的量化参数,最后的量化参数函数如下:
}}1,max{,51min{c c Q Q = (5)
接着调整后的量化参数被使用在当前帧的所有宏块中执行RDO .
4.试验结果
本文的码率控制框架是在JM 6.1平台上面执行的。[1]被选择用来作为一个参考比较。所有测试的序列使用的是QCIF 4:2:0格式并且15HZ 的帧率with 帧的类型是IPPP. 第一个I 帧的量化参数是28。并且编码过程中执行了RDO 。
在图表1中给出了实验的结果。可以看到,PSNR 平均提高了0.35。由于精确的MAD 预测模型,本文的方法在大多数情况下都有提高了PSNR 。在本文的模型中,减小了PSNR 波动。较小的PSNR 波动表示编码后的连续视频观看时有更好的平滑效果。表1也说明了JVT-G012rl 和本文的视频框架都能达到准确的目标比特率。
5.结论
在这篇论文中,我们的目标是精确的评价目标的比特和达到一个平滑的可视质量。一个改进的MAD 预测方法被用来代替原有的线性MAD 预测方法,新的MAD 预测结果比原有的MAD 更加的准确。在新的MAD 预测,以及QP 调整模型的基础上,我们我们设计啦一个更为优化的实时H.2 帧层码率控制框架。试验结果说明了本文的码率控制框架所产生的视频质量比参考文献[1]中的效果更好。
参考文献
[1] Z. Li, F. Pan, K. P. Lim, G. Feng, X. Lin and S. Rahardja, Adaptive basic unit layer rate control for JVT [J],
JVT-G012-r1, 7th Meeting, Pattaya II, Thailand, Mar. 2003.
[2] H.J. Lee and T. Chiang and Y.Q. Zhang, Scalable Rate Control for MPEG-4 Video [J], IEEE Trans. Circuit Syst. Video Techno, vol. 10, Sep. 2000, pp. 878-4.
[3] C. Lee, S. Lee, Y. Oh and J. Kim, Real-Time H.2 Rate Control for Scene-Changed Video at Low Bit Rate [J], International Conference on Consumer Electronics, 2007, pp. 1 – 2.
[4] K. Ngan, T. Meier and Z. Chen, Improved Single-Video-Object Rate Control for MPEG-4 [J], IEEE Trans. Circuit Syst. Video Technol., vol. 13, May 2003, pp. 385-393.
[5] M. Jiang, X. Yi, and N. Ling, Improved frame-layer rate control for H.2 using MAD ratio [J], IEEE international Symposium on Circuits and Systems, Vol.3, Vancouver, Canada, May 2004, pp. 813-816.
[6] M. Jiang and N. Ling, An improved frame and macro block layer bit allocation scheme for H.2 rate control [J], IEEE International Symposium on Circuits and Systems, Vol. 2, May 2005, pp. 1501 – 1504.
[7] D. LeGall, MPEG: A Video Compression Standard for Multimedia Application [J], Commun. AGM, vol. 34, April 1991, pp. 46-58 .
Improved Frame-layer Rate Control Scheme for H.2
Zhang Lei, Yang Jie
Department of Signal and Information Processing, WuHan University of Technology, HuBei,
PRC (430063)
Abstract
This paper presents an enhanced Frame-layer rate control for H.2 using novel mean absolute difference (MAD) prediction and adaptive quantization parameters (QP) adjustment. In the condition of high motion scenes or scene changes, traditional linear model for MAD prediction will be unable to gain accurate predicted MAD of current frame. By analyzing the relationship between average MAD of some previously encoded P frames in the GOP and the actual MAD of the last previously encoded P frame, a more accurate MAD prediction model is proposed to substitute linear model for MAD prediction. In order to improve overall visual quality, an adaptive QP adjustment method based is also presented. Experimental results show that proposed MAD prediction model can accurately predict the MAD of current frame as compared with the linear model. Moreover our proposal scheme improves the average PSNR by up to 0.95 dB.
Keywords: Mean Absolute Difference , H.2, Rate Control, Quantization Parameters , Rate-distortion Optimization, Peak Signal-to-noise Ratio
表1 多个序列平均 Y-PSNR 值, PSNR 波动率,和比特率的比较
Average Y-PSNR(db)Y-PSNR std. Deviation Bit Rates(kbps) Sequence Frame Rate
(fps) JVT[1]Ours Gain JVT[1]
Ours
JVT[1] Ours
Foreman(93k
bps) 15 36.3836.90+0.52 3.57 2.43 92.22 92.82 Foreman(32 kbps) 15 30.4631.22+0.76 4.19 2.91 32.23 31.83 Trevor (93 kbps)15 36.7037.51+0.81 2.56 1.73 93.08 93.28 Trevor (32 kbps)15 30.5431.41+0.95 3.48 2.76 32.23 32.47 News (24 kbps) 10 33.8734.02+0.15 1.05 0.81 24.03 24.08 Akiyo (32 kbps)
10
41.13
41.37
+0.24
1.86
1.69
32.10
31.96