
计算机辅助设计与图形学学报
JOURNAL OF COMPU TER 2AIDED DESIGN &COMPU TER GRAPHICS
Vol 118,No 110Oct 1,2006
收稿日期:2005-12-10;修回日期:2006-03-16 基金项目:国家自然科学基金(60473022)
基于图像平滑度的空域LSB 嵌入的检测算法
张 涛
1,2)
平西建1) 徐长勇
1)
1)(信息工程大学信息科学系 郑州 450002)
2)
(中国科学院自动化研究所模式识别国家重点实验室 北京 100080)(deltd @yahoo 1com 1cn )
摘要 对图像像素值与邻域均值的差的分布进行建模,以该分布的方差定义了图像平滑度的概念,进而通过对消息嵌入、L SB 平面取反带来的图像平滑度的变化进行分析,提出了针对空域L SB 替换伪装算法的秘密消息长度估计算法,该算法可以准确地估计图像中嵌入的秘密信息数据量的大小1文中算法物理意义直观、实现简单、计算量小、计算速度快,有利于实现实时检测1实验结果表明该方法是有效的1关键词 信息隐藏;信息伪装;隐写分析;L SB ;图像平滑度;污染分布中图法分类号 TP911173
Detection Algorithm for Spatial LSB Embedding B ased on Image Smoothness
Zhang Tao 1,2) Ping Xijian 1) Xu Changyong 1
)
1)(Depart ment of Inf ormation Science ,PL A U niversity of Inf ormation Engi neeri ng ,Zhengz hou 450002)
2)
(N ational Key L aboratory of Pattern Recognition ,Instit ute of A utomation ,Chi nese Academy of Sciences ,Beiji ng 100080)
Abstract A new steganalytic technique capable of reliable detection of spatial L SB steganography is pro 2posed 1First ,the distribution of the difference between the current pixel and its neighborhood average is sta 2tistically modeled ,and then the variance of this distribution is defined as the image smoothness 1Based on the analysis of the effects on the image smoothness brought by message embedding and L SB plane flipping ,an estimation of the secret message length is derived 1The algorithm can accurately estimate the amount of hidden messages and detect the existence of hidden messages embedded in the image simultaneously 1It has also a distinct physical meaning ,and is easy to implement ,computationally efficient ,and is more suitable for real 2time detection 1Experimental results show that the proposed algorithm is effective 1
K ey w ords information hiding ;steganography ;steganalysis ;L SB ;image smoothness ;contaminated dis 2tribution
近年来,随着对信息隐藏技术研究的深入[1],
针对图像中隐藏消息的检测问题,亦即图像隐写分析技术,逐渐成为该领域一个新的研究热点[2]1文献[3]最早提出隐写分析者的目标包括秘密消息的检测、提取、混淆和使隐藏消息无效等;Johnson 等[4]进一步指出只要能检测出秘密消息的存在,伪装式的秘密通信就失败了,并对隐写分析技术进行了分类1
Westfeld 等[5]通过分析像素值对的统计分布规
律,建立卡方统计量来检测隐藏信息的存在性,但这
种算法仅对固定位置且连续嵌入的L SB 替换算法有效1Fridrich 等[6]提出的RS (regular 2singular )分析方法(简称RS 法)能检测连续L SB 替换和随机L SB 替换嵌入的秘密信息,并能可靠估计嵌入的秘密信息大小1此后研究人员相继提出了很多同类算法,如基于样值对分析的方法[7]、基于差分直方图
图像中秘密消息的嵌入,必然会在一定程度上改变图像信源的某些统计特征1实际的自然图像在局部区域内数据统计特性的变化较小,可认为图像信源具有局部平稳性,而秘密消息的嵌入会对这种局部平稳性产生一定的影响1为了定量地对这种影响进行分析,本文借鉴了文献[11]中污染分布的思想,将图像像素值与邻域像素均值的差的概率分布作为污染分布进行建模,把该概率分布的方差定义为图像平滑度,通过对消息嵌入、L SB平面取反带来的图像平滑度的变化的分析,构造了估计秘密消息长度的公式1
1 准备知识
111 污染分布
假设随机变量X服从分布F(x),而F(x)= (1-ε)F1(x)+εF2(x),其中F1(x)和F2(x)均为分布函数,ε∈[0,1],通常称F(x)为污染分布1其研究背景是,观察到的数据本应来自分布F1(x),却受到少量来自分布F2(x)的数据的污染1更准确地说,每观察到一个数据时,它有1-ε的概率来自F1(x),有ε的概率来自F2(x)1Huber[13]给出的实际例子是
F(x)=(1-ε)・Φx-μ
σ+
ε・Φx-
μ
3σ,
其中Φ(・)表示标准正态分布的概率密度函数1它表明,数据来自2个不同的正态分布N(μ,σ2)和N(μ,9σ2)1
112 基于空间域LSB替换的消息嵌入
通过替换最低位比特来嵌入秘密消息的一类方法是信息隐藏中最经典的一种方法,它只需对载体文件做很小且不易被觉察的改变就能隐藏大量的秘密信息1
空间域L SB嵌入可描述为:当像素值I(i,j)的最低位比特与待嵌入的消息比特m一致时,不做修改;否则,把I(i,j)的最低位比特设置为m,可以表示为
I S(i,j)=
I(i,j)-1,L SB(I(i,j))=1且m=0
I(i,j),L SB(I(i,j))=m
I(i,j)+1,L SB(I(i,j))=0且m=1
,
其中,L SB(I(i,j))表示I(i,j)的最低位比特,m
是待嵌入的消息比特1当载体提供的可嵌入位置多
于要嵌入的消息比特数时,可以从可嵌入位置中选
择部分位置来嵌入消息1选择部分位置的方法可以
是连续替换和随机间隔法等[14]1显然,随机间隔法
比连续替换法具有更好的安全性1
记原始载体图像为C,其中包含M×N个像
素,那么采用空域L SB替换方法进行信息伪装的最
大容量为M×N比特1假设嵌入的秘密消息比特
数与最大容量之比为p,其中0≤p≤1,称p为嵌入
率1在某些情形下可以给出嵌入率p的一个估计
值,而隐藏消息的检测可以看作判断嵌入率p是否
大于给定的门限1
113 自然图像的图像平滑度
自然图像可以看作是一个局部平稳的信源1对
于自然图像中的某一局部区域,由于物体具有相近
的电磁波反射特性,该区域内像元的灰度取值之间
有很强的相关性,可认为在局部范围内具有近似的
平稳性,也就是说在局部区域内图像数据统计特性
的变化较小1
针对空域L SB替换消息嵌入的特点,本文考察
图像中像素值与其局部邻域像素均值之差的统计分
布1记图像I在位置(i,j)的灰度值为I(i,j),对图
像中的任意像素,定义以当前像素为中心,大小为
(2K+1)×(2K+1)的窗口为当前像素的局部邻
域,定义当前像素与其邻域像素均值之差为
X(i,j)=I(i,j)-
1
(2K+1)・(2K+1)-1
・
∑
K
m,n=-K
(m,n)≠(0,0)
I(i+m,j+n)(1)
考察随机变量X的概率分布,记其概率密度函
数为f(x)1显然,概率密度函数f(x)具有如下性
质:
1)在全区间上的积分为1,即
∫+∞-
∞
f(x)d x=11
2)随机变量X的期望E[X]为0,或者说X
的概率分布是关于0近似偶对称的,因而有
∫+∞-
∞
f(x)・x d x=01
一般可以认为随机变量X近似服从广义拉普
拉斯分布,其概率密度为
Fν,β(x)=
v
2βΓ
1
ν
exp-
|x|
β
v
;
8061计算机辅助设计与图形学学报2006年
其中,ν为形状因子,Γ(・
)为伽马函数1图1所示为512×512标准灰度Lena 图像和随机变量X 的概率分布曲线
1
a 标准图像
Lena
b 随机变量X 的概率分布
图1 标准图像及其邻域差分的概率分布
随机变量X 的方差反映了当前像素值偏离邻
域像素均值的剧烈程度,它可以作为图像内部平滑程度的度量,因此定义自然图像I 的平滑度为
S M I =σ2
=
∫
+∞-∞
f (x )・x 2
d x 1图像平滑度取值越
大,表明当前像素值偏离邻域像素均值越剧烈,图像平滑性越差1
2 空域LSB 嵌入对图像平滑度的影响
211 载密图像的图像平滑度分析
分别针对原始载体图像C 和载密图像S 考察
随机变量X 的概率密度函数f C (x )和f S (x )1对原始载体图像C ,f C (x )=f (x );载体图像C 的图像
平滑度为S M C =σ2
C =
∫
+∞-∞
f C (x )・x 2
d x =
∫+∞
-∞
f (x )・x 2
d x 1
对包含秘密消息相对大小为p 的载密图像S 而言,相对于原始载体图像,有(1-p Π2)的像素保持不变,有p Π4的像素的最低位比特由0变为1,此时像素值相对于原始值增加了1;还有p Π4的像素的最低位比特由1变为0,此时像素值相对于原始值减小了11但当前像素的局部邻域内的像素值的均值是近似保持不变的,因为局部邻域内像素值增加1的像素数和像素值减小1的像素数在概率意义下是近似相等的1对像素值保持不变的像素的集合,X 的概率密度函数仍近似为f (x );而像素值增加1的像素的集合,X 的概率密度函数近似为f (x -1);像素值减小1的像素的集合,X 的概率密度函数近似为f (x +1)1因而对载密图像S 而言,X 的概率密度函数可以表示为
f S (x )≈1-
p
2・f (x )+p
4
・f (x -1)+
p
4
・f (x +1)
(2)
显然,f S (x )可以看作一种污染分布,是3个具有相同的概率分布形式仅均值不同的分布的线性叠加1载密图像S 的图像平滑度为
S M S =σ2
S =
∫
+∞-∞
f S (x )・x 2
d x ≈
∫+∞
-∞
[
1-
p
2・f (x )+p 4
・f (x -1)+
p
4・f (x +1)]
・x 2=1-p
2
・
∫+∞-∞
f (x )・ x 2
d x +p
4・∫+∞-∞
f (x -1)・x 2
d x +
p 4・∫+∞-∞f (x +1)・x 2d x =1-p
2・
σ2
C
+ p 4・∫+∞-∞f (y )・(y 2
+2y +1)d y + p 4・∫
+∞-∞
f (y )・(y 2
-2y +1)d y = 1-p
2・σ2C +p 4
・(σ2
C +1)+
p
4
・(σ2C +1)=σ2
C +
p
2
(3)
212 载密图像的LSB 平面取反后的图像平滑度分析
我们还可以对载密图像S 的最低位比特平面进行置反,也就是把所有像素的最低位比特取反(0→1,1→0),得到图像T 1相对于原始载体图像而言,T 中有p Π2的像素保持不变,有(1Π2-p Π4)的像素值相对于原始值增加了1,(1Π2-p Π4)的像素值相对于原始值减小了11因此,对图像T 考察当前像素值与局部邻域内像素值均值之差X 的概率密度函数,有
f T (x )≈
p
2
・f (x )+
12-p 4
・f (x -1)+
12-p
4
・f (x +1)1
此时,图像T 的图像平滑度为
S M T =σ2
T =
∫
+∞-∞
f T (x )・x 2
d x ≈
∫+∞
-∞
[p
2
・f (x )+
12-p 4
・f (x -1)+
12-p
4
・f (x +1)]
・x 2=
p
2
・σ2
C +
12-p 4
・(σ2
C +1)+9
06110期张 涛等:基于图像平滑度的空域L SB 嵌入的检测算法
12-p 4・(σ2C +1)=σ2
C +1-p 2
1 由此,可以得到第1种检测L SB 嵌入并估计秘
密消息嵌入率的公式为
p ^1=1+S M S -S M T =1+σ2S -σ2T
(4)
需要注意的是,计算S M T 时,式(2)中的邻域
均值可以用S 中对应位置像素的邻域均值代替1213 载密图像中加嵌秘密消息后的平滑度分析
同样也可以采用文献[11]中加嵌一段秘密消息的方法:在载密图像S 中以L SB 替换的方法加嵌一段长度为M ×N 的0,1随机序列m (可以采用随机性高的密文序列)1加嵌后得到的图像记为S m ,其中在加嵌过程中最低比特位由0修改到1的像素点的集合记为S 0m ,在图像S 中对应位置的像素点的集合记为S 0,在图像C 中对应位置的像素点的集合记为C 01针对像素点集合S 0和S 0m ,考察式(1)定义的随机变量X 的概率密度函数,分别记作f 20(x )和f 10(x )1
考察集合S 0
,该集合中所有像素最低比特位为0,其中有1-p Π2比例的像素是由载体图像C 中最
低比特位为0的像素在消息嵌入过程中保持不变而
得来的,因此这部分像素的概率密度函数近似为f (x );还有p Π2比例的像素是由载体图像C 中最低比特位为1的像素在消息嵌入过程中最低位比特被修改而得来的,这部分像素的概率密度函数近似为f (x +1)1如图2所示,图中0,1表示像素最低位1因此f 20(x )=1-p
2
・f (x )+
p
2
・f (x +1)1
图2 像素最低比特位在消息嵌入和加嵌过程中的改变
再考察集合S 0m ,该集合中的每一个像素都比集合S 0中对应位置像素值大1,因而f 10(x )=1-p
2
・f (x -1)+
p
2
・f (x )1
记像素点集合C 0中像素值与邻域均值之差X
的方差为σ2C 01需要注意的是,由于C 0
是图像C 中所有像素集合的一个子集,因此对于集合C 0来说
X 的概率密度函数和对整幅图像C 中所有像素来
说X 的概率密度函数不完全相等1
对像素点集合S 0来说,像素值与邻域均值之
差X 的方差为
σ220=1-p 2・σ2C 0+p 2・(σ2C 0+1)=σ2
C 0+p 2; 对像素点集合S 0m 来说,像素值与邻域均值之
差X 的方差为
σ210=p 2・σ2C 0+1-p 2・(σ2C 0+1)=σ2
C 0+1-p 2
1 由此可得另一个秘密消息嵌入率的估计公式为
p ^2=1+σ220-σ210(5) 此种方法的弊端在于秘密消息的估计值依赖于
秘密消息的加嵌,由于加嵌是一个随机过程,因此造成秘密消息的估计值也具有一定的随机性1可以采用多次加嵌的方法分别求秘密消息长度,然后取平均值作为最终的估计值1
3 实验结果与分析
311 典型图像的实验结果
为了验证本文算法的有效性,我们从USC 2SIPI 图像数据库[15]中选择了5幅512×512大小的标准灰度图像(如图1a 和图3所示)进行测试1采用随机间隔L SB 替换方法,在图像中分别加入嵌入率为0,2%,5%,8%,10%,20%,50%,80%,100%的秘密消息(秘密消息为随机截取的密文
),
然后用本文提出的2
种算法(分别对应式
(4),(5))和RS 法[6]分别估计秘密信息的嵌入率1
a woman1
b milk
c plane
d woman2
图3 测试中用到的标准图像
161计算机辅助设计与图形学学报2006年
表1 典型图像的测试结果
嵌入率Π%
Lena
算法1算法2RS法
woman1
算法1算法2RS法
milk
算法1算法2RS法
plane
算法1算法2RS法
woman2
算法1算法2RS法
0-4176 3137-0134-4196-1168-4111-312410147-0135015618135 2105-11124151-2149 2-2165-0111-31-0131-2143-11251316011983104211114142111161050113 501920176513111705109217121321313851024144211527110318191522185 831113122516841465184614741631915671571013624155916861371210861 1051784173101337146101145153714823126101691014929113111609198141669132 201710718132191771417116147141631816632173191522019837146221711918122154191 504914442118491274911456145461914814960150521225015413954127501314917054128 80781667514475138811958018480143811459416681144801729515483127791308019280125 100961541301001001021351041731849813511019010010010212811217510010010011699166195
312 在图像库上的测试结果
为了进一步分析算法1的性能,我们在包含
854幅图像的CB IR数据库[6]上进行了统计实验1
CB IR图像库以J PEG格式存储,大小为768×512
像素,共854幅,采用标准算法变换到256级灰度
BMP格式1采用随机间隔L SB替换方法,在图像中
分别嵌入10%~100%嵌入率的秘密消息,分别用
算法1和RS法估计秘密信息的嵌入率,表2所示
为2种方法得到的估计值的均值和方差1
表2 算法1与RS法的性能比较
嵌入率Π%
算法1
均值标准偏差
RS法
均值标准偏差
原始 01293841433531582E-2118467 101016733413090913801212616 2021114254130811911655217507 3031111874118752919406218677 4041112404134484114857212116 5051124244114325412818210935 6061151323198756718052410104 7071113993182257713931419523 80801783185058314519313432 9090145943169209412749418150 10010011477312768120204141
从表2中可以看出,当嵌入的秘密消息较小时,算法1的方差大于RS法,均值和真实值的偏离程度2种方法基本相当;当嵌入的秘密消息较大时,算法1的方差小于RS法,估计结果的均值比RS法更接近真实值1总体来讲,我们提出的算法对于空域L SB嵌入的检测是有效的1
计算速度方面,在配置Intel PentiumⅣ214GHz 处理器,256MB内存的PC机上,VC++610平台下,采用算法1在C BIR库上检测速度为31119MBΠs,而RS法的检测速度为01621MBΠs1这表明本文算法检测速度显著高于RS法,更有利于实现实时检测1 313 误差分析
当秘密消息嵌入率较小时,有一定的误差,原因如下:
1)分析载密图像S的图像平滑度时,得到了式
(2)表示的概率密度函数,式(2)是在如下假设下近似成立的,即对像素值保持不变、像素值加1、像素值减1的像素的集合,X的概率密度函数分别近似为f(x),f(x-1)和f(x+1),当嵌入率p较小时,假设不一定成立1同样对L SB平面取反图像T也存在类似的情况1
2)计算图像平滑度S M S和S M T时,我们假设局部邻域内的像素值的均值相对于原始载体图像近似保持不变,需要保证局部邻域内像素值加1和减1的像素个数近似相等,当嵌入率较小时,由于改变的比特数很少,该假设不一定成立1
1161
10期张 涛等:基于图像平滑度的空域L SB嵌入的检测算法4 结 论
本文借鉴了文献[11]中提出的污染分布的思想,将图像像素值与邻域像素均值的差的概率分布作为污染分布进行建模,并定义该概率分布的方差为图像的平滑度,通过对消息嵌入、L SB平面取反带来的图像平滑度的变化的分析,在此基础上构造了估计秘密消息长度的公式1实验结果表明,本文提出的算法是有效的1该算法物理意义直观、实现简单、计算量小,相比于RS法可以显著地提高检测速度1此外,本文算法对于像素值随机加Π减1方式嵌入的消息方法具有一定的借鉴意义,对于像素值随机加Π减1方式嵌入消息后的载密图像,式(2),(3)仍然是满足的,下一步我们将对这种嵌入方法的检测方法进行研究1
参 考 文 献
[1]Petitcolas F,Anderson R,Kuhn M1Information hiding—a sur2
vey[J]1Proceedings of the IEEE,1999,87(7):1062-1078 [2]Fridrich J,G oljan M1Practical steganalysis:state of the art[C]
ΠΠProceedings of SPIE,San Jose,California,2002,4675:1-
13
[3]Pfitzmann B1Information hiding terminology[C]ΠΠProceedings
of International Workshop on Information Hiding,Cambridge,
1996:347-350
[4]Johnson N,Jajodia S1Steganalysis of images created using cur2
rent steganography s oftware[C]ΠΠProceedings of International
Workshop on Information Hiding,Berlin,1998:273-2
[5]Westfeld A,Pfitzmann A1Attacks on steganographic systems
[C]ΠΠProceedings of International Workshop on Information
Hiding,Dresden,1999:61-76
[6]Fridrich J,G oljan M,Du R1Detecting LSB steganography in
color and gray2scale images[J]1IEEE Multimedia,2001,8
(4):22-28
[7]Dumitrescu S,Wu X,Wang Z1Detection of LSB steganography
via sample pair analysis[J]1IEEE Transactions on Signal Pro2
cessing,2003,51(7):1995-2007
[8]Zhang Tao,Ping Xijian1Reliable detection of spatial LSB
steganography based on difference histogram[J]1Journal of
Software,2004,15(1):151-158(in Chinese)
(张 涛,平西建1基于差分直方图实现LSB信息伪装的可
靠检测[J]1软件学报,2004,15(1):151-158)
[9]Sullivan K,Dabeer O,Madow U,et al1LL RT based detection
of LSB hiding[C]ΠΠProceedings of IEEE International Confer2
ence on Image Processing,Barcelona,2003:497-500
[10]Li Z,Sui A,Y ang Y1A LSB steganography detection algorithm
[C]ΠΠProceedings of IEEE Personal,Indoor and Mobile Radio
Communications,Beijing,2003:2780-2783[11]Guan Wei,Zhang Weiming,Liu Wenfen1Steganalysis based on
contamination data analysis[J]1Acta Scientiarum Naturalium
Universitatis Sunyatseni,2004,43(Suppl12):62-65(in Chi2
nese)
(管 伟,张卫明,刘文芬1基于污染数据分析的隐写分析方
法[J]1中山大学学报:自然科学版,2004,43(增刊2):62-
65)
[12]Liu Guangjie,Dai Yuewei,Wang Zhiquan1A reliable LSB
steganography based on histogram difference separation[J]1Ac2
ta Scientiarum Naturalium Universitatis Sunyatseni,2004,43
(Suppl12):213-216(in Chinese)
(刘光杰,戴跃伟,王执铨1基于直方图差分分离的LSB隐秘
的可靠检测[J]1中山大学学报:自然科学版,2004,43(增
刊2):213-216)
[13]Huber P1Robust statistics[M]1New Y ork:John Wiley&
Sons,1981
[14]Zhang Tao,Ping Xijian1Steganographic detection aiming at a
class of steganography algorithms[J]1Journal of China Institute
of Communications,2002,23(5):123-129(in Chinese)
(张 涛,平西建1针对一类信息伪装算法的隐藏信息检测
[J]1通信学报,2002,23(5):123-
129)
[15]University of South California1The USC2SIPI image database
[OL]1[2005
212210]1http:ΠΠsipi.usc.eduΠservicesΠdatabaseΠDatabase.html
[
16]University of Washington1CBIR image database[OL]1[20052 12210]1http:ΠΠwww1cs1washington1eduΠresearchΠmagedatabaseΠ
roundtruthΠ
张 涛 男,1977年生,博士,讲师,主
要研究方向为图像处理、模式识别、信息隐
藏1
平西建 男,1953年生,硕士,教授,
博士生导师,主要研究方向为图像处理、模
式识别、信息隐藏1
徐长勇 男,1980年生,博士研究生,
主要研究方向为图像处理、模式识别、信息
隐藏1
2161计算机辅助设计与图形学学报2006年
