算术编码在图像数据压缩标准(如JPEG,JBIG)中扮演了重要的角色。在算术编码中,消息用0到1之间的实数进行编码,算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。算术编码器的编码过程可用下面的例子加以解释。
[例4.2] 假设信源符号为{00, 01, 10, 11},这些符号的概率分别为{ 0.1, 0.4, 0.2, 0.3 },根据这些概率可把间隔[0, 1)分成4个子间隔:[0, 0.1), [0.1, 0.5), [0.5, 0.7), [0.7, 1),其中表示半开放间隔,即包含不包含。上面的信息可综合在表4-04中。
表4-04 信源符号,概率和初始编码间隔
符号 | 00 | 01 | 10 | 11 |
概率 | 0.1 | 0.4 | 0.2 | 0.3 |
初始编码间隔 | [0, 0.1) | [0.1, 0.5) | [0.5, 0.7) | [0.7, 1) |
图4-03 算术编码过程举例
这个例子的编码和译码的全过程分别表示在表4-05和表4-06中。根据上面所举的例子,可把计算过程总结如下。
考虑一个有M个符号的字符表集,假设概率,而。输入符号用表示,第个子间隔的范围用表示。其中,和,表示间隔左边界的值, 表示间隔右边界的值,表示间隔长度。编码步骤如下:
步骤1:首先在1和0之间给每个符号分配一个初始子间隔,子间隔的长度等于它的概率,初始子间隔的范围用[,)表示。令,和。
步骤2:L和R的二进制表达式分别表示为:
和
其中和等于“1”或者“0”。
比较和:①如果,不发送任何数据,转到步骤3;②如果,就发送二进制符号。
比较和:①如果,不发送任何数据,转到步骤3;②如果,就发送二进制符号。
…
这种比较一直进行到两个符号不相同为止,然后进入步骤3,
步骤3:加1,读下一个符号。假设第个输入符号为,按照以前的步骤把这个间隔分成如下所示的子间隔:
令,和,然后转到步骤2。
表4-05 编码过程
步骤 | 输入 符号 | 编码间隔 | 编码判决 |
1 | 10 | [0.5, 0.7) | 符号的间隔范围[0.5, 0.7) |
2 | 00 | [0.5, 0.52) | [0.5, 0.7)间隔的第一个1/10 |
3 | 11 | [0.514, 0.52) | [0.5, 0.52)间隔的最后一个1/10 |
4 | 00 | [0.514, 0.5146) | [0.514, 0.52)间隔的第一个1/10 |
5 | 10 | [0.5143, 0.51442) | [0.514, 0.5146)间隔的第五个1/10开始,二个1/10 |
6 | 11 | [0.514384, 0.51442) | [0.5143, 0.51442)间隔的最后3个1/10 |
7 | 01 | [0.5143836, 0.514402) | [0.514384, 0.51442)间隔的4个1/10,从第1个1/10开始 |
8 | 从[0.5143876, 0.514402中选择一个数作为输出:0.5143876 |
步骤 | 间隔 | 译码符号 | 译码判决 |
1 | [0.5, 0.7) | 10 | 0.51439在间隔 [0.5, 0.7) |
2 | [0.5, 0.52) | 00 | 0.51439在间隔 [0.5, 0.7)的第1个1/10 |
3 | [0.514, 0.52) | 11 | 0.51439在间隔[0.5, 0.52)的第7个1/10 |
4 | [0.514, 0.5146) | 00 | 0.51439在间隔[0.514, 0.52)的第1个1/10 |
5 | [0.5143, 0.51442) | 10 | 0.51439在间隔[0.514, 0.5146)的第5个1/10 |
6 | [0.514384, 0.51442) | 11 | 0.51439在间隔[0.5143, 0.51442)的第7个1/10 |
7 | [0.51439, 0.5143948) | 01 | 0.51439在间隔[0.51439, 0.5143948)的第1个1/10 |
7 | 译码的消息:10 00 11 00 10 11 01 |
表4-07 符号概率
信源符号ai | ||||
概率 | ||||
初始编码间隔 | [0, 0.5) | [0.5, 0.75) | [0.75, 0.875) | [0.875, 1) |
输入第1个符号是,可知,定义初始间隔[,)=[0.5, 0.75),由此可知,左右边界的二进制数分别表示为:L=0.5=0.1(B),R=0.7=0.11… (B) 。按照步骤2,,发送1。因,因此转到步骤3。
输入第2个字符,,它的子间隔, )=[0.5, 0.625),由此可得=0.125。左右边界的二进制数分别表示为:L=0.5=0.100 … (B),R=0.101… (B)。按照步骤2,,发送0,而和不相同,因此在发送0之后就转到步骤3。
输入第3个字符,,, 它的子间隔[, )=[0.59375, 0.609375),由此可得=0.015625。左右边界的二进制数分别表示为:=0.59375=0.10011 (B),=0.609375=0.100111 (B)。按照步骤2,,,,但和不相同,因此在发送011之后转到步骤3。
…
发送的符号是:10011…。被编码的最后的符号是结束符号。
图4-04 算术编码概念
就这个例子而言,算术编码器接受的第1位是“1”,它的间隔范围就在[0.5, 1),但在这个范围里有3种可能的码符, 和,因此第1位没有包含足够的译码信息。在接受第2位之后就变成“10”,它落在[0.5, 0.75)的间隔里,由于这两位表示的符号都指向开始的间隔,因此就可断定第一个符号是。在接受每位信息之后的译码情况如下表4-08所示。
表4-08 译码过程表
接受的数字 | 间隔 | 译码输出 |
1 | [0.5, 1) | - |
0 | [0.5, 0.75) | |
0 | [0.5, 0.609375) | |
1 | [0.5625, 0.609375) | - |
1 | [0.59375, 0.609375) | |
… | … | … |
在算术编码中需要注意的几个问题:
1.由于实际的计算机的精度不可能无限长,运算中出现溢出是一个明显的问题,但多数机器都有16位、32位或者位的精度,因此这个问题可使用比例缩放方法解决。
2.算术编码器对整个消息只产生一个码字,这个码字是在间隔[0, 1)中的一个实数,因此译码器在接受到表示这个实数的所有位之前不能进行译码。
3.算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。
算术编码可以是静态的或者自适应的。在静态算术编码中,信源符号的概率是固定的。在自适应算术编码中,信源符号的概率根据编码时符号出现的频繁程度动态地进行修改,在编码期间估算信源符号概率的过程叫做建模。需要开开发态算术编码的原因是因为事先知道精确的信源概率是很难的,而且是不切实际的。当压缩消息时,我们不能期待一个算术编码器获得最大的效率,所能做的最有效的方法是在编码过程中估算概率。因此动态建模就成为确定编码器压缩效率的关键。