最新文章专题视频专题问答1问答10问答100问答1000问答2000关键字专题1关键字专题50关键字专题500关键字专题1500TAG最新视频文章推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37视频文章20视频文章30视频文章40视频文章50视频文章60 视频文章70视频文章80视频文章90视频文章100视频文章120视频文章140 视频2关键字专题关键字专题tag2tag3文章专题文章专题2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章专题3
当前位置: 首页 - 正文

基于FPGA的运动估计设计

来源:动视网 责编:小OO 时间:2025-10-01 17:24:36
文档

基于FPGA的运动估计设计

基于FPGA的运动估计设计高峰,段(西北工业大学电子信息学院,陕西西安710129)摘要:利用功能强大的FPGA实现视频图像的一种运动估计设计,采用的搜索方法是三步搜索法。在进行方案设计时,本文采用了技术比较成熟的VHDL语言进行设计,并使用QuartusII软件进行时序仿真。由仿真结果可知,无论是在功能的实现上还是在搜索的准确性、高效性以及FPGA片上资源的利用率上,本设计方案都具有明显的优越性。关键词:视频编码;FPGA;运动估计;三步搜索法;VHDL中图分类号:TN919.8文献标识
推荐度:
导读基于FPGA的运动估计设计高峰,段(西北工业大学电子信息学院,陕西西安710129)摘要:利用功能强大的FPGA实现视频图像的一种运动估计设计,采用的搜索方法是三步搜索法。在进行方案设计时,本文采用了技术比较成熟的VHDL语言进行设计,并使用QuartusII软件进行时序仿真。由仿真结果可知,无论是在功能的实现上还是在搜索的准确性、高效性以及FPGA片上资源的利用率上,本设计方案都具有明显的优越性。关键词:视频编码;FPGA;运动估计;三步搜索法;VHDL中图分类号:TN919.8文献标识
基于FPGA 的运动估计设计

高峰,段

(西北工业大学电子信息学院,陕西西安710129)

摘要:利用功能强大的FPGA 实现视频图像的一种运动估计设计,采用的搜索方法是三步搜索法。在进行方案设计时,本文采用了技术比较成熟的VHDL 语言进行设计,并使用Quartus II 软件进行时序仿真。由仿真结果可知,无论是在功能的实现上还是在搜索的准确性、高效性以及FPGA 片上资源的利用率上,本设计方案都具有明显的优越性。关键词:视频编码;FPGA ;运动估计;三步搜索法;VHDL 中图分类号:TN919.8

文献标识码:A

文章编号:1674-6236(2012)07-0190-03

Design of motion estimation based on FPGA

GAO Feng ,DUAN Zhe -min

(School of Electronic Information ,Northwestern Polytechnical University ,Xi ’an 710129,China )

Abstract:A program is designed to achieve the Motion estimation of video coding with the powerful FPGA.And ,three -step search method is used .During the scheme design ,VHDL design language has been used which has more powerful features ,more mature technologies .And use the Quartus II software to do the timing simulation .The simulation results show that ,both in function and in the realization of search accuracy ,efficiency ,and FPGA resource utilization on the chip ,this design has obvious advantages.

Key words:video coding ;FPGA ;motion estimation ;three -step search method ;VHDL

收稿日期:2012-02-15

稿件编号:201202070

作者简介:高峰(1987—),男,陕西延安人,硕士研究生。研究方向:电路与系统集成电路设计。

人类获取的信息中70%来自于视觉。视频信息具有直观性、确切性和高效性等优点,其在多媒体信息中占有重要地位,成为了主导现代生活的主力军。然而,视频信息信息量太大,对信息存储设备及通信网络均提出了很高要求,严重阻碍了人们对有效信息的获取和使用。而解决这个问题的途径就是视频编码即视频压缩。

目前,视频编码的主控制芯片主要有3种:ASIC 、FPGA 和DSP 。ASIC 和FPGA 属于硬件设计,DSP 属于软件设计[1-2]。从功能上说,全定制ASIC (Applieation Speeifie Integrated

Circuit )的功耗低、设计密度大并且能够完成高速设计,但同

时其开发周期很长,投片成本很高而且不容易对解决方案进行优化,应用范围很窄;DSp (Digital Signal Proeessing )可以提供强大的数字信号处理能力,其可编程特色可以支持各种标准格式的视频编解码算法,但其处理速度低、硬件结构不灵活;FPGA (Field Programmable Gato Airay )兼有了两者的一些优点如可编程、功耗低等[3-4],同时又具有设计周期短、开发成本低、处理速度快、设计灵活等特点。

1运动估计原理

运动估计主要是针对帧间预测,去除视频帧在空间域和

时间域的冗余度[5]。块匹配方法是目前编码效率较高,普遍采用的一种编码方法。首先,其要将当前帧进行划分。长期实践表明,将当前帧划分为多个16×16的块是比较合理的。其次,要根据划分出的当前块的具体情况,以及所采用的搜索方法来决定搜索窗口的大小。最后,要在所确定的搜索窗口里面,依据某种块匹配准则找到当前块的匹配块以及由匹配块到当前块的运动矢量。图1所示是块匹配法的原理框图,其中的箭头就是由参考帧到当前帧的运动矢量。

目前经常采用的块匹配准则主要有归一化互相关函数(NCCF ),最小均方差(MSE )以及最小绝对值(MAD )。其中由于SAD 准则在算法上并不需要做任何的乘法运算,可以减少很多的时间资源和硬件资源,从而使得SAD 准则成为了现在通常使用的匹配准则。

SAD (d x ,d y )=

(x 0,y 0)奂A

Σ

|f k (x 0,y 0)-f k -1(x 0+d x ,y 0+d y )|(1)

其中A 是参考帧中的搜索窗口区域,f k -1和f k 分别是当前帧和参考帧中的像素点值,(x 0,y 0)是块中的其中一个点。

电子设计工程

Electronic Design Engineering

第20卷

Vol.20

第7期No.72012年4月Apr.2012

图1

块匹配法原理框图

Fig.

1Block diagram of block matching algorithm

搜索采用的是三步搜索法,它是按照由粗到细的搜索理念,以一个像素为搜索精度,分为4,2,13个搜索步长进行搜索。一般选取原点作为起始点,分别按照4,2,13个步长组成

9个点构成的点群进行匹配运算,每次都是以误差最小的块

为准匹配块,在第二和第三步搜索时分别以第一和第二步搜索到的准匹配块作为它们搜索的起始点。原理如图2所示。

2硬件实现

运动估计的原理图如图3所示。

2.1地址计数器模块

地址计数器主要是产生出可以在RRAM (参考块存储器)

和CRAM (当前块存储器)中有目的地进行寻址的地址信号。如图4

所示

地址计数器模块的设计与当前块和参考块的存储有很大

的关系。将数据存入当前块存储器和参考块存储器时的顺序是由左到右,由下到上,即当前块存储器是(-7,-7),(-6,-

7),(-5,-7)……(8,-7),(-7,-6),(-6,-6)……(8,7),

(8,8)。而参考块存储器是(-15,-15),(-15,-14),(-15,-13)……

(-15,16),(-14,-15),(-14,-14)

……(16,15),

(16,16)。则可知在寻址当前块存储器时可以直接按照地址的由左到右,由下到上累加。其计算公式如式(2)所示:

C_addr =(j +7)×16+(i +8)(2)

对于参考块存储器,它是一个32×32的数据块,设计的目的是从其中取出符合三步搜索法的9个数据块,当然这九个数据块都是16×16的,而且是以原点为中心组成的搜索点群。其计算公式如式(3)所示:

R_addr =(j +15)×32+(i +16)

(3)

Clk 是时钟频率信号,当它发生上升沿跳变时会使得产生的地址跳变到下一个新值。

Clr 是清零信号,当它是低电平时,地址计数器可以产生

从零开始的连续地址。

由于,当前块存储器只是一个16×16的RAM ,其总的存储空间是256,则可知使用八位地址就可以进行寻址整个空间,即CRAM_ADDR 是八位输出信号。而参考块存储器是一个32×32的的RAM ,其总的存储空间是1024,则可知使用十位地址就可以进行寻址整个空间,即RRAM_ADDR 是十位输出信号。

2.2

参考块分频器模块

参考块分频器模块主要是将从参考块存储器中输出的信

号经过分频处理后,存储在9个的单元,以便后续的处理,如图5所示。

由参考块输出的信号是256×9个连续的像素值,而当前块输出的信号只是256个连续信号在连续时钟驱动下的九次重复,这样就很难在256×9个时钟周期内完成对9个匹配块的处理,更难在256个时钟周期内完成。因此要通过参考块分频器将参考块存储器连续输出的256×9个像素点值进行九次分频,存储在9个RAM 单元之中。这样当下一个时钟周期的上升沿到来时,这9个RAM 可以同时输出信号,并在接下来

的255个时钟周期之后将里面存储的所有信号输出,而且输出的这些信号相互之间是完全的。同时,为了使后面的各模块能够很好的进行,参考块分频器模块还引入了当前块的像素值信号,使得存入9个RAM 单元的信号不仅仅是参考块的像素点值,还有当前块的像素点值以便保证后面的减法器可以正常工作。

2.3减法器模块

减法器模块主要是完成当前块像素点值和参考块像素点

值之间的作差,并将做差结果进行取绝对值运算。本减法器是采用9个LPM (参数化模块库)元件库中的减法器合成的。而

图3运动估计原理

Fig.3Principles of motion estimation

图2

三步搜索法

Fig.2Three -step search method

图5参考块分频器模块

Fig.5Reference block divider module

图4地址计数器模块

Fig.4Address counter module

《电子设计工程》2012年第7期

LPM 中的减法器将被减数和减数明确地分开了。因此,在将

当前块和参考块像素点值输入到减法器之前先对二者进行比较,再分别输入到减法器的被减数和减数端口。这样当减法器设置为无符号数运算时,输出结果就相当于取了绝对值的差值。从时钟周期的角度发现,整个减法器在256×9个时钟周期内是都在运行的,但是所要采集的有用信号仅仅是9个的256个时钟周期,即每个减法器仅仅使用256个时钟周期的有用信号,其他时钟周期内的信号对于其他减法器是有用信号,但是对于本减法器却是干扰信号,必须要消除。这就是在参考块分频器里面引入当前块信息的原因。

2.4累加比较器模块

累加比较器主要是完成对每个减法器输出的取过绝对

值的差值信号的累加,并将累加结果进行比较输出最佳运动矢量。累加比较器的设计和减法器的设计有很大关系,除了在上述的取绝对值方面二者相互要求比较严格之外,在时序方面,二者也有很大关联。9个减法器在参考块分频器模块的作用下,工作于所有的时钟周期里面,而累加比较器则是以

减法器输出的信号作为累加原材料的,这就使得累加比较器也必须从时钟的起始点就开始工作。确定运动矢量的标准是SAD 最小值。也就是要通过比较9个累加结果,确定出最小值,并由地址计数器模块找到这个最小值所对应的运动矢量。

2.5整体方案

整体方案主要是将三步搜索法中的三步分开进行。在外

部输入信号的控制下,先输入第一步搜索的地址计算控制因子,使得寻址范围是在步长为4的9个数据块群里面,第一步搜索完成时将第一步搜索到的最佳运动矢量输入到第二步的搜索中,完成机制和第一步唯一的区别就是地址计算和产生的寻址范围不同,这样一直到完成第三步搜索时,将第三步搜索得到的最佳运动矢量作为当前块在这个搜索窗口里面的最佳运动矢量。

3实验结果与分析

本设计采用Stratix II 系列的EP2S15F484C3器件进行仿

真,仿真结果如图6所示。

图6三步搜索结果

Fig.6Three -step search

results

由仿真结果可知整个搜索过程完全符合时序要求,总的逻辑资源占用率是27%。组合查找表使用了2169个,占总数量12480的17%。专用逻辑寄存器使用了2855个,占总数量12480的23%。而用的总的寄存器数也就是2855。使用了180个片上引脚,占总个数的52%。使用了86088比特的块存储器单元,占总的快存储器数量的21%。搜索到的最佳运动矢量(0,-7),由前两步的搜索结果可知其完全正确。

4结束语

本文中采用FPGA 设计的运动估计方案无论在搜索速

度,资源利用还是时序控制上都具有一定的优越性,可以大大提高视频编码器设计的性价比。另外,随着半导体工艺的不断进步,FPGA 的性价比将不断提高[6],将使得运动估计乃

至视频编码的技术不断提高。参考文献:

[1]罗朝霞,高书莉.CPLD/FPGA 设计及应用[M].北京:人民邮

电出版社,2007.

[2]何小海,滕奇志.图像通信[M].西安:西安电子科技大学出

版社,2006.

[3]雷伏容.VHDL 电路设计[M].北京:清华大学出版社,2006[4]吴继华,王诚.Altera FPGA/CPLD 设计[M].北京:人民邮电

出版社,2005.

[5]Smith J R .The H.2Video Coding Standard[J].IEEE Competer Society ,2006,13(4):86-90.

[6]侯伯亨,顾新.VHDL 硬件描述语言与数字逻辑电路设计[M].

西安:西安电子科技大学出版社,2006.

-192-

文档

基于FPGA的运动估计设计

基于FPGA的运动估计设计高峰,段(西北工业大学电子信息学院,陕西西安710129)摘要:利用功能强大的FPGA实现视频图像的一种运动估计设计,采用的搜索方法是三步搜索法。在进行方案设计时,本文采用了技术比较成熟的VHDL语言进行设计,并使用QuartusII软件进行时序仿真。由仿真结果可知,无论是在功能的实现上还是在搜索的准确性、高效性以及FPGA片上资源的利用率上,本设计方案都具有明显的优越性。关键词:视频编码;FPGA;运动估计;三步搜索法;VHDL中图分类号:TN919.8文献标识
推荐度:
  • 热门焦点

最新推荐

猜你喜欢

热门推荐

专题
Top