
邢征军 ①邵惠鹤 ②胡立生③
摘 要 结合当前视频技术、计算机技术、通信技术的发
展情况,介绍一种远程数字视频网络监控系统的设计与实现。
文中首先分析了采用M PEG -1和H .263标准实现数字视频
监控系统的不足,提出基于M PEG -4标准的数字视频监控
系统的设计思想。接着给出了完整的基于M PGE -4的远程
数字视频监控系统的设计与实现。
关键词 视频监控 M PEG -4 AD SL 组播
视频监控以其直观、方便、信息内容丰富而广泛应用于安
保、生产管理等场合,成为金融、商业、交通乃至住宅、社区等
领域安全防范监控的重要手段,它为这些行业的安全防范和
环境监控起到了不可忽视的作用。近10年来,随着计算机、网
络以及图像处理、通信传输、自动化技术的发展,视频监控技
术也有了质的飞跃,视频监控系统从早期的模拟时代进入了
数字时代。另一方面,由于企业的活动范围日益扩大和工作场
所(特别是在一些危险性大、人不可直接观察或者不易直接观
察的特殊场合)日益增多,企业对远程数字监控系统的需求也
日益增加。
图像编解码技术是远程实时监控中的关键技术之一。近
十几年来许多专家学者提出了有关视频压缩的算法,国际上
也形成了统一的压缩标准。主要的图像压缩标准有M PEG -
1、M PEG -
2、M PEG -4、H .261、H .263等几个标准。目前许多实时监控系统采用的仍然是M PEG -1的格式。这种编码格式的压缩率不高(平均只有50:1),需要很高的传输速率。
在现有的实际网络带宽下,很难得到实时流畅的图像。另外,
低压缩的视频数据需要网络分配很大一部分带宽,往往也会
造成网络拥塞。目前在低带宽上传输活动视频的另一个解决
方案就是采用H .263标准,尽管H .263也具有较高的压缩
比,但是图像质量差于M PEG 4,灵活性也差于M PEG -4。
M PEG -4是新一代的图像压缩技术标准,它能利用很在窄的带宽,通过帧重建技术压缩和传输数据,使得能够以最少的数据获得最佳的图像质量,它在远程数字视频监控系统中的应用将会越来越广泛。下面简要介绍这种标准。一、M PEG -4视频压缩标准介绍M PEG -4是一个由M PEG (M oving P ictu re Experts
Group ,运动图像专家组)开发的国际标准。它的正式ISO IEC 名称为“ISO IEC 14496”,是继M PEG -1、M PEG -2之后ISO IEC 推出的又一个重要的视音频编解码标准。它于1998年10月制定完成,并于1999年1月成为国际标准。与其他压缩标准相比,M PEG -4最大的特点是其更适于交互AV 服务以及远程监控。M PEG -4是第一个使用户可在接收端对画面进行操作和交互访问的编码标准。它是基于内容(对象和实体)的编码,不像M PEG -1,2是基于像素的编码。M PEG -4对每一个对象的编码形成一个对象码流层,该码流中包含着对象的形状、位置、纹理以及其他方面的属性等。对一幅图像编码所形成的码流就由一系列这样的对象层码流所构成。用户可以直接对"对象层"进行存取操作,可以有选择的只对感兴趣的对象进行传输、解码和显示。M PEG -4特别针对低带宽等条件设计算法,其算法与M PEG -1、M PEG -2相比更为优化,因而在压缩效率上更高,同等条件如场景、图像格式和压缩分辨率条件下,经过编码处理的图像文件所占用的存储空间也越小,使低码率的视频传输成为可能。甚至在公用电话线上就可以连续传输视频,并能保持图像的质量,这是其它技术做不到的。另外,其它的压缩技术由于算法上的局限,在画面中出现快速运动的人或物体和大幅度的场景变化时,图像质量下降。而M PEG 4采用
基于对象的识别编码模式,从而保证良好的清晰度。这个特性
特别有利于出现异常时的图像监控,例如,出现小偷时,利用
M PEG -4编码很容易得到当时现场清晰的图像。二、系统的设计与实现1.系统介绍在日常生活中,很多的工作场合地处荒郊野岭,但图像远
程的实时监控往往又很有必要。铺设图像通信专线,采用无线
信号传输图像费用过高,不是任何企业都能承担或者必要,特
别是多点监控,再则是国家法律不允许乱铺乱设。而且,特殊
的地理位置是使铺设专线或安装无线信号中继施工困难,甚
至无法施工。另外,为了获得稳定的图像质量对网络的带宽和
图像的压缩码流有了一定的要求。综合以上的因素,我们选择
M PEG -4标准来压缩视频流,并采用AD SL 来完成网络传①②③胡立生 上海交通大学自动化系 副教授 上海 20003
邵惠鹤 上海交通大学自动化系 教授博士生导师 上海 20003邢征军 上海交通大学自动化系 硕士研究生 上海 20003
输。
AD SL 即非对称数字信号传送,是一种通过现有普通电话线提供宽带数据传输服务的技术,是一项将高带宽服务送到家庭和企业的新的运行平台。AD SL 能够在现有的普通电话线上提供高达1-8M b it s 的高速下行速率及0kb it s 到1M b it s 的上行速率,从带宽上远远满足了M PEG -4标准视
频传输25帧 秒至少需256Kb its 带宽的要求。AD SL 还可以与普通电话共存于一条电话线上,在接听、拨打电话的同时进
行数据传输而互不影响。在现有的电话线上安装AD SL 也极
其方便快捷,除了在用户端安装专用通讯终端外,不用对现有
线路作任何改动。为适应AD SL 不能获得固定IP ,远程数字
视频监控系统的构架设计如图1所示
。图1 系统构架图
从图1可以看出,整个系统由三部分构成:DV R 、服务器
(Server )和远程监控端(R emo te Superviso r )。DV R 是数字视频录像系统包括数码摄像头、云台、报警设备、M PEG -4图像
压缩卡以及控制软件等几部分。为了减轻CPU 的负荷,提高
计算机的性能,DV R 端采用硬件压缩视频流,并利用软件控
制视频流的存取和播放及其它辅助功能。而在服务器和
远程监控端考虑到各种功能的实现,采用软件解码器解码接
收到的视频流。另外,服务器拥有固定IP 地址,而每个
DV R 和远程监控端是普通的网络用户,每次连接In ternet 时动态地获得一个IP 地址。与系统构架相对应,整个软件模块
也分为三个部分:M ain (文件夹中包含DV R .dll );Server (服
务器端);和Server (远程监控端)。为了使用方便,将服务器端
和远程监控端作为同一个软件包Server ,而在运行Server .
exe 时起始画面对话框中只需选定是服务器还是远程监控端。整个软件各部分均采用V isual C ++6.0编写。
2.各部分网络传输工作流程
1)DV R
DV R 通过摄像设备获得本地视频,并通过M PGG -4视频压缩卡压缩成适于远程传输的M PEG -4视频流。每次开机时将本地信息(名称、动态IP 地址和摄像头数目)自动报告给服务器;当接收到传送命令时将本地实时音视频数据或者历史资料发送给服务器或者远程监控端;关机时再
次回报服务器,表明本DV R 不再接收数据传送命令,直到下一次开机。
2)服务器(Server )服务器拥有固定的IP 地址,并且一般情况下不会关机。每当有DV R 上线工作时,则将这个DV R 的有关信息存储并更新地址列表。地址列表可以被任意一个远程监控端读取;而当每一个DV R 关机下线时重新更新地址列表。服务器上也可以随时对任意一个DV R 的实时数据和历史资料进行监看。
3)远程监控端(R emo te Superviso r )远程监控端开机后从服务器上自动获取所有在线DV R 的地址列表,选择监看对象和通道后可以监看想要的DV R 实时数据和历史资料。每个DV R 在开机的时候会主动向服务器汇报个人信息,所以在地址簿里会出现目前在工作的DV R
(名称、IP 地址和通道数目)列表,地址列表每30秒自动刷新一次,而点击“刷新”按钮可以对地址表实时更新;另外,如果服务器IP 地址出现变动,会使得每个DV R 自动登录不能成功,则地址列表里不会出现任何内容,这时可以点击按钮“手
动”人为地增加地址簿的内容。
每个远程监控端查看都需要验证用户名和密码,以保证
系统数据的安全性。这样远程用户只要有权限,无论在家中还
是出差在外地都可以使用笔记本通过AD SL ,实时查看工业
3.系统主要功能设计与实现
系统功能主要包括监控与录像、报警、远程回放及资料下载备份、日志功能、组播和多国语言等几方面。
1)监控与录像
多路同时监控和录像。可同时监控多达十六路的实时视频音频多媒体信息,并可通过软件随时切换监听任一路音频。由于系统将音视频信号以M PEG-4格式压缩,所以数据量大为减少,可以长时间存储。硬盘存满前有相应操作提示。服务器(Server)和远程监控端(R emo te Superviso r)均可以通过友好的界面控制云台的转动、调整摄像头的参数(焦距、光圈等),以改变监控区域。为了防止多点同时控制时产生冲突,软件提供了控制权锁定功能,在锁定期间其它远程监控端不能进行控制,除非其级别更高。
2)报警
采用多种方式报警如:防盗报警;防火 环境报警(烟雾、温度、湿度报警);设备 运行报警(过热、设备跳闸报警)。当监视区域有异常变化时,则在服务器和远程监控端上均会及时以声像报警,并可控制外接警报器报警。控制现场设备提出警告,还可触发录像,将监控现场此后的情景记录在案。可通过调制解调器自动拨叫用户设定的多个电话号码(如110,值班室等),向对方以语音报警,语音内容可以事先录制、编辑好。
3)远程回放及资料下载备份
全中文操作,支持远程录像回放及录像资料下载。采用三种方式选定需要回放及下载的录像文件:1)以选择现场线路号、日期时间作为条件,进行查询;也可以指定月份,获得该月份内所有的录像文件列表,从中选取需要的录像进行回放及下载;2)直接指定日期、时间和线路号,找出相应的录像文件;
3)可以根据日志了解无人值守时发生告警的时间并直接调出当时的现场录像文件。回放提供的功能包括循环播放、单帧进退、播放及暂停、打开录像时间显示及关闭录像时间显示、画面大小调整、导出单帧图像等功能。支持四路同时回放,可将下载的录像资料刻录到光盘备份。
4)日志功能
系统的每个重要的操作和事件都有详细的日志记录。日志分为三个部分:报警日志、录像日志及用户操作日志。开启报警功能后,系统自动记录报警事件及线路编号,并写入日志。发生事故后,可根据报警时间及报警时该线路视频图像知道事件发生时间及责任人。当开启任何一种录像功能时,都会记录线路号、录像起始时间,并写入录像日志。通过录像日志可以进行系统的调试(检验录像是否正常),并且起到所有录像存盘文件的总索引功能。用户操作日志中记录了所有用户对系统做的任何操作,包括正常登录,登录不正确,退出系统,各项配置变更等等事件。日志功能仅供拥有系统管理员级权限的用户使用。
5)组播
为了更好的改善网络传输环境,本监控系统增加了组播的可选项。当需要监控的场所(DV R)越多,远程监控用户越多,致使网络载荷很重时,选择组播的传输方式,能够得到较好的图像质量。
众所周知,IPv4定义了IP数据通信方式:单播、广播和组播。单播是单点对单点的传输方式,广播是向IP子网内所有IP地址以广播的形式发送数据包,所有子网内的IP地址都会收到广播。组播是只向特定的IP地址发送数据包,是界于单播和广播之间的通信方式。应用IP组播技术网络在数据流分布树的分叉处进行信息包复制,而不是由信息源节点多次重复地发送相同的数据包。也就是说,用户只需发送自己信息的一个拷贝到于它相邻的路由器(支持IG M P),在路由器处按需进行这个拷贝的复制,到达下一路由器处进行类似的复制,直至到达特定的IP地址处。由此可见,组播技术可以有效地减轻网络负担,避免网络资源的浪费,利用组播技术可以很方便地实现“多点对多点”的传送功能,并且还可以实现广域网的通信,这比较符合视频监控系统多点、多机监控、跨局域范围的远程监控的要求。
由前面分析可知,IP组播必需要有路由器的支持,所有路由器必须支持IG M P(In tenet组管理协议)。由于本系统是AD SL上的远程视频传输,中间经过的路由器不一定都支持IG M P。对于不支持IG M P的普通路由器,要实现IP组播,必需要采用别的办法。目前比较通用的办法是采用“IP隧道”的方式进行传输,也就是支持IG M P的路由器按IG M P协议传送组播数据报,对于中间不支持IG M P的普通路由器,将组播数据报封装成常规IP数据报以普通的IP数据报按单播方式发送出去。"隧道”两端的两个群组的多目网关必须是支持组播的路由器,并配置M rou ted程序(一个处理组播路由选择程序),这样才能实现“IP隧道”。每个路由器监听发送给本群组(已建立“IP隧道”)的数据报,当接收到数据报后,执行M rou ted程序使用常规IP单播地址将数据报发送给本“IP隧道"的另一运行M rou ted程序的路由器,该路由器收到单播数据报后,M rou ted程序将该数据报投寄到本群组组播主机,实现组播。
6)多国语言实现
为了实现产品在世界各地的推广,本软件实现了简体中文、繁体中文和英语三个版本。程序运行时系统会自动识别当前的语言平台,并调用对应的字体和资源,实现多国语言的兼容。
三、结束语
本系统采用M PEG-4的视频压缩技术,并结合组播技术,视频流占用的带宽较小,在AD SL网络上系统运行稳定,图像质量好。M PEG-4是新一代的图像压缩技术标准。尽管发布不久,该标准仍在不断完善之中,但由于其低码流高质量
的编码方式,尤其适合远程监控这类需要高质量低带宽的应用。目前,在市场上已有公司在其基础上做成了成熟的监控产品,并应用到实际工作场合,它必将成为未来远程数字视频监控系统压缩标准的主流。参考文献
[1]监控系统开发及应用,刘富强编著机械工业出版社
[2]V isual C ++实现M PEG JPEG 编解码技术,张益贞刘滔编著,人民邮电出版社[3]视频编码与低速率传输,沈兰荪卓力田栋汪孔桥编著,电子工业出版社[4]数字图像通信原理与技术,王汇源编著国防工业出版社
[5]最新视频压缩技术在数字监控领域中的应用,h ttp :
www .m icroview .com .cn netdvsr app .h tm
[6]IP 组播分析及模式改进余义建史能计算机工程2001年11期(收稿日期:2003年7月7日)(上接第12页)很大的人工操作,智能化程度较低,但这样的索引匹配程度却是非常之高。
2.基于特征的索引
在该系统中,视频数据基于特征的索引实现方法如下图3所示。
图3 基于特征索引的实现
其实现原理是,对于一段视频取出某一帧作为代表帧(R 帧,一般取舌像图像最清晰的一帧最为代表帧),然后对该代表帧进行R GB 值的提取,用分析得到的R GB 平均值作为该段视频的特征索引。
具体实现如下,对于某病人的视频文件利用视频播放工具提取出其中某一帧,然后利用本系统的R GB 提取工具,针对该代表帧中舌像的某一区域进行R GB 分析,然后将分析得到的R GB 特征值连同病人的个人信息、病理信息以及视频文件的存储路径一起作为一条记录插入数据库中,这样就为病人视频文件建立了基于特征的索引。其中,R GB 平均值的提取如下图4所示。
首先,由用户选定某一特定的舌头的部位,进行R GB 的分析,然后在提取R GB 特征值的同时,还可以分析视频数据所包含的一些静态的病理信息,如“舌面乳头数”,“舌色”等。最后将个人信息、病理信息、R GB 特征值以及视频数据的存储路径一同自动添加入数据库中,从而建立了基于特征值的索引。
对于这种索引,在检索时先给出作为条件的图片,分析其中指定部位的R GB 值,然后根据R GB 值找出数据库中与其匹配的代表帧(R 帧),根据代表帧再去确定相应的视频文件。其中,R GB 值的匹配仍然借助于关系型数据库的检索技术。
以上所采用的两种索引中,前者需要人工分析得到图像的文字索引,所以人工程度较高,但匹配时较为准确。而后者图像的R GB 值的分析是由计算机完成的,因此智能化程度高,但匹配时紧密程度不如前者。图4 R GB 特征值的提取四、小结以上结合中医舌诊信息综合系统的开发,对视频数据库中的索引技术进行了研究应用。作为一种新兴的研究领域,视频数据库系统还没有完善的理论体系,其中的一些技术还不够成熟,同时,它还受到图像理解、人工智能等相关研究领域发展状况的制约,因此,视频数据库系统的发展还有很长的路要走,但它的应用前景非常广阔。参考文献[1]周洞汝胡宏斌等著《视频数据库管理系统导论》科学出版社T P 311.13[2]张维明等著《多媒体信息系统》电子工业出版社T P 3919[3]敖永红邹钢吴志等基于SQL Server 数据库多媒体数据的管理微型电脑应用V o l .18N o .12002[4]万春用ADO 对象实现数据库的事务处理微型电脑应用V o l .17N o .82001[5]M arc D avis ,M edia Stream :A n Icon ic V isual L anguage fo r V ideo A nno tati on ,IEEE Sympo sium on V isual L an 2guages ,1993.(收稿日期:2003年11月2日)
