【摘 要】 人脸识别由于其广泛的应用,现在业已成为多个学科领域的研究热点之一。本文综述了人脸识别理论的概念,并对人脸识别技术的发展历程做了简单的回顾,讨论了其中的关键技术,重点讨论了基于几何特征、模型和统计的方法,进而对人脸识别技术今后的发展方向提出我的一些展望。
【关键词】 人脸识别技术 模式识别
1 引言
人脸识别是近年来模式识别、图像处理、机器视觉、神经网络以及认知科学等领域研究的热点课题之一,被广泛应用于公共安全(罪犯识别等)、安全验证系统、信用卡验证、医学、档案管理、视频会议、人机交互系统等各个方面。
综合文献分析,广义上而言,所谓“人脸识别 (Face Recognition)”的研究范围十分宽泛,大致可以被分为以下4个方面的内容[1]:
(1)人脸鉴别 (Face Identification,狭义的“人脸识别”):即将待识别的人脸与数据库中的已知人脸比较,得出相关信息。
(2)人脸检测 (Face Detection):即从各种不同的场景中检测出人脸的存在并确定其位置。
(3)表情/姿态分析 (Expression/Gesture Analysis):即对待识别人脸的表情或姿态信息进行分析,并对其加以归类。
(4)生理分类 (Physical Classification):即对待识别人脸的生理特征进行分析,得出其年龄、性别等相关信息。
在本文中,我们主要探讨狭义的人脸识别,即人脸鉴别的相关研究成果。
2 人脸识别发展历程
人脸识别的工程应用始于20世纪60年代,经过50多年的研究,大致可以分为以下三个阶段:
第一阶段是主要解决了人脸识别所需要的面部特征。这一阶段的研究以Bertillon、Allen和Parke为代表。在 Bertillon的系统中,用一个简单的语句与数据库中某一张脸相联系,同时与指纹分析相结合,提供了一个较强的识别系统。而Allen则设计了一种有效的摹写手段[2],并在其后由Parke用计算机实现[3]。然而无论是哪种方式,该阶段的识别过程仍然全部依赖于操作人员,需要许多人为干预,无法实现自动人脸识别。
第二阶段是人机交互式识别阶段。研究人员用数学模型描述人脸图像中的五官长度等主要几何特征,并通过欧氏距离进行相似性度量。Harmon和Lesk利用特征矢量表示人脸面部特征,并设计了基于这一特征表示法的识别系统。[4]其后,Kaya、Kobayashi和T. Kanad也分别采用了各种不同的方式,对几何特征计算进行了研究[5][6]。但是,该方法依赖于操作员的知识,仍无法摆脱人的干预。
第三阶段是真正的机器自动识别阶段。该阶段人脸识别技术有了重大突破,很多经典算法相继出现,如特征脸、子空间方法、弹性图匹配法、基于统计外观模型和神经网络的人脸识别等。同时,也出现很多用于算法性能测试的公开人脸库,如ORL人脸库、YaleB人脸库、FERET人脸库等。
3 常用的人脸识别方法
一个全自动人脸识别系统一般包括三个关键技术:人脸检测、特征提取和人脸识别。根据方式的不同,人脸识别方法分为基于几何特征的方法、基于模型的方法、基于统计的方法、基于神经网络的方法和多分类器集成方法。其中,基于几何特征、模型和统计的方法最为常见。
(1)基于几何特征的方法
文献中记载最早的人脸识别方法就是 Bledsoe提出的基于几何特征的方法,该方法以面部特征点之间的距离和比率作为特征,通过最近邻方法来识别人脸。基于几何特征的方法非常直观,识别速度快,内存要求较少,提取的特征在一定程度上对光照变化不太敏感。[7]但是,当人脸具有一定的表情或者姿态变化时,特征提取不精确,而且由于忽略了整个图像的很多细节信息,识别率较低,所以近年来已经很少有新的发展。
(2)基于模型的方法
基于模型的方法也是人脸识别的重要形式,其中最广为使用的是隐马尔可夫模型。它是一种基于整体的或然率统计方法。对于一幅正面的人脸来说,马尔可夫的“状态”包括前额、眼睛、鼻子、嘴巴和下巴,这些状态以相同的顺序从上到下出现。这样,可以把人脸图像和隐马尔可夫模型结合起来,这些脸上的特征区域被指定为状态。[8]其他模型还包括主动形状模型和主动表象模型等。
(3)基于统计的方法
基于统计的三种人脸识别方法包括特征脸、Fisher脸和奇异值分解。使用特征脸进行人脸识别的方法首先由Sirovichand Kirby提出,并由Matthew Turk和Alex Pentland用于人脸分类。这些特征向量是从高维矢量空间的人脸图像的协方差矩阵计算而来,而该方法被认为是第一种有效的人脸识别方法。[9]Fisher脸法由Ronald Fisher发明,其所基于的LDA理论和特征脸里用到的PCA有相似之处,都是对原有数据进行整体降维映射到低维空间的方法。[10]而奇异值分解法,就是通过取奇异值分解中前面较大的奇异值对应的特征向量,提取出图像中由光照、表情、姿势等噪声对应的高频信息,来重构图像。[8]
4 结论
虽然人脸识别技术已经取得了长足的进步,但不容否认的是,现在的人脸识别技术还有着巨大的发展空间。探索如何解决在不同光线、不同角度条件下的人脸识别,如何提高识别的速度和准确率,将成为未来人脸识别技术的发展方向。但我们依然有理由相信,随着社会经济的快速发展,人脸识别技术势必会在信息化时代扮演越来越重要的角色。
鸣谢
感谢刘星成教授认真严谨的教学,使我们了解学会了一些创新应用方法,并对于学术精神和学术写作有了更深刻的认识。同时,再次感谢认真编写文献的专家学者们,尤其是对本文写作提供支持的郑伟诗副教授,感谢他对隐马尔可夫模型等人脸识别相关理论的认真讲解,特此对其致以诚挚的敬意和感谢。
【参考文献】
1周激流,张晔. 人脸识别理论研究进展[J]. 计算机辅助设计与图形学学报,1999,02:85-.
2Allen A L. Personal Descriptions[M]. Lodon: Butterworth, 1950
3F.Parker. Computer Generated Animation of Faces[C].In Proceedings ACM ANN Conference. New York, 1972,1:451-457.
4Goldstion R J, Harmon L D, Lesk A B. Man- machine interaction in human face identification [J]. Bell Syst Tech Journal , 1972,51 : 399- 427
5Kaya Y, Kobayashi K. A Basic Study on Human Recognition. In Frontiers of Pattern Recognition [C], New York: Academic, 1971,265- 2
6Kanad T. Picture processing system by computer and recognition of human face [D]. Kyoto: Kyoto University, 1973
7姜贺. 基于几何特征的人脸识别算法的研究[D].大连理工大学,2008.
8刘小军,王东峰,张丽飞,时永刚,邹谋炎. 一种基于奇异值分解和隐马尔可夫模型的人脸识别方法[J]. 计算机学报,2003,03:340-344.
9宇雪垠,曹拓荒,陈本盛. 基于特征脸的人脸识别及实现[J]. 河北工业科技,2009,05:428-430+433.
10谷春亮,尹宝才,孔德慧,胡永利. 基于三维多分辨率模型与Fisher线性判别的人脸识别方法[J]. 计算机学报,2005,01:97-104.