中文 | English |
2012年10月14日,安徽大学原副校长、中国图象图形学学会原副理事长、计算智能与信号处理教育部重点实验室原主任韦穗教授应邀来到天津大学应用数学中心组织的图形图像研讨会上作报告。研讨会由黄正海教授主持,天津大学金声教授、汉柏科技技术总监尚进博士,以及天津大学、南开大学、天津科技大学研究图形图像等相关领域的二十多位老师和同学参加了此次研讨会。
韦穗教授长期从事图像处理研究,承担了多项国家自然科学基金项目和“863项目”,荣获国家“863计划”智能机器人主题先进工作者称号及科技部授予的“国家863计划先进工作者”称号。本次研讨会上,韦穗教授首先介绍了图形图像领域的背景和最新进展,然后着重介绍了该领域的几位知名专家及他们的研究方向和成果,包括北京大学的高文院士、清华大学的丁晓青教授、中科院自动化所的李子青研究员研究团队和成果。
韦穗教授介绍到,北京大学高文院士曾为两会做识别系统,能够识别两千多位,他还做了中国人脸的数据库供大家研究使用。国际模式识别协会会士(APR Fellow)、清华大学丁晓青教授在第17届模式识别国际会议(ICPR2004)上,以全部测试指标均获第一而获得2004年国际人脸认证竞赛(FAT2004)“全面最优人脸验证算法奖(Best Overall Performing Face Verification Algorithm)”,其方法是采用Gabor变换。另外中科院自动化所的李子青研究员(中科院“百人计划”入选者)也做得很好,当选为国际电气与电子工程师学会会士(IEEE Fellow),研发的“AuthenMetric 中科奥森”人脸识别系统和智能视频监控系统,已在包括北京奥运会、上海世博会边检通关等多个国家重大安全项目中实施并发挥作用。周光召基金会科学奖获得者、汉王公司核心软件部经理黄磊在人脸识别、指纹识别以及视频场景信息动态分析应用等方面的一些创新成果在市场上得到了认可。他负责研制的人脸识别核心识别率达到95%以上,上市以来销售额超过了1.3亿元;主持研制的汉王智能视频监控系统,系统性能达到了国际先进水平,用于奥林匹克公园核心区人群监控,为国庆60周年安保工作作出了贡献。
韦穗教授介绍了她带领安徽大学学生参加人脸识别比赛的经历。该赛事由中国图象图形学学会和台湾图象图形学学会合办,每年一次比赛。比赛分多项内容,一项是性别识别、一项是年龄识别、一项是表情识别,还有就是身份识别。安徽大学组队参加了三届比赛,今年在年龄识别上获得一个单项奖。在这里,她谈到:“现在有一个算法,凡是正脸都能识别。用的是积分成像的一个算法, Haar(哈尔)图,已经放在OpenCV(Open Source Computer Vision Library,该编码实现了图像处理和计算机视觉方面的很多通用算法)里,但Haar算法对于图像中侧面人脸的检测效果并不理想。我们参加时还用了AVS(Audio Video coding Standard,音视频编码标准)编码。”
韦穗教授接着介绍了人脸识别算法的一些近期进展。在特征提取方面,局部二值模式(LBP: local binary pattern)模型是近期的一个热点,其效果要好于Gabor变换。分类基本上都用支持向量机(SVM: Support Vector Machine,一种基于统计学习理论的模式识别方法),人脸定位大部分采用主动形状模型(ASM: active shape model)算法,之后还要进行归一化处理(Haar对于正脸可以,但是侧脸不行,因此需要做一些仿射变换,对角度进行一些旋转;此外,对光照也要归一化)。稀疏表示是近期人脸识别的另一个进展,以微软亚洲研究院视觉计算组高级研究员马毅为代表,不用提取特征。安徽大学丁宏强教授做的是人工智能的新的模式识别算法。
天津大学金声教授在会上分享了他在国外工作期间,在图像处理上取得的成果和心得。他介绍说高文院士达到高识别率的一个基础就是建库比较严格,每人需要四到八张图。此前有结论曾指出,2000人规模的人脸识别可以做到准确率80%到90%,但是2000人到一万人之间准确率就呈下降趋势,超过一万人就只有百分之十几了。
金声教授介绍了他们近期完成的车型检测项目,他们采用了三维技术进行识别,对大货车、大客车、小货车、小巴、普通轿车、摩托车六种车型识别的平均准确率达到了93.7%;此外,在车牌识别部分,如果有人在O上贴个白条,把它变成Q,或者在P上贴一条,把它变成R,识别都不会受到影响。美国联邦调查局近期要提出的全国范围的人脸识别方案,也是基于三维技术,要求在2014年达到90%的准确率和秒级的识别速度。之所以采用三维技术,是因为摄像头位置很高的话,拍摄的人脸图像经常只有30%,他们希望利用三维技术,对30%的人脸也能识别。
金声教授还结合自己曾经做过的“老年痴呆早期检测”指出:有时真的需要把已有结果都拿来分析一下,看这条路能否走下去。如果错了,就没必要再走下去,得赶快换路。
研讨会上,在座的老师和同学还就稀疏编码、人脸识别的难点(光照、表情、年龄等)、压缩传感等进行了讨论。在讨论到识别的速度与效率时,韦教授认为:速度还不是瓶颈,主要是算法能不能有进展;图像的分辨率对识别结果肯定有影响,但不是完全决定因素。韦教授还谈到:感觉库很重要,美国联邦调查局提到的做三维的库,然后与摄像头拍摄的二维图像进行比对,也说明这一点;此外,建模也是很重要的。
此次研讨会为研究图像图形等相关领域的老师和同学提供了一个交流和学习的平台,取得了圆满成功。