人脸识别商业系列大讲堂丨关于人脸识别你需要

 ·  2018-04-27 17:59:52  ·  北京瑞铭安普科技有限公司
[ 导读 ] 到底什么是人工智能、机器学习和机器视觉?如今,人工智能被越来越多的被大家提及和应用,但对于人工智能和它的细分领域,例如机器视觉,却很少能有人说得清楚它们到底是什么以及如何工作的。本文是关于人工智能和人脸识别的基础科普。
 
人工智能( Artificial Intelligence ),英文缩写为AI。广义上的人工智能实际上等同于机器智能,通俗的解释就是就是赋予机器以人的智慧,让机器像人一样学会思考。而机器学习 ( Machine Learning, ML ) 是人工智能的一个研究分支,主要是设计和分析一些让计算及自动获取知识的算法,涉及到概率论、统计学、逼近论等多个领域。深度学习( Deep Learning, DL )又是机器学习的一个分支,可以理解为用计算机的算法模拟人类大脑的深度神经网络,然而对于神经网络我们还没有一个严格的定义,但其特点是试图模仿大脑的神经元之间传递,处理信息的模式。 
 
因此,简单而言,人工智能、机器学习和深度学习是一种包含关系。我们通过在计算能力和计算方式上的探索在不断接近人工智能的本质——一个具备自我学习和应变能力的智能机体。但我们不能单纯地认为人工智能只是把数学模型做的更准确一点,让机器拥有拟人化能力是一个漫长的发展过程:毕竟从计算机诞生到现在的移动互联网,我们就用了70年的时间。而现在我们才刚开始触摸到到智能时代的拐点的边缘。我们之所以认为是“今天”处在智能时代的临界点是因为以下最重要的两个条件的形成:
 
1. 计算能力到达了一定高度,摩尔定律推动了世界的发展;
 
2. 大数据的积累、传感技术的成熟。
 
今年正是人工智能概念提出的第六十周年,当年参与达特茅斯会议的最后一名在世的科学家——人工智能之父马文明斯基也于年初离世,我们经历了一个时代的结束也面临着一个新的时代的开始。大数据和机器学习让计算机变得特别聪明,以至于使计算机能够在某些领域很大程度的超过人类的极限能力,比如谷歌AlphaGo战胜了围棋世界冠军李世石,而人工智能的目的绝对不是让计算机和人类下下棋而已,可以说未来几十年将面临由大数据带来的智能革命,机器会获得越来越全面的能力。
 
但实际上,人工智能的应用范围博大精深,繁冗复杂,在每一个垂直领域的应用都需要克服难以想象的障碍。所以,我们先拆分大脑的功能,让机器一点点实现智能化。 
 
人的大脑需要借助各种感官,如眼睛、耳朵等,感知外界信息,然后进行判断,这其中用机器来代替人眼来做测量跟判断的动作,称为机器视觉,机器视觉是人工智能学科中发展的最为快速的分支,而当今大家熟知的人脸识别技术就是机器视觉最富有挑战性的课题之一。 
 
丨人脸识别丨
 
在深度学习诞生前,人脸识别研究人员试图不断改进、的提高计算机识别人脸的能力,但相对人类本身所具有的人脸识别能力仍然望尘莫及。直到2012年,深度学习开始影响人脸识别技术的发展,基于深度卷积神经网络的方法在不断突破人工智能算法的世界纪录。如何在一张环境复杂的图片中快速识别出人脸,对于人来说很简单,但对于机器而言,需要经历以下几个步骤: 人脸检测、人脸分析、人脸识别。 
一张图片输入机器后,需要先找到人脸的位置——人脸检测,然后在这个基础上定位人脸关键点的位置( 如眼睛中心或嘴角等 )并提取特征值——人脸分析,每个系统关键提取的数量相差很大,有的只有左右眼睛中心两个点,有的可能多达近百个点。这些点的位置一是用来做人脸的几何校正,即把人脸通过缩放、旋转、拉伸等图像变化变到一个比较标准的大小位置。这样待识别的人脸区域会更加规整,便于后续进行匹配。同时,现在的实际系统一般也都配有人脸光学校正模块,通过一些滤波的方法,去除一些对光照更加敏感的面部特征。在做完这些预处理之后,就是从人脸区域提取各种特征,包括 LBP、HOG、Gabor 等。最终相关的特征会连接成一个长的特征向量( Feature Vector ),然后匹配出人脸的相似度,根据相似度的大小,系统会判定两张图片到底是不是一个人——人脸识别 。所以,想要降低人脸识别的失误率,需要强大的算法支撑。
 
但失误率低是否就能在商业领域中站稳脚跟?
 
丨产学研就丨
 
常言道:实践出真知。 
 
再强大的算法如果不和现实的应用场景相结合也无异于纸上谈兵,除了名次的提升和无限接近于100%的实验结果,并没有带来实际的价值更何谈社会效益。人工智能产生的初衷是为了取代人力,将人类解放出来去创造更多的价值,人脸识别技术也同样应该遵循这个基本原则。目前,随着技术的发展和市场需求的快速增长,人脸已经在很多领域发挥了这样的价值,如远程在线核身,用刷脸替代实名场景中需要的人力和物力。 
 
而在实际应用场景中,我们通常会提到两个概念:即 1:1 和 1:N 。 
 
1:1 可以粗暴地理解为证明你就是你。事实上,1:1 属于一种静态比对,在泛金融的核身、信息安全领域中还有潜在巨大的商用价值。例如在机场安检口,总是需要有一个人拿着你的身份证看看你再看看证件,来确认你就是持证人,这种场景就是典型的 1:1 场景。然而人的肉眼识别精准度是在95%左右,且长时间工作容易疲劳,所以机场安检人员需要在半个小时到一个小时之内换班一次来保证识别的准确率。而人脸识别技术的出现,就完全能够解决这种场景下“需要一个人”的问题,当然,这种价值同样能在考试考生身份的审核、酒店入住办理,火车站人票合一认证等任何需要实名制的场景中体现。
 
在行业应用中,1:1 更多是应用在金融、核身、信息安全领域,特点是精准安全。而1:N主要应用的方向是在商业、安防等。比如一个女士去商场买包包,店员不知道她是否是会员。如果引用机器视觉技术,不管店员换没换,当顾客进门的时候她的信息就被推送给店员完成精准的推荐,这就是机器视觉在商业领域VIP客户识别的典型应用。在安防方面的应用比如公共场所动态监控、缉拿逃犯、人员布控等。
 
需要说明的是,人脸识别技术的成熟虽然能让计算机替代人眼取代一大部分在审核、找人工作中的劳动力,但它并不能作为严肃场景中的唯一的验证方式。举例说明,在某公共场所动态监控缉拿逃犯时,因受外界环境干预,可能会同时弹出5个疑似的人选,这时就需要人工协助,共同完成识别确认过程;又或者在企业应用中,具有较高机密性质的场所可以采用人脸识别和刷卡的双重认证来确保安全性。
 
可以肯定的是,相比于人眼的效率来说,人工智能的人脸识别能力要远远超过人类。但这并不代表机器不会出错,因此在准确形容人脸识别通过率的专用词汇中,有误识率一词,就旷视(Face++)而言,完全可以做到在万分之一误识率下,通过率达到98%并能够满足日常生活中的应用场景。毕竟,人工智能的意义是赋予人类更强大的能力、协助人类更高效的工作——正如如我们开篇说的,Power human with AI,而并非取代人类。