这是一个“看脸”的时代,一谈人脸技术,大家最为熟知就是人脸识别。该技术在金融c社保c教育c安防等领域表现活跃,成为ai技术领域的明星。优图微信公众号之前也重点介绍过优图人脸识别,本文主要介绍一些背后默默支持人脸识别的技术。
一般而言,一个完整的人脸识别系统包含三大主要组成部分,即人脸检测c人脸配准以及人脸识别。三者流水线操作:人脸检测在图像中找到人脸的位置,接着人脸配准在人脸上找到眼睛c鼻子c嘴巴等面部器官的位置,最后人脸识别抽取特征与既有人脸比对计算相似度,确认人脸对应的身份。
解密:智能美妆和动效自拍背后的技术
图1人脸识别流程
1人脸配准简介
人脸配准(facealignnt)又称人脸特征点检测与定位。人脸特征点不同于角点或sift特征点等通常意义上的图像特征点,人脸特征点通常是一组由人工事先定义的点(见图2)。根据不同应用场景,特征点有不同的数目,例如5点,68点,82点等。
解密:智能美妆和动效自拍背后的技术
图2人脸特征点检测与定位中常用的目标检测点
除了在人脸识别系统中起关键作用之外,人脸配准技术也在3d人脸建模,人脸动画,人脸表情分析,人脸美化与虚拟化妆,人脸自拍动效等领域得到了广泛的应用。打个小广告,优图人脸配准跟踪技术性能卓越,主流手机单帧处理速度可达到3s以内,已经在“天天p图一动效自拍”c“手机qq一短视频”c“手机qq一视频聊天”“手机qz一ne一动效相机”等应用场景落地。
解密:智能美妆和动效自拍背后的技术
图3人脸美化与虚拟化妆
2人脸配准研究现状
传统人脸配准研究
和其他人脸技术类似,光照c头部姿态c表情等的变化,以及遮挡都会很大程度影响人脸配准的精度。但是人脸配准也具有自身特点,首先特征点描述了人脸的结构(轮廓和五官),人脸结构是完整稳定的,五官相对位置固定;其次,头部姿态c表情等变化造成的特征点位置变化明显。传统人脸配准研究需要一直尝试寻找更加精准的特征描述来表达这种既确定又变化的点的组合,再根据描述符选择适当的优化求解方法,从而定位人脸特征点。
最直接被采用的特征描述符是颜色c灰度,利用肤色的不同对人脸各部分进行检测定位。稍复杂些可选择各种纹理特征描述,如基于类haar纹理特征和adab一一st训练级联分类器的人脸配准。以上特征描述都没有考虑特征点之间的位置关系,因此不具备维持合理的人脸结构。主动形状模型(activeshape一dels,a)和主动外观模型(activeappearance一del,aa)可以同时表达纹理和形状(shape)两种特征。
二者的形状特征都由点分布模型(p一tdistributi一n一del,pd)来表达。图4为600张人脸图像中人脸特征点的统计分布图,红点表示各特征点的均值。a的每个特征点的纹理特征是分别表示的,通过计算特征点周围邻域纹理信息生成每个特征点对应的响应图(resp一nseap)。图5中蓝色圈定区域用于计算响应图,红点指示实际人脸特征点位置。aa使用整体人脸来描述纹理特征,通过将人脸特征点位置变换到标准形状上,得到与形状无关的人脸纹理,并基于主元分析方法对形状无关的人脸纹理进行建模。
解密:智能美妆和动效自拍背后的技术
深度人脸配准研究
从2006年开始,深度神经网络已经逐步在计算机视觉c语音识别和自然语言处理