基于深度卷积神经网络的人脸年龄分类
学习;年龄分类
0引言
人脸作为人类个体鲜明显著的生物特征之一,包含着丰富的个人信息。随着计算机视觉和机器学习技术的发展,相关的人脸识别等技术已成为这些项目任务的热点课题,并在法医、电子化客户关系管理、安防、生物识别和娱乐影音等诸多领域中得到广泛应用。人脸除了可进行身份认证和识别外,还可以提取出性别、种族和年龄等信息,特别是可以将年龄及分布特征用于人机交互和商业智能等应用中,因此年龄估计研究具有重要的科学意义和实用价值。
相对于人脸识别,人脸所能表征的年龄信息要受到很多因素的影响,例如不同个体的基因差异、生活习惯、环境、抗压能力、健康情况和种族差别等有很大的关系。同时,相同个体因发型、化妆和表情的不同也会影响年龄的估计。因此,如果要基于传统的分类算法(如支持向量机)并利用人脸图像信息来进行年龄分类将很难得到理想的结果。针对这些问题,目前的研究还相对不足,如果能有效解决上述问题,对大部分潜在的应用领域也都将带来深刻的影响。
1相关工作
年龄分类的主要流程是先根据人脸图像获取特征,再通过机器学习方法构建模型,通过把年龄分为多个年龄区段,即每个年龄段对应一个类别(比如未成年或成年人等)。因此可以把年龄分类看成是一个二分类或者多分类的分类问题来进行求解。1994年,Kwon和Lobo则从人脸图像中获取年龄分类,把人分为3种不同的类别,也就是儿童、青年人和老年人,强调重要特征点的选择。2002年Lanitis等人提出了能自动对年龄实现估计的年龄量化方法。而且,王先梅等的综述中也整体梳理了相关年龄估计技术的研究发展。王绍宇等人还基于SMV采用生物特征对人臉进行分类,分为小孩和成人。此外在2016年,董远等人更将迁移学习和卷积神经网络用于人的年龄和性别分类。
传统的浅层机器学习模型,如支持向量机(SVM)等分类方法很难建立一个统一的模型去表示人脸图像和实际年龄之间复杂的非线性关系,如果要提高年龄分类的准确性,需要通过大量地协配人工参与来研究提取能区分对应不同年龄类别的大量特征。深度学习算法能够优质克服传统浅层学习算法中需要手工提取特征的缺点,能自动地从低级别的图像中抽取特征,再逐层地抽取特征,最后获取高级别的抽象特征。卷积神经网络(CNN)作为深度学习算法的一种,近几年呈现迅速发展态势,并在许多图像识别任务中取得了很大的成功。Krizhevskv等在2010年的ILSVRC中利用深度卷积神经网络,对1000种不同类别的图片展开分类,取得了当时最好的识别率。此外,还在诸如语音识别、围棋等领域,卷积神经网络也得到了大量的应用。
本文工作主要面向不需要提取准确年龄信息,只需区分对象所处年龄段的应用场合,通过基于CNN的模型来对年龄进行儿童和成人的分类,能有效用于自动售货机出售酒精和香烟产品的授权、上网用户的成年人认证和公共场合对未成年人的重点视频监控等实际应用中。