1、2023-05-10计算机应用,Journal of Computer Applications2023,43(5):1578-1583ISSN 1001-9081CODEN JYIIDUhttp:/基于多峰标签分布学习的多任务年龄估计方法何建辉,胡春龙*,束鑫(江苏科技大学 计算机学院,江苏 镇江 212100)(通信作者电子邮箱)摘要:针对面部年龄估计中标签序数信息和类间相关性提取难的问题,提出一种多峰分布(MPD)年龄编码,并基于该年龄编码构建了一个多任务年龄估计方法MPDNet(MPD Network)。首先,利用MPD将年龄标签转化为年龄分布,以提取年龄标签间的相关信息,构建年龄老化
2、趋势的阶段性;然后,采用一个轻量级网络进行多阶段的特征提取,并对提取的特征分别进行标签分布学习(LDL)和回归学习;最后,共享两个学习任务的输出,并在训练过程中通过反向传播互相优化,避免传统标签分布学习中对分布结果直接进行回归导致的误差传播。在MORPH 数据集上的实验结果表明,MPDNet 的平均绝对误差(MAE)达到 2.67,与基于 VGGNets(Visual Geometry Group Networks)构建的DEX(Deep EXpectation)、RankingCNN(Ranking Convolutional Neural Network)等方法相当,而参数仅为 VGGNe
3、ts 的1/788.6;而且 MPDNet 也优于同体量的 C3AE(extremely Compact yet efficient Cascade Context-based Age Estimation model)、SSR-Net(Soft Stagewise Regression Network)等方法。MPDNet能够较好地利用年龄标签间丰富的相关信息来提取更具判别力的年龄特征,提高年龄估计任务的预测精度。关键词:年龄估计;年龄编码;标签分布学习;多任务学习;卷积神经网络中图分类号:TP18;TP391.41 文献标志码:AMulti-task age estimation meth
4、od based on multi-peak label distribution learningHE Jianhui,HU Chunlong*,SHU Xin(School of Computer Science and Engineering,Jiangsu University of Science and Technology,Zhenjiang Jiangsu 212100,China)Abstract:Considering the difficulty of extracting label ordinal information and inter-class correla
5、tion in facial age estimation,a Multi-Peak Distribution(MPD)age coding was proposed,and a multi-task age estimation method MPDNet(MPD Network)was constructed based on the proposed age coding.Firstly,in order to extract correlation information among age labels and construct aging trend stages,the age
6、 labels were transformed into age distributions by using MPD.Then,a lightweight network was used for multi-stage feature extraction,and Label Distribution Learning(LDL)and regression learning were performed on the extracted features respectively.Finally,the outputs of the two learning tasks were sha
7、red and optimized with each other by back-propagation during the training process,thereby avoiding the error propagation caused by the direct regression of distribution results in traditional label distribution learning.Experimental results on MORPH dataset show that,the Mean Absolute Error(MAE)of M
8、PDNet reaches 2.67,which is similar to that of the methods such as DEX(Deep EXpectation)and RankingCNN(Ranking Convolutional Neural Network)built by VGGNets(Visual Geometry Group Networks),while the parameters of MPDNet are only 1/788.6 of those of VGGNets.Meanwhile,MPDNet outperforms lightweight me
9、thods such as C3AE and SSR-Net(Soft Stagewise Regression Network).MPDNet can better utilize the rich correlation information among age labels to extract more discriminative age features and improve the prediction accuracy of age estimation tasks.Key words:age estimation;age coding;Label Distribution
10、 Learning(LDL);multi-task learning;Convolutional Neural Network(CNN)0 引言 面部年龄估计指通过人脸面部图像对人的真实年龄进行预测,是目前计算机视觉、生物特征识别领域的一个热点课题。现实中年龄信息的获取难度较高,且普遍依赖于个人隐私信息的读取,面部年龄识别技术能够避免这一敏感问题,并且扩展应用在各种服务领域1。面部年龄估计过程主要包含两个部分:特征提取和估计方法。基于深度学习的特征提取方法能够在像素级上捕捉人脸图像中的特征信息,相比传统的手工特征提取方法更具鲁棒性,因此深度卷积神经网络(Convolutional Neural
11、 Network,CNN)已经在年龄估计任务中的特征提取部分占据绝对位置。年龄估计任务的关键在于如何提取年龄标签间的顺序性和模糊性,即年龄标签间存在着明显的序数关系,并且标签越近,人脸特征越相似。在分类和回归方法中常用的年龄标签表示方式如one-hot编码和回归值难以体现出复杂的类间关系,因此将年龄估计任文章编号:1001-9081(2023)05-1578-06DOI:10.11772/j.issn.1001-9081.2022040606收稿日期:2022-04-29;修回日期:2022-07-06;录用日期:2022-07-07。基金项目:江苏科技大学科学研究基金资助项目(1132921
12、402)。作者简介:何建辉(1998),男,湖南永州人,硕士研究生,主要研究方向:计算机视觉、年龄估计;胡春龙(1985),男,江苏盐城人,副教授,博士,主要研究方向:生物特征识别、深度学习;束鑫(1979),男,江苏丹阳人,副教授,博士,CCF会员,主要研究方向:模式识别、计算机视觉。第 5 期何建辉等:基于多峰标签分布学习的多任务年龄估计方法务简单地划分为分类任务或者回归任务的研究方法并不严谨。标签分布学习(Label Distribution Learning,LDL)的目标是预测一组年龄分布,通过标签的概率表示重新表达标签,这种方式不仅能够准确地表示标签,同时可以建立起标签间的关系,从
13、而更好地利用标签的模糊性。标签的分布方式是LDL的一个重要组成部分,要获取真实的标签分布,理论上需要对同类样本进行大量的标记,然而目前绝大部分年龄数据集的样本数量都不具备上述条件,因此通常使用特殊的分布函数对目标分布进行拟合。高斯分布被广泛应用在许多基于标签分布的年龄估计任务2-3中,概率整体分布在均值附近,并且大约99.73%的分布集中在(-3,+3)区间。因此通过调整标准差,可以获得大量不同模糊程度的年龄分布。然而高斯年龄分布同样存在部分问题,因为高斯函数的曲线具有明显的对称性,而距离相等的其他标签对真实标签的贡献并非完全一致。而且研究1表明,人脸的老化趋势具有阶段性,因此各个年龄阶段的老
14、化模式可能对真实的年龄分布产生不同的影响。基于以上思想,本文设计了一种多峰分布(Multi-Peak Distribution,MPD)年龄编码,并基于 MPD 年龄编码提出了一个多任务年龄估计方法MPDNet(MPD Network),主要工作如下:1)为提取年龄标签的相关性和模糊性,并拟合真实年龄分布的集中性、多阶段和非对称等特性,提出一种MPD年龄编码;2)将LDL和回归学习相结合提出一种深度多任务方法。多任务学习的共享信息表征有助于缓解LDL训练目标与测试目标不一致的影响,同时减少训练数据不平衡对年龄回归的影响;3)提出一个高度精简的轻量化特征提取网络,在保证特征提取能力的同时减少了网
15、络参数,使得网络的训练时间大幅缩短,在一定程度上减少了网络对大样本数据集的依赖。1 相关工作 1.1面部特征提取随着大量训练数据集的出现和计算能力的提高,近年来CNN在图像分类、语义分割、目标检测等各个领域中都展现出了最先进的性能。在年龄估计任务上,CNN所学习到的年龄特征相较于传统手工制作的特征描述符更具鲁棒性,因此在非受限环境下,CNN的准确率更高。大多最先进的年龄估计方法都采用如VGGNets(Visual Geometry Group Networks)4和残差网络(Residual Network,ResNet)5等大规模CNN架构作为基础进行特征提取。Rothe等6在数据增强后的大
16、规模数据集IMDB-WIKI上训练了20个VGG-16网络集合,并计算出预测的平均值作为估计年龄,该方法在第一届ChaLearn LAP挑战赛上获得了第一名。第二年的ChaLearn LAP挑战赛冠军发现特定年龄组的个性化特征提取才是提高预测精度的关键,于是集成了两个 VGG-16 网络,其中一个仅用于估计0,12 岁儿童的表观年龄7。Zhang 等8基于多任务的思想,将性别作为辅助信息引入年龄估计,并采用了 RoR(Residual network of Residual network)进行特征提取,实验结果表明层次更深的 RoR效果比 VGGNets更好。虽然这些网络在年龄估计中取得了较好的效果,但也具有庞大的网络和大量的参数。随着移动端和嵌入式设备需求的不断增加,一些小内存的轻量级网络被提出,例如采用深度可分离卷积代替 标 准 卷 积 从 而 减 少 参 数 和 计 算 量 的 DenseNet9和MobileNet10等。但减少网络参数并不意味着必须使用更轻量的卷积方式,大量的研究表明,在年龄估计任务中使用标准卷积设计的轻量化网络同样可以达到良好的性能11-14。1.2年龄估