?

基于年齡掩碼的跨年齡人臉識別

2023-02-07 02:25王靖亞
江蘇警官學院學報 2023年6期
關鍵詞:年齡特征掩碼人臉識別

劉 博 王靖亞

隨著人工智能和計算機視覺的快速發展,人臉識別已成為一種重要的生物特征識別技術。目前一般的人臉識別方法已經取得了優異的性能,甚至在一定條件下超越了人類①HE K,ZHANG X,REN S,SUN J.Deep Residual Learning for Image Recognition. IEEE Conference on Computer Vision and Pattern Recognition,NJ:IEEE,2016,pp.770-778.②Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks.Communications of the ACM,2017,60(6):84-90.。盡管一般人臉識別取得了顯著的成功,但由于人臉識別技術受個體年齡、表情、姿態等多方面因素影響依然面臨著極大的挑戰。2015 年Chen 等③CHEN B C,CHEN C S,HSU W H.Face recognition and retrieval using cross-age reference coding with cross-age celebrity dataset.IEEE Transactions on Multimedia,2015,17(6):804-815.的研究顯示在跨年齡識別任務中一般人臉識別模型的正確率會降低13% 以上。因此,在尋找長期失蹤人口、排查潛逃多年的犯罪嫌疑人等實際應用中如何將年齡變化的影響最小化是一個不可避免的挑戰??缒挲g人臉識別在以下方面仍然極具挑戰性。首先,在跨年齡人臉識別中,當年齡差距較大時,年齡變化會主導面部外觀,從而顯著影響人臉識別性能。其次,目前獲得大規模的同一身份各個年齡段均有圖片并且年齡段跨度較大的人臉數據集是極其困難的。

為了解決上述問題,現有的兩種跨年齡人臉識別方法是生成模型和判別模型。生成模型①Lanitis A,Taylor C J,Cootes T F.Toward automatic simulation of aging effects on face images,IEEE Transactions on pattern Analysis and machine Intelligence,2002,24(4):442-455.②Park U,Tong Y,Jain A K.Age-invariant face recognition,IEEE transactions on pattern analysis and machine intelligence,2010,32(5):947-954.提出合成不同年齡的人臉圖像來輔助人臉識別。一些研究旨在利用強大的基于生成對抗網絡③Goodfellow I,Pouget-Abadie J,Mirza M,et al.Generative adversarial nets, Advances in neural information processing systems,2014,27.的模型來提高生成的老化人臉的質量。然而,使用生成模型進行人臉識別通常分為兩步,首先通過生成模型將人臉建模到某一個或多個年齡類別,其次通過面部特征進行人臉識別。因此生成模型無法以端到端的方式優化模型性能,并且準確地模擬人臉老化過程也是困難和復雜的,合成人臉中的額外的噪聲會嚴重影響人臉識別的性能。因此,越來越多的研究集中于對判別模型的改進。

判別模型主要思想是從混合的人臉信息中剔除年齡相關特征,提取出年齡不變的身份特征,減小年齡因素對人臉識別的影響。早期的方法大多數使用局部描述符進行人臉特征的提取。Ling 等④Ling H,Soatto S,Ramanathan N,et al.Face verification across age progression using discriminative methods, IEEE Transactions on Information Forensics and security,2009,5(1):82-91.結合梯度方向金字塔(Gradient orientation pyramid,GOP)與支持向量機(Support vector machine,SVM)提取到年齡不變特征,實現了對不同年齡段的人臉驗證。Gong 等⑤Gong D,Li Z,Lin D,et al.Hidden factor analysis for age invariant face recognition,Proceedings of the IEEE international conference on computer vision.2013:2872-2879.提出了一種基于隱藏因子分析(Hidden factor analysis,HFA)的年齡不變人臉識別方法。他們將人臉圖像建模為兩個因子的組合:身份因子和年齡因子。身份因子捕捉人臉的個體特征,相對穩定;而年齡因子則代表由于年齡變化而引起的差異。通過矩陣分解這兩個因子并獲得年齡不變的人臉表征。之后,提出了一種最大熵特征描述符用于年齡不變人臉識別,它具有更高的表達能力,因此可以產生比傳統特征提取器具有更多區別信息的表示。Chen 等提出了一種稱為跨年齡參考編碼(Cross age reference code,CARC),該方法利用稀疏編碼技術與參考字典將目標人臉圖像編碼為參考樣本的線性組合,從而提取出對年齡變化不敏感的判別特征。盡管這些方法在一定程度上提高了年齡不變人臉識別的準確性和魯棒性,但仍然存在一些挑戰和待解決的問題。例如,如何處理非線性的年齡變化模式。深度學習在學習非線性特征映射函數方面性能優越。

其中基于卷積神經網絡(convolutional neural network,CNN)⑥LeCun Y,Boser B,Denker J,et al.Handwritten digit recognition with a back-propagation network, Advances in neural information processing systems,1989,2.的判別方法在年齡不變人臉識別中取得了較好的結果。Wen 等⑦Wen Y,Li Z,Qiao Y.Latent factor guided convolutional neural networks for age-invariant face recognition,Proceedings of the IEEE conference on computer vision and pattern recognition.2016:4893-4901.利用潛在因子引導卷積神經網絡(latent factor guided convolutional neuralnetwork,LFCNN)將HFA 擴展為深度學習框架。Zheng 等⑧Zheng T,Deng W,Hu J.Age estimation guided convolutional neural network for age-invariant face recognition,Proceedings of the IEEE conference on computer vision and pattern recognition workshops.2017:1-9.認為可以通過年齡回歸任務得到顯性年齡特征,因此提出了年齡估計任務引導下的跨年齡人臉識別模型(AE-CNN)。Wang 等⑨Wang Y,Gong D,Zhou Z,et al.Orthogonal deep features decomposition for age-invariant face recognition,Proceedings of the European conference on computer vision.2018:738-753.認為人臉上的年齡特征與身份特征是正交無關的,于是提出一種正交嵌入CNN(Orthogonal Embedding Convolutional Neural Network,OE-CNN)模型,該模型將CNN 網絡提取出來的人臉特征通過正交分解的方式分解為年齡特征與身份特征。Wang 等⑩Wang H,Gong D,Li Z,et al.Decorrelated adversarial learning for age-invariant face recognition,Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.2019:3527-3536.提出了去相關對抗學習(Decorelated Adversarial Learning,DAL),利用對抗的方式和批典型相關性分析(BCAA)思想提取出不相關的年齡特征與身份特征。Lee等①Lee J,Yun J,Park S,et al.Improving face recognition with large age gaps by learning to distinguish children.arXiv preprint arXiv:2110.11630,2021.人提出了一個原型間損失來最小化兒童面孔之間的相似性。Hou 等②Hou X,Li Y,Wang S.Disentangled representation for age-invariant face recognition: A mutual information minimization perspective,Proceedings of the IEEE/CVF International Conference on Computer Vision.2021:3692-3701.和Xie 等提出最小化同一個人的人臉圖像中與身份和年齡相關的分量之間的相互信息,以減少年齡變化的影響。為保留更多的身份信息,文獻③Z.Huang,J.Zhang and H.Shan,"When Age-Invariant Face Recognition Meets Face Age Synthesis:A Multi-Task Learning Framework and a New Benchmark," in IEEE Transactions on Pattern Analysis and Machine Intelligence,vol.45,no.6,pp.7917-7932,1 June 2023,doi:10.1109/TPAMI.2022.3217882.使用多任務學習框架(Multi-task Learning Framework,MTLF),在高層語義特征空間使用注意力機制約束分解年齡與身份特征。

年齡的變化不僅體現在面部形態的變化,還體現在面部的細節之處(如鼻唇溝稍加深、面部中間稍后陷)。目前大多數深度學習模型是從高層混合特征中分解出年齡特征,進一步使用正交分解或線性分解得到身份特征,但是高層混合特征對細節的感知能力較差,從而導致提取的年齡特征丟失了細節信息,進一步使身份特征依然含有年齡信息。并且特征解耦時,混合特征是高級特征具有很高的語義信息,年齡特征與身份特征嚴重糾纏其中,并不完全呈線性或正交關系。

基于對前人工作的分析與總結,本文提出一種新的單網絡端到端訓練的跨年齡人臉識別模型AM-FPN(Age Mask Feature Pyramid Network)。AM-FPN 主要由特征金字塔提取模塊、掩碼分解模塊和多任務訓練模塊三部分組成。采用特征金字塔網絡中的上采樣提取混合人臉特征,并在下采樣中加入空間注意力機制,融合低維和高維特征提取具有多維度年齡信息的年齡特征。通過本文提出的掩碼分解模塊中掩碼生成器與特征相乘機制,將提取器所得年齡特征映射到年齡掩碼空間,自動學習身份特征與年齡特征相關性。同時為了提高模型解耦效果,引入年齡估計損失函數、身份損失函數和跨年齡域對抗訓練損失函數來提高模型魯棒性。

本文模型主要貢獻:1.引入特征金字塔結構同時提取混合和年齡特征。前人研究成果是使用CNN提取人臉混合特征,之后使用注意力機制等方式從混合人臉特征中分離年齡特征,這種方式提取的年齡特征缺少對細節的感知。使用特征金字塔結構中的上采樣融合不同層人臉特征圖,增強了所提年齡特征對細節的感知能力。2.提出年齡掩碼分解模塊用于解耦身份特征。前人成果認為年齡特征與身份特征成線性或正交關系,但具體是什么關系并不確定。掩碼分解模塊會自動學習身份特征與年齡特征相關性。3.與前人成果相比,提高了跨年齡人臉數據集上的人臉識別準確率。

一、所提算法

(一)基于年齡掩碼的跨年齡人臉識別模型

如圖1 所示,AM-FPN 沿用文獻端到端的網絡思想,主要由特征金字塔提取模塊、掩碼分解模塊和多任務訓練模塊三部分組成。特征金字塔提取器采用自頂向下的架構,橫向連接構建金字塔特征。與遮擋人臉識別類似,AM-FPN 采用了基于ResNet50 架構的LResnet50E-IR 作為骨干網絡的主體部分,并對LResnet50E-IR 進行改進,在其橫向連接處添加空間注意力模塊(Spatial Attention,SA),以及在輸出位置添加映射模塊(Map)。掩碼分解模塊是將提取出來的年齡特征通過掩碼生成器(Mask Generator)生成年齡掩碼,之后與骨干網絡提取的混合人臉特征進行相乘得到不隨年齡變化的人臉特征。多任務訓練模塊主要使用跨年齡域對抗訓練、年齡估計任務和身份識別任務來共同監督特征分解。

圖1 整體模型圖

AM-FPN 模型對混合人臉特征進行深度解耦生成年齡不變人臉特征。具體來說,將訓練數據分批量輸入模型,人臉圖像通過特征金字塔提取器中的下采樣方式,提取出不同層次的混合人臉特征圖(X1、X2、X3)。其次,經過二倍下采樣的X1(C1)與經過一維卷積和空間注意力機制后的X2 相加得到C2。同樣,將經過二倍下采樣的C2 與經過一維卷積和空間注意力機制后的X3 相加得到C3。然后,將提取出的年齡特征圖通過映射模塊映射到混合人臉特征空間。之后,使用掩碼生成器去除共有特征生成年齡掩碼,將掩碼與混合人臉特征圖相乘,從而剔除年齡信息得到不隨年齡變化的身份特征圖。之后,不隨年齡變化的身份特征圖經過多層感知機生成身份特征向量。使用身份特征向量進行損失函數計算以及反向傳播更新模型參數。身份特征向量就是模型解耦得到的年齡不變人臉特征,將梯度反轉層(GRL①Ganin Y,Ustinova E,Ajakan H,et al.Domain-adversarial training of neural networks.The journal of machine learning research,2016,17(1):2096-2030.)融入多任務訓練策略是為了進一步提高模型解耦效果。

(二)特征金字塔提取器

在傳統的CNN 中,隨著網絡的層數增加,特征圖的分辨率逐漸減小,而感受野逐漸增大,這導致網絡對于細節的感知能力下降。如圖2 所示,FPN 通過在網絡中添加橫向連接來構建特征金字塔。具體而言,它在網絡的上層和下層之間添加了額外的連接,使得上層的粗粒度特征可以通過這些連接傳遞到下層。因此網絡就能夠同時獲取高層和低層的特征信息,從而在不同尺度上實現更好的感知能力。為了增強年齡提取模塊對年齡特征的感知能力,對FPN 網絡結構進行改進,在其橫向連接處引入SA 模塊。SA 模塊運用空間注意力機制建模卷積特征空間的相互依賴性來提高網絡的特征提取能力。在特征空間進行校準的機制,使網絡從全局信息出發來提升有價值的特征并且抑制對任務無用的特征。

圖2 改進后的特征金字塔提取器

特征金字塔提取的年齡特征圖大小為28×28×256,但是混合人臉特征大小為7×7×512。因為年齡特征與混合特征需要在相同大小的特征空間中進行掩碼分解,所以使用Map 模塊將年齡特征映射到與混合人臉特征相同大小的特征空間中。Map 模塊是由兩個3×3 卷積層、PReLU 和BN 層共同組成。

(三)年齡掩碼分解模塊

由于混合的面部表征嚴重糾纏于面部形狀和紋理變化等不相關信息,這些信息會引發較大的類內變化,導致對同一個體不同年齡的一對面孔識別錯誤。所以由改進后的LResnet50E-IR 提取的人臉特征可以看作身份特征和年齡特征共同糾纏的混合特征。目前一般使用線性組合或正交的方式模擬年齡與身份的關系,但這兩種方法在處理高級語義特征時過于簡單粗暴,難免會導致年齡信息并不能完全剝離。受遮擋人臉識別的啟發,本文提出了一種年齡掩碼的方式對身份特征和年齡特征進行建模,我們將掩碼分解定義為:

其中xid和xage分別表示身份特征與年齡特征,x表示人臉混合特征,·表示逐特征相與,f表示掩碼函數。本文設計了類似于注意力機制的年齡掩碼分解模塊實現將年齡特征從混合特征中剝離。其表達式為:

其中R是特征映射函數,S是sigmod函數。當S(xage)等于特定值時,掩碼分解模塊將會學到復雜組合,所以掩碼分解模式可以學到線性模式、正交模式和其他復雜模式。從模型角度來說,首先將融合了各特征層信息的X3通過映射函數R獲得與混合特征相同特征空間的高級語義年齡特征,之后經過掩碼器M生成年齡掩碼與混合人臉特征逐特征相乘,獲得不含年齡信息的身份特征。

(四)多任務學習損失

本文使用年齡估計任務、人臉識別任務和跨年齡域對抗訓練來監督特征分解。為了挖掘年齡特征,本文遵循文獻①Z.Huang,J.Zhang and H.Shan,"When Age-Invariant Face Recognition Meets Face Age Synthesis:A Multi-Task Learning Framework and a New Benchmark," in IEEE Transactions on Pattern Analysis and Machine Intelligence,vol.45,no.6,pp.7917-7932,1 June 2023,doi:10.1109/TPAMI.2022.3217882.對年齡分組的做法,將年齡按照10 年為一間隔劃分為7 個年齡組。年齡估計網絡具有512 和101 個神經元的兩個線性層,用于實現類似于(DEX)的年齡回歸,通過計算softmax 期望值來學習年齡分布。其次在年齡估計網絡上附加另一個線性層,使用交叉熵損失進行年齡分類,對學習分布正則化。年齡損失可表示為,真實年齡標簽與年齡回歸預測標簽的交叉熵損失加上真實年齡組與年齡估計網絡的交叉熵損失。

對于身份特征的學習,本文使用線性層l提取長度為512 的特征向量xid,并采用CosFace②Wang H,Wang Y,Zhou Z,et al.Cosface: Large margin cosine loss for deep face recognition,Proceedings of the IEEE conference on computer vision and pattern recognition.2018:5265-5274.損失函數增大類間距離,減小類內距離,監督xid地學習以進行身份分類。身份識別損失函數可表示為,512特征向量與真實身份標簽的交叉熵損失。

其次引入跨年齡域對抗學習,通過使用梯度反轉層(GRL)的連續域適應,提升xid的年齡不變性。綜上所述,年齡不變人臉識別在多任務學習框架下的最終損失為:

Lid為身份損失,λage為年齡損失系數,Lae為年齡損失函數,λid為梯度反轉層損失系數。與其他文獻不同的是,公式(3)中的第二項與第三項使用相同的網絡結構和參數進行共同訓練。經實驗此方式可以在減少訓練參數的同時保證具有相同的模型訓練效果。

二、實驗分析

(一)實驗數據與預處理

實驗用到的數據集如表1 所示。為了與目前先進的算法進行公平比較,先擇SCAF①Huang Z,Zhang J,Shan H.When age-invariant face recognition meets face age synthesis: A multi-task learning framework,Proceedings of the IEEE/CVF conference on computer vision and pattern recognition.2021:7282-7291.為訓練數據集,包含約為 50 萬張圖像及 12000 個不同身份。測試集包括一個人臉識別數據集(FG-NET(https://yanweifu.github.io/FG_NET_data)),兩個人臉驗證集(CALFW②Zheng T,Deng W,Hu J.Cross-age lfw: A database for studying cross-age face recognition in unconstrained environments.arXiv preprint arXiv:1708.08197,2017.和ECAF③Z.Huang,J.Zhang and H.Shan,"When Age-Invariant Face Recognition Meets Face Age Synthesis:A Multi-Task Learning Framework and a New Benchmark," in IEEE Transactions on Pattern Analysis and Machine Intelligence,vol.45,no.6,pp.7917-7932,1 June 2023,doi:10.1109/TPAMI.2022.3217882.)。CALFW數據集平均年齡差距為17.6 歲,在其中挑選6000 對圖像,包括3000 對具有年齡間隔的相同個體作為正樣本對和3000 對不同個體作為負樣本對。ECAF 數據集平均年齡差距為41.3 歲,在其中分別選取6000 對和4000 對人臉圖像,用于評估(Adult,Child)和(Child,Child)兩個任務。

表1 數據集

如圖3 所示,使用MTCNN④Zhang K,Zhang Z,Li Z,et al.Joint face detection and alignment using multitask cascaded convolutional networks. IEEE signal processing letters,2016,23(10):1499-1503.(Multitask cascaded convolutional neural network)檢測面部5 個關鍵點進行人臉檢測與對齊,并將圖像裁剪為112×112 像素。

圖3 圖像處理

(二)實驗設置

將SCAF 數據集按年齡分為7 個不重疊的年齡組0-10、11-20、21-30、31-40、41-50、51-60 和60+,根據年齡分組和年齡標簽進行年齡估計任務。為了避免過擬合,訓練時對圖像進行隨機翻轉的操作,隨后將圖像歸一化到[-1,1]區間。實驗細節:直接采用文獻⑤Wang H,Wang Y,Zhou Z,et al.Cosface: Large margin cosine loss for deep face recognition,Proceedings of the IEEE conference on computer vision and pattern recognition.2018:5265-5274.中對人臉識別損失CosFace 的參數設置(s=64,m=0.35),λage和λid分別設置為0.01 和0.001,訓練批量大小為256,迭代次數為40000 次,動量因子為0.9,訓練開始時學習率從0 到0.1 線性升溫,迭代2000、20000、24000 次時,學習率以0.1 的倍數降低,使用隨機梯度下降(Stochastic gradient d-escent,SGD)算法進行優化,使用一塊GPU(V100-SXM2-32GB)進行加速訓練。實驗環境:Python3,Pytorch1.8.1 框架進行訓練,顯卡為V100-SXM2-32GB。

(三)實驗結果

1.FGNET 數據集人臉識別結果。FG-NET 是跨年齡人臉識別中最受歡迎和最具挑戰性的數據集,包括在野外收集的82 名受試者的1002 張面部圖像,從兒童到老人的年齡跨度較大。為了公平比較,我們嚴格遵循文獻⑥Wang H,Gong D,Li Z,et al.Decorrelated adversarial learning for age-invariant face recognition,Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.2019:3527-3536.中的留一法(leave-one-out)評估方式。

具體來說,模型在SCAF 上進行了訓練,之后選取1 幅圖片作為測試樣本,1001 幅圖片作為樣本庫,將測試樣本與樣本庫中所有樣本進行余弦距離比較,距離從小到大進行排序,若距離最近的樣本對身份相同,則為Rank-1 識別準確。重復此過程1002 次。表2 報告了Rank-1 識別率,可以看出AM-CNN與最先進的MTLFace 相比有小幅度提升。

式(3)中的超參數λage和λid變化會影響模型性能,為了探求合理的λ取值,在FG-NET 數據集上設置了以下幾組實驗。由表3 可知,λage值的變化對模型識別效果影響較大,λid值的變化對模型識別效果影響相對較小。當λage值較小時年齡估計任務重要性較低,會導致年齡特征提取不充分,使模型識別效果降低。相反λage值較大時年齡估計任務重要性相對較高,會引入一些不相關噪聲,也會使模型識別效果降低。同理λid值的變化也會有相應的效果。經過實驗,確定λage為0.01,λid為0.001時模型在FG-NET 數據集上的Rank-1 識別率最高。

2.人臉驗證數據集結果。為了與之前跨年齡人臉識別模型進行公平比較,使用相同數據規模的SCAF 數據集進行模型訓練,并在公開的大年齡間隔數據集CALFW、ECAF 上進行模型測試。測試結果如表4 和表5 所示,AM-CNN 超過了之前關于AIFR 的研究成果。AM-CNN 的識別準確率比最先進的MTLFace 方法在CALFW 數據上高了0.13%,在ECAF(Adult,Child)數據集上高了0.65%,在ECAF(Adult,Child)數據集上低了0.11%。在ECAF 數據集上最先進的MTLFace 是在SCAF 數據集端到端訓練后,使用生成的圖像進行微調所得到的結果。然而,本文所得到的結果均是在SCAF 數據集上一次性端到端的訓練結果,并未使用其他的數據集或者生成數據進行微調。由此進一步說明AM-FPN 效果具有顯著的優越性。

表4 和表5 僅僅展示了模型之間的準確率差異,為了更好地分析模型的性能,使用受試者工作特性曲線(receiver operating characteristic curve,ROC)對AM-FPN 和最先進的MTLFace 進行更為全面的對比。ROC 曲線可以評價模型對兩類測試者(正樣本對和負樣本對)分類的效果,ROC 曲線下面積越大模型分類效果越好。

使用與AM-FPN 相同的實驗環境對MTLFace 進行復現得到不同驗證任務下的相應ROC 曲線。ROC 曲線下面積越大,模型整體效果越好。圖4(a)是兩個模型在CALFW 數據集上的表現,AM-FPN與MTLFace 所得ROC 曲線下面積差距較小,因此兩個模型在此數據集上分類效果不相上下。圖4(b)中AM-FPN 所得ROC 曲線下面積遠超過MTLFace 所得ROC 曲線下面積,所以在此數據集上AM-FPN分類效果優于MTLFace。同樣,在圖4(c)中AM-FPN 所得ROC 曲線下面積略超過MTLFace 所得ROC曲線下面積,所以在此數據集上AM-FPN 分類效果略優于MTLFace。綜上所述,AM-FPN 綜合分類效果要優于MTLFace。

圖4 各數據集ROC 曲線對比圖

圖5 展示了AM-FPN 在各個數據庫任務上識別結果示意圖。正正表示模型識別圖像對為相同身份,真實標簽也是相同身份;正負表示模型識別圖像對為相同身份,真實標簽是不同身份;負負表示模型識別圖像對為不同身份,真實標簽也是不同身份;負正表示模型識別圖像對為不同身份,真實標簽是相同身份。由圖5 可知,各個數據集中的圖像對有灰色圖和彩色圖,其中正正和負負是模型識別正確的圖像對,正負和負正是模型識別錯誤的圖像對。在正負圖像對中,兩張圖像有明顯的相似之處。在負正圖像對中,兩張圖像由人為識別也是比較困難的??傮w來看,模型可以正確識別灰色和彩色圖對,但模型識別正確的圖像對大多數為相同通道數,相反模型識別錯誤的圖像對有一部分是不同通道數,并且有些圖像清晰度太差。由此可知,圖像的色彩和清晰度可以在一定程度上影響模型的識別。

圖5 識別結果示意圖

3.消融實驗。為了進一步研究不同模塊的效果,在三個數據集上進行了消融實驗。(1)基線:去除除CosFace 損失外的所有額外模塊,訓練人臉識別模型。(2)基線+年齡:在基線的基礎上增加年齡估計任務,并通過多任務聯合訓練的方式訓練模型。(3)基線+年齡+GRL:在基線和年齡估計任務的基礎上增加GRL,并通過多任務聯合訓練的方式訓練模型。(4)基線+年齡+GRL+CBAM:在年齡估計任務、身份識別任務和GRL 的基礎上,在FPN 橫向連接處加入CBAM 注意力模塊。(5)基線+年齡+CA:將CBAM 注意力模塊換成CA 通道注意力模塊。(6)AM-FPN:本文提出的模型,使用SA空間注意力模塊增強年齡特征的提取性能。

由圖6 可知,與基線模型相比基線+年齡模型性能顯著提升,從而證明掩碼分解模塊在跨年齡數據集上實現了顯著的性能改進。其次特征提取器在年齡特征提取時,融合了多層年齡特征信息。AM-FPN 采用CA 注意力機制進一步加強特征提取能力,與其他注意力模塊(CBAM 和CA)相比實現了顯著的性能提升,這也從側面體現出在低維特征圖中,年齡信息與空間信息聯系更為密切。此外,使用跨年齡領域對抗訓練也可以使模型性能得到進一步的提升。

圖6 不同模塊消融實驗

圖7 展示了掩碼分解模塊與先前所提出的分解模塊性能比較。具體來說,模型采用相同的FPN 骨干網絡分別與正交分解、線性分解和掩碼分解組合,使用SCAF 數據集訓練之后,在三個驗證集上做公平比較。由圖可知,AM-FPN 中的掩碼分解模塊效果優于先前所提的分解模塊效果。

圖7 不同分解方式

三、結論

為了實現跨年齡人臉識別,在MTLFace 結構基礎上,采用改進的基于特征金字塔的特征提取器,并使用新提出的一種掩碼分解模塊,使用多任務訓練策略,獲得了一種基于年齡掩碼的跨年齡人臉識別模型(AM-FPN)。該模型對FPN 網絡進行改進,使其可以提取混合人臉特征,并且可以適應性地融合不同層特征信息提取到更為細致的年齡特征信息。使用掩碼分解模塊從混合人臉特征中除去所提取到的年齡特征比以往所提出的分解方式效果更好。最后使用多任務訓練策略監督特征分解,加快模型的收斂速度。在多個數據集上的實驗結果表明AM-FPN 可以顯著提升跨年齡人臉識別準確率。此外,AM-FPN 可以將年齡特征更改為姿態和表情等其他因素,從而擴展到其他類似解耦不充分的實例。

猜你喜歡
年齡特征掩碼人臉識別
厘清邏輯關系 深入閱讀文本
人臉識別 等
揭開人臉識別的神秘面紗
低面積復雜度AES低熵掩碼方案的研究
基于布爾異或掩碼轉算術加法掩碼的安全設計*
素描頭像四分之三、側面正面、年齡特征等畫法解析
基于類獨立核稀疏表示的魯棒人臉識別
基于掩碼的區域增長相位解纏方法
運動技術教學銜接性與年齡特征
基于掩碼的AES算法抗二階DPA攻擊方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合