◆陳加昊 方梓芃 張玲 蓬念
(華東理工大學信息科學技術學院 上海 201424)
隨著人們生活水平的提高,社會需求表現出多樣化的特點,人們對于自身的形象設計提出了更為明確的高標準要求,因此穿搭成為了個性表達的重要途徑[1]。但是忙碌的學習和工作生活導致許多人疏于研究穿搭技巧,這與人們對有效服裝搭配的迫切需求相矛盾。因此,為此類用戶群體研究出一種簡單快捷有效的服裝搭配方案無疑是當務之急。
近年來對服裝智能穿搭的研究主要分為有監督學習的服裝穿搭和無監督學習的服裝穿搭,采用有監督的服裝智能穿搭有Edward Shen 等人使用ConceptNet 語義網絡進行圖片處理,使用OMSC 搭配知識庫進行搭配推薦,建庫復雜繁瑣,使用ConceptNet 語義網絡僅使用文字注釋來進行服裝搭配,效果較差。采用無監督學習的服裝搭配大多使用K-means算法將服裝標簽類別進行聚類,再使用ImageNet訓練模型,而K-means 算法運算時間長,使用ImageNet 模型精準性不夠,服裝搭配上效果不好[2]。本文提出一種基于服裝分類和身材檢測的服裝搭配方案,將服裝色彩的整體性原則、個性化原則、TOP原則作為主要搭配依據,為用戶提供簡單有效的服裝搭配建議,功能框圖如圖1 所示.
服裝檢測訓練采用了DeepFashion數據集,其中包含T恤、衛衣、大衣等8 種常用服裝,圖像均被resize 為300*300 的分辨率。隨機選取其中2133 張圖像用于訓練,198 張作為測試集圖像,經訓練識別率高達96.67%。
對用戶輸入具有RGB 色彩通道的涂裝圖像進行卷積操作,提取服裝的紋理、輪廓、色彩等特征。經過一系列滑動卷積核的池化操作后導入全連接層,將先前提取到的特定服裝類型的特征綜合起來,作為后續判斷的依據。通過SoftMax 函數進行非負化與歸一化運算,轉換為預測結果占總可能性的百分比,分類網絡結構如圖2 所示。
圖2 服裝分類網絡示意圖
由一層VGG19 網絡提取出相應圖片特征進行卷積,提取pcm 與paf 并分別求loss,通過公式:
求和后優化。最后得到確定的骨骼關鍵點位置。通過關鍵點提取后,可以通過相應骨骼位置來確定身材比例。
傳統的控制理論對于明確系統有強而有力的控制能力,但對于過于復雜或難以精確描述的系統,則顯得無能為力。工程師們便嘗試著以模糊數學來處理這些控制問題。模糊控制(Fuzzy Control)是以模糊集合論、模糊語言變量和模糊邏輯推理為基礎的一種計算機數字控制技術,近20 多年來,模糊控制不論在理論上還是技術上都有了長足的進步,成為自動控制領域一個非?;钴S而又碩果累累的分支。其典型應用涉及生產和生活的許多方面,例如在家用電器設備中有模糊洗衣機、空調、微波爐、吸塵器、照相機和攝錄機等[3]。
本節提出一種基于模糊控制的服裝搭配方案[4],通過研究服裝色彩搭配整體性原則、個性化原則、TOP 原則[5],確定季節、氣溫、服裝顏色、服裝色調、服裝種類和人的身材比例這6 個因素為搭配的六個要素,用搜集到的1000 張穿搭博主的搭配成品圖片,經過提取季節、氣溫、服裝顏色、服裝色調、服裝種類和人的身材比例這6 個因素作為系統的知識庫,利用模糊控制理論,搭建服裝搭配系統。
系統實現步驟如下。
首先將季節、氣溫、服裝顏色、服裝色調、服裝種類和人的身材比例這6 個因素進行尺度變換,將各實際因素可能值轉化為離散論域,分別量化成4、5、20、3、15、3 個等級,所有模糊集合均為單點模糊集合,以確保隸屬函數的清晰性。S、T、C、L、M、B 分別表示季節、氣溫、上裝服裝顏色、上裝服裝色調、上裝服裝種類和人的身材比例。下表為各因素尺度變換規則:
表1 因素尺度變換規則
首先針對由上裝匹配下裝情況,構建一個六輸入三輸出的模糊系統,其輸入量為S、T、C、L、M、B,分別表示季節、氣溫、上裝服裝顏色、上裝服裝色調、上裝服裝種類和人的身材比例,輸出量為C’、L’、M’,分別表示下裝服裝顏色、下裝服裝色調和下裝服裝種類,分別與C、L、M 屬性相同。用搜集到的1000 張穿搭博主的搭配成品圖片構建數據庫中已知的1000 條規則。
構建知識庫規則時,6 個輸入量分別為
分別表示秋季、氣溫0~20℃、卡其色、中色調、大衣、身材比例0.60~0.63。
3 個輸出量分別為
分別表示棕褐色、中色調、休閑褲。
由此構建出一條規則:
根據公式2 和1000 張穿搭博主的搭配成品圖片可構建數據庫中1000 條規則:
R1:如果S 是S1and T 是T1……and B 是B1,則[C’,L’,M’]是[C’,L’,M’]1;
R2:如果S 是S2and T 是T2……and B 是B2,則[C’,L’,M’]是[C’,L’,M’]2;
……
R1000:如果S 是S1000and T 是T1000……and B 是B1000,則[C’,L’,M’]是[C’,L’,M’]1000。
系統模糊蘊含關系為:
系統實際得到的模糊蘊含關系為:
(模糊蘊含矩陣R 有765000 列)
得出系統模糊蘊含關系R 后,模糊系統就已經構建完成,當用戶上傳一張待匹配圖片,我們將提取輸入量的模糊集合,經過模糊系統得出匹配輸出量:
將經過模糊系統得出的論域范圍的匹配輸出量,經表和尺度變換,變成實際服裝搭配所用的控制量:服裝顏色、服裝色調、服裝種類。根據系統輸出結果的控制量在用戶衣柜中檢索出合適的服裝進行匹配,最終為用戶提供可靠的穿搭方案。
搭配過濾采用了基于規則的專家系統?;诖钆涑WR,過濾由模糊控制穿搭方法所輸出的不合理搭配。例如冬季,選擇了T 恤與短褲顯然不合常理,又或將大衣與短褲匹配也不符合常規情況,而此部分的目的就在于過濾不合理情況[6]。
該部分使用一組包含在知識庫內的框架對工作存儲器內的具體問題信息進行處理,通過解釋器推斷出新信息。這里采用框架形式表示知識填入規則系統,規定了該目標如何工作即服裝與服裝間關系為互為搭配,上衣與下褲的屬性需相契合[7]。
4.2.1 類的定義
衣褲分為季節、氣溫、服裝顏色、服裝色調、服裝種類等特征,進行架構構建,如圖3 所示。
圖3 類的定義圖
從而生成帶槽的服裝對象(表2):
表2 帶槽服裝對象
將服裝數據以槽的形式表示,完成了知識概念化與概念形式化的步驟。
4.2.2 確定服裝匹配規則并構造系統
采用“if (條件一和條件二) then 結論”對于復雜規則的通用格式[8]。這里列舉如下的規則作為例子:
if (氣溫<10) then 禁用短褲、T 恤
if (場合正式) then 上衣類型限制為大衣與正裝
if (場合休閑) then 衣褲色彩限制為淺色調
服裝分類網絡分別取30、50、80 次訓練,在50 次訓練時所導出模型避免了欠擬合與過擬合的發生,識別率高達96.67%。系統流程圖如圖4 所示。
圖4 服裝搭配系統流程圖
以用戶上傳一張服裝圖片為例,如圖10 所示,特征為秋季、氣溫20℃、深藍色、冷色調、牛仔褲、身材比例0.62,六個輸入量用Zadeh 表示法分別表示為:
經過系統得到三個輸出量:
分別表示深藍色長褲,在衣柜中檢索到服裝顏色為藏青、冷色調、西裝上衣,予以搭配,展示效果如圖5。
圖5 服裝匹配圖
本文利用深度學習網絡進行服裝與用戶身材的數據提取,在此基礎上利用了模糊控制原理,將用戶的身材、天氣、風格等六項輸入進行模糊計算,輸出三項參數對用戶提出穿搭建議。實驗結果表明,將深度學習與模糊控制在穿搭領域的結合,可有效量化計算“天氣、風格、季節”等抽象概念,具有較好的實用性。在下一步工作中,可以進一步研究服裝知識圖譜特征如何與推薦算法結合,使系統在語義層面上具有更好的推薦效果。