?

基于智能生成技術的傳統招幌創新設計

2023-03-02 10:07武漢輕工大學陳瑩燕通信作者李淑彤
工業設計 2023年1期
關鍵詞:鑒別器損失智能

武漢輕工大學 陳瑩燕(通信作者) 李淑彤

傳統招幌是古代商家吸引顧客、促進銷售和建立品牌的主要手段,它的形成源于古代商業活動中的宣傳需要,其材質自然樸素,造型直觀規整,色彩樸素明快,圖案吉祥,歷史悠久,并貫穿于傳統文化和民俗之中。而如今,智能生成技術如雨后春筍般紛紛涌現,其應用也廣泛滲透到了諸如計算機視覺、文化保護、自然語言處理之中。運用智能生成技術將傳統招幌加以保護和創新,已成為當下文化建設的重要任務。通過將兩者的結合可以更加精準地詮釋傳統招幌的信息內容,表達信息理念,更加形象化、細節化、視覺化實現非物質文化遺產傳承[1]。

1 智能生成研究現狀

近年來,卷積神經網絡、生成對抗網絡(GAN)等深度學習技術日趨成熟,這些技術能生成符合源數據樣本風格相似的圖像,使越來越多不同領域的研究者和商業公司更關注智能生成技術。在現階段,基于深度學習的生成設計可以將語義概念網絡模型和視覺概念網絡模型進行組合,通過算法訓練和參數調整,使計算機能夠挖掘指定的跨領域事物之間的潛在聯系,從而生成新的信息,這些算法有助于在給定預設目標的情況下進一步探索,并跟蹤算法從概念到結果的思維過程。

因此,有望通過人工智能設計的方法來學習傳統招幌的視覺表現及風格,在盡可能保持其原有視覺風格特點的基礎上來進行智能生成。這樣既有利于設計師擺脫既定的思維框架,又能借助人工智能技術提供的各種支持,激發設計師的創作靈感,開拓設計思路,使設計出的產品更加多樣化與全面化[2]。但由于GAN的程序需要收集大量的訓練與數據,目前從一些傳統歷史文獻、書籍、照片檔案中收集到的傳統招幌比較有限,只能嘗試根據其形象特征重構制作出一些招幌圖案。文章通過利用設計學圖像處理算法與計算機智能圖形生成算法來進行圖形數據的增強,構建了一個可包含多達1000 張圖片PNG 格式的矢量傳統招幌圖案數據集合,運用GAN 來自動生成傳統招幌。

2 中國傳統招幌分析

我國“招幌”的形態表現有著近百年的歷史。在原始社會時期,招幌以實物成列、口頭叫賣聲為主;春秋戰國兩漢時期,行商多以聲響、演示幌子廣告;坐商多以實物為幌、文字為幌(酒旗)。秦漢時期,出現了視聽廣告,商人用工具發聲;實物展示中出現了一種新形式的壚(指放置酒缸的土桌)。北魏時期,實物陳列幌直接展示了商品本身的實物質量和特點。隋唐時期,掛在商店門前作為標志的牌子(招牌)開始出現,洛陽率先流行起“掛牌經營”和酒旗,燈籠廣告也在此后開始盛行。宋元時期,抽象的幌子日益增多,開始逐漸重視裝飾,采用了夸張的旗簾造型(瓶、勺、掃帚、構、碗等)裝飾,形狀開始從原來單一的三角形逐步變化成長方形等;顏色也從使用單一的顏色逐漸過渡到使用更為鮮艷而明亮的色彩,應用形式方面也已不斷趨于完善,范圍基本涵蓋各種大型藝術建筑(包括彩樓、門等)。當時的店鋪幌子除了有店鋪行業身份識別的基礎作用,還增加了一些更具自身特色的個體標識。到了元明清歷史時期,從招幌的表現形式上看,大多是對中國古代早期實物展示招幌的又一種繼承與創新,主要代表產品有實物陳列式招幌、實體模型幌(擁有體積及重量的物理形態概念實體物件)、招牌、符號招幌、標志幌、店鋪裝飾幌等形式;在使用方法上,做到有店必先有幌,一幌一店的水準[2]。作為中國商業品牌文化輸出項目中較典型、較具代表性的視覺載體,招幌文化的核心地位正式確立,成為中國民俗文化寶庫中極為重要的一部分。

除此之外,我國“招幌”的文字記載也可以追溯到幾百年前,如韶廬的《商標考》、佚名的《北京民間生活彩圖》和孟元老的《東京夢華錄》等,這些傳統文字主要簡述了招幌的應用類型,并沒有進一步的深入剖析[3]。隨著當代藝術研究者對中國傳統視覺藝術越來越重視,傳統招幌的視覺形象研究也多了起來,研究方向也逐漸向民間工藝美術靠攏。如今,由傳統招幌設計演變出的廣告設計領域,智能技術已經滲入廣告創作環節的工具輔助階段。智能技術分解創意環節,實現了由整體到局部的拆解,廣告創意變成了可拆分、可重組的元素組合,程序化創意將色彩、字體、文字、圖片等不同部分分割開來,并組成為多種組合,這很大程度上打破了“千人一面”的傳統創意模式[4]。一些學者也開始關注中國古代各種招幌廣告形式的研究,但缺乏從智能生成與保護角度的系統整理,大多是零星的文章,研究性不強。

隨著時代進步,不同形式的招幌所伴隨的經濟背景、商業環境均產生了多方面的歷史變化,在大量搜閱了相關信息之后,發現有關各種招幌形式的研究資料大多僅以簡單文字形式的特征描述為主,單著眼于描述出在某種經濟背景和特殊環境背景下所產生出的招幌,缺少對招幌的圖片記錄,導致許多傳統招幌的圖像流失嚴重。傳統招幌急需融合當代審美,進行傳承與革新,并將人工智能為代表的新技術融入其中,尋找新的發展機遇。

3 基于智能生成的傳統招幌設計實驗

3.1 GAN 相關工作

近年來,深度學習的發展逐步加深,一種新的算法出現在智能生成領域,即GAN。它是由Ian GoodFellow 公司2014 年提出的算法模型,主要目標是通過學習真實世界中的圖片風格去智能生成創作一些新的圖片。相比于傳統的神經網絡模型,GAN 是一種非監督類型的深度學習方法[5],它包括兩個主要部分——生成器和鑒別器,讓這兩者之間互相對抗,達到一種均衡,從而生成出工作者想要的圖像。鑒別器的主要作用是鑒別出一張圖片到底是真實顯示的圖片還是完全虛假的圖像;生成器用于隨機生成一個樣本,并能將它轉作為假樣本。生成器的工作目標其實是以偽造訓練圖片來欺騙鑒別器,讓鑒別器完全無法從中分辨出來真假,做法則是通過選取訓練圖片數據中潛在空間的元素來進行隨機組合,并加入一些隨機的噪音,作為假數據輸入鑒別器。在實際訓練的過程中,鑒別器還會自動接收到真實訓練數值和生成器產生出的偽訓練數值,鑒別器的任務是判斷圖片是屬于真數據的還是假數據。該訓練會一直持續到平衡和諧的狀態。訓練結束后產生的則是一個滿足固有特性要求的自動生成器和一個判定能力較強的鑒別器。前者可以用于機器創作,后者則用來機器分類。

在智能生成中,GAN 有著更為廣闊深遠的現實應用與前景,理論上能訓練任何一種生成器網絡。首先,GAN 能更好地對數據分布建立模型,使圖像更銳利、清晰等。其次,GAN 無需像馬爾科夫鏈采樣那樣在學習進程中進行推測,也沒有復雜的變分下界,可以幾乎完美的避開因相似計算值而感到棘手的問題[6]。

3.2 傳統招幌的數據集構建

要使用GAN 生成傳統招幌,首先需要構造一個招幌數據集,由于可找到的招幌圖片數量有限,且顏色各異,且GAN 對于數據的要求較高,為了降低GAN 的訓練難度,提高生成效果。此次實驗對彩色圖片進行邊緣提取轉化成黑白圖片,過程為使用高斯濾波器平滑圖像。計算梯度的范圍和減弱方向并在梯度增加的數值范圍內執行NMS(非最大值抑制)。隨后使用閾值算法進行邊緣檢測。最后經過canny 算子進行邊緣提取,得到了1158 張二值圖片。

3.3 傳統招幌的生成

此次實驗采用使用GAN 生成傳統招幌。由于原始GAN 存在一定的局限性,例如生成質量差、訓練缺乏穩定性,后來研究人員在訓練穩定性上進行了一系列改進。WGAN 使用Wasserstein距離數據來定量描述所觀察了解到的一些真實現象,來減輕GAN中發生的模式崩潰[7]。WGANGP 提出了使用梯度懲罰的策略來代替在WGAN 中的權重被截斷,從而可產生更為出色的圖像效果,并有效地避免了模式的崩潰[8]。LSGAN 使用了最小的二乘損失函數,緩解了GAN 訓練結果不完全穩定和生成的圖像多樣性不足引起的問題[9]。SAGAN 引入到了自適應注意力機制,并在首次實現在圖像生成器系統中使用譜歸一化,生成出了一些相對較高質量的圖像。BIG-GAN 通過采用大模型和更大的參數量而獲得了性能大幅度地提升,使圖像擁有更高的分辨率[10]。在目標圖像風格轉換的任務中,Pix2Pix 可以采用成對數據集,將同一目標域上所有的目標圖像作監督的信息數據集,然后分別獨立指導完成風格遷移[11]。Cycle-GAN 通過使用非平行的數據集,采用一致性損失,使用雙層生成對抗網絡來完成風格轉換的任務[12]。

通過加入空間注意力機制,對DCGAN 網絡進行改進,以達到更好的圖片生成效果。卷積神經網絡系統(CNN)在可監督學習領域的各種學習任務上總體表現比較良好,但在無監督的學習任務領域上表現比較不佳。DCGAN 結合有監督學習系統中使用的CNN 和在無監督學習系統中使用的GAN,使得網絡訓練穩定,快速收斂。且在每個卷積層之后加入空間注意力機制(SE block),使得網絡更關注生成圖片的空間特征,改進之后的DCGAN 網絡生成器和鑒別器分別如圖1、圖2 所示。

圖1 改進的生成器結構

圖2 改進的鑒別器結構

文章所提出的圖像生成模型采用圖像生成對抗網絡的思想,使用深層的神經網絡理論來解釋學習的數據風格特征,由圖像生成器和圖像鑒別器兩個部件組成。生成器結構圖如圖1 所示,生成器主要包括微步卷積層、批量歸一化層和激活層,它通過任意一個100 維的隨機向量,學習傳統招幌圖像中的數據風格特征分布,來生成某種特定的數據風格特征的傳統招幌圖像。當一組100 維左右的隨機向量輸入生成器后,通過四個微步卷積的操作來進行連特征提取,并將最終數據通過一次注意力機制(SE block),映射到了一張128×128 像素所組成的圖像上,圖1 中的每個箭頭分別表示為每一個微步卷積層的操作。鑒別器結構如圖2 所示,當128×128 位像素的圖像輸入鑒別器之后,鑒別器通過卷積連續下采樣提取圖像8×8 通過線性和激活層區提取圖像高級特征。它通過需要區分圖像生成過程中的圖像數據,并盡可能有效地學習如何嚴格區分生成的合成圖像和真實的圖像,最終使用圖像生成器中的生成的圖像輸出與其輸入數據符合于真實的合成圖像,使實際生成的圖像數據無法嚴格的區分圖像生成鑒別器數據信息的分布。方法中并未包含使用的全連接層和池化層,所有的權重都將自動被初始化為一個標準差為正負各0.02,均值為負正至0 之間的正態分布。實驗中使用批量歸一化梯度的操作方式來標準化權重,優化網絡梯度,以盡量避免訓練時梯度消失。同時在激活層上使用到了非線性的LeakyRelu 激活函數,一方面更加容易的提高了計算和收斂的速度,另一方面又解決掉了梯度的消失現象和一些神經元沒有完全被激活的問題。保證訓練更加穩定。

損失函數包括生成器的損失函數和鑒別器的損失函數:

z 分別為表示發送圖像和輸入圖像信號返回到圖像生成器中指依照實際情勢進行的自由組合的圖像信號的向量,G 表示生成器的損失函數,D 表示鑒別器的損失函數。在整個GAN 中,可以通過最小化生成器中的損失,使得隨機生成出來的圖像信息更容易欺騙鑒別器網絡,并被判斷為真,而如果同時能通過最小化鑒別器中的損失,使得鑒別器鑒別效果更準確,將真實的圖像判斷為真,將生成的假的圖像判斷為假。生成器和鑒別器損失函數均使用Adam 優化器來最小化損失函數。

4 傳統招幌的智能生成設計結果

此次實驗使用NVIDIA GeForce RTX 3070 顯卡訓練生成對抗網絡,經過48h 的訓練,模型收斂,生成器與鑒別器達到穩定的結果。

基于傳統招幌的智能生成方法,通過輸入制作好的招幌數據集進行訓練,模型訓練完成之后,可使用生成器隨機生成多種風格的招幌圖,減少人工制作招幌的成本。但對于GAN 的訓練,與分類、檢測等計算機視覺任務不同的是,GAN 的訓練過程類似于一種創作的過程,其模型與原理更為復雜,對數據集的要求也更高,訓練周期也更長,故在使用GAN 進行傳統招幌的智能生成時,應注意以下幾個方面:

1)高質量的數據集。實驗中,GAN 通過學習傳統招幌數據的特征,來智能生成新的招幌圖片。生成的招幌圖片的質量極大程度上取決于訓練時的數據集質量。由于制作數據集的人力成本很高,為了使GAN 不產生欠擬合的問題,故簡化了生成目標,將制作的數據集進行二值化,僅用白色表示招幌的輪廓,其余部分則為黑色,這樣在訓練過程中,灰度值僅需要除以255 則可規范化,簡化了訓練過程。

2)模型的選擇。模型的選擇直接決定了GAN 的智能生成效果,由于實驗中制作的數據集規模比較小,故不適用于復雜的模型,因此采用了一個輕量級的網絡,并引入了空間注意力機制,提高了傳統招幌的智能生成質量。

3)損失函數的確定。一個良好的損失函數類似于一個好老師,引導著模型去達到想要的結果,使得模型收斂更快,訓練更穩定在函數GAN 中,由于有兩個部分存在—生成器和鑒別器,所以損失函數中還需要同時包括這前兩個部分,這里采用的是交叉熵損失,充分考慮了兩個部分的損失。

4)優化器的選擇。在選擇了損失函數之后,Adam 優化器的優化效率對GAN 十分顯著,避免了梯度消失等問題。

由于數據集較小且風格較為單調,智能生成效果依然有一些局限性,后續準備制作一個更大的數據集,且對模型進行適當的改進。此外,由于采用GAN 的生成方法,不需要人工參與,不能朝著設計者所希望的方向進行生成,后續也準備嘗試,將生成任務變為僅僅生成招幌的部分元素,使設計者能夠有一些自主的空間進行發揮。

5 結語

文章提出了一種基于智能生成技術的傳統招幌創新設計方法,通過分析GAN 的訓練以及生成過程,首先制作了一個關于傳統招幌的數據集,為了簡化任務,對招幌數據集進行邊緣提取,并將數據二值化,輸入改進的GAN 進行訓練。訓練完成后,生成器可智能生成一些高質量的黑白邊緣的傳統招幌圖片。該方法對弘揚傳統文化,簡化設計師設計過程具有重要意義。

猜你喜歡
鑒別器損失智能
基于多鑒別器生成對抗網絡的時間序列生成模型
胖胖損失了多少元
衛星導航信號無模糊抗多徑碼相關參考波形設計技術*
玉米抽穗前倒伏怎么辦?怎么減少損失?
智能前沿
智能前沿
智能前沿
智能前沿
陣列天線DOA跟蹤環路鑒別器性能分析
一般自由碰撞的最大動能損失
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合