?

人工智能背景下中式家具的創新設計研究

2024-02-27 03:19鄭佳勇鄭曉如
林產工業 2024年1期
關鍵詞:中式家具樣本

蘇 晨 鄭佳勇 鄭曉如

(湖北工業大學工業設計學院,湖北 武漢 430068)

2023年人工智能生成內容(AIGC)蓬勃發展,以ChatGPT為代表的生成式人工智能,開啟了全球第四次科技革命浪潮[1],越來越多的傳統產業開始意識到AI的潛力,家具產業也不例外。人工智能的開發與應用,極大地推動了家具設計工作向著智能化、數字化方向轉變。中式家具是富有民族特色和文化魅力的傳統家具,其承載的區域文化源遠流長[2]。中式家具智能設計研發需要綜合考慮傳統文化元素、現代設計理念、智能生成算法的三方融合。以中式家具的智能設計為研究對象,將傳統文化元素集成到人工智能生成的算法中,優化智能設計在傳統文化產品上的應用流程,提出基于卷積神經網絡和擴散算法相結合的智能設計模型,從算法邏輯上實現人工智能與傳統文化的融合發展,并將其應用到家具設計上,以期推動中式傳統家具與當代藝術、設計、科技等領域的交叉融合,進而打造兼具時代性、前沿性和傳統韻味的新中式家具。

1 人工智能在中式家具創新設計中的運用

隨著人類進入了一個知識外包的全新智能時代,使用AI工具協助工作學習必將成為各大行業的重要方向[3]。人工智能在家具設計領域取得不少成果,但也存在的一些局限性,特別在傳統家具產品的智能開發上。Hu等[4]構建了家具風格數據庫,利用基于深度學習的圖像分類方法對家具風格(如美式風格、洛可可風格、哥特風格等)進行識別與特征提取。王思航[5]對模塊化家具與人工智能相關技術進行了分析,提出了一套定制化衣柜家具的智能設計方法,用于輔助設計師提高工作效率,為企業帶來收益。清華大學未來實驗室[6]利用圖像生成技術輸出320 000張新椅子圖片,展現了人工智能在產品造型推敲上的先導性。然而,其生成方案的成熟度與文化價值上有所欠缺,大多數生成方案存在趨同性的問題,需要設計師對其調整與再設計。由于缺乏對傳統文化的深度挖掘與數字融合,導致文化產品的智能設計會在一定程度上削弱其文化認同和區域文化價值。人工智能輔助家具設計領域有了一定的研究,但在傳統中式家具的特征識別與智能設計生成的研究較少,也鮮有利用智能設計賦能傳統文化產品開發的文章。

中式家具的特點是結合我國的歷史、地域、習俗、信仰等因素,創造出了富有傳統特色和魅力的家具產品。中式家具設計的關鍵在于創新和傳統的協調,要將傳統文化元素融入到家具設計中,需要有一定的創新能力和審美觀念,避免陷入刻板印象或過度夸張。同時也要平衡好傳統與現代、民族化與國際化之間的關系,使家具既能體現民族風格,又能適應當代生活和審美需求[7]。本文用人工智能輔助中式家具的創新設計,提出了基于卷積神經網絡(CNN)與潛在擴散模型(LDM)的中式家具智能設計模型,從而將文化特征考慮到生成算法中,強化LDM算法對中式家具文化特征的識別和應用,最后提供中式家具的方案生成。系統架構如圖1 所示。

圖1 系統架構Fig.1 System framework

2 基于CNN的中式家具特征識別模型

卷積神經網絡(Convolutional Neural Networks,CNN)是一種專為圖像相關任務設計的特殊神經網絡,可以對圖像進行高效、準確的特征提取和分類[8]。中式家具的發展,亦是繼承與創新的關系,研究中式家具設計,需要著重分析其產品符號語言。因此,對中式家具的創新設計需要確定中式家具產品符號的語言規則,比如確定其形態、材質、裝飾等方面的特征,并在構建樣本庫時人為地進行分類,區分識別重心[9]。這些符號和象征作為中式家具特征識別的關鍵特征,將有助于CNN模型更加準確地進行中式家具特征識別和分類,判定其是否具有傳統文化特色。

2.1 中式家具樣本庫構建

由于傳統家具種類豐富,為便于開展研究,本文以椅子作為代表性家具,進而整合傳統家具設計的共性研究。利用批量下載工具,從網絡上下載4 000余張傳統中式椅子的相關照片,并通過初步篩選,確定了1 500余個圖像樣本,包括完整椅子形態圖、材質圖和裝飾紋樣圖。為便于后續圖像模型訓練,對圖像做出以下規范:1)一張圖片中只包含單個對象;2)圖像大小大于224×224像素;3)各個特征的圖片數量大致均等(不宜相差過大);4)形態圖需要有完整的椅子單體,材質圖需要凸顯木質紋理,裝飾紋樣標簽的紋樣清晰可見。最后由專業設計師與家具領域專家進行分類篩選,并確定了形態標簽的椅子圖片562張,材質標簽的椅子圖片435張,裝飾紋樣標簽的椅子圖片519張。

表1 中式家具樣本庫Tab.1 Sample library of Chinese furniture

2.2 構建并訓練中式家具的特征識別模型

圖像分類是圖像學習的基礎,廣泛應用于安全、交通、互聯網等計算機視覺領域。傳統的圖像識別方法大多采用特征提取和機器學習方法[10]。該方法需要手動設計特征提取器,然后再通過機器學習算法對提取的特征進行學習與分類,而深度學習方法可以通過多層神經網絡自動學習圖像中的特征[11]。這種端到端的學習方式可以減少特征工程的工作量和人為偏差,簡化了圖像分類流程,更適合大體量復雜的圖像識別任務。家具圖像比自然圖像更為復雜,圖像細節特征更為豐富,所涉及的運算規模更大。因此,本節提出了基于CNN的中式家具特征識別方法。與傳統方法相比,它具有更好的靈活性和魯棒性,能實現對紋理、形狀和顏色等特征的識別提取,得到其設計造型上的語義特征。通過設置多個分類頭,最終實現對家具特征的識別,可以得出其整體造型是否符合中式家具形狀特征;其表面材質是否符合中式家具紋理顏色特征;其上的裝飾紋樣是否具有中式家具紋樣的形狀特征。因此,模型的輸入應該是中式家具圖像,輸出應該是一個向量,代表中式家具的造型語義特征和材質特征。

具體步驟如下:

1)使用Python中的OpenCV庫進行圖像預處理。將所有圖像轉換為相同的大小、顏色空間和分辨率。常用的圖像預處理技術包括裁剪、旋轉、縮放和歸一化。在此階段加入數據增強環節,對每個訓練樣本進行水平翻轉。最后將每個數據樣本與其水平反轉的樣本尺寸分辨率統一為224×224像素,作為深度網絡最終輸入。

2)使用深度學習框架Keras和Python搭建VGGNet 16模型,作為特征識別模型。VGGNet是一種常用于圖像識別的傳統深度卷積神經網絡模型。VGGNet 16網絡有16層,其中包括13個卷積層和3個全連接層(圖2)。首先通過激活函數向CNN中引入了非線性元素,使CNN模擬真實環境中樣本數據的非線性分布。為了更好地發揮其特征識別的功能,并使其收斂速度更快,構造了新的激活函數SReLU,兼具SoftSign和ReLU函數的優點,定義如下:

圖2 特征識別模型的網絡結構Fig.2 The network structure of feature recognition models

式中:yi為第i個激活函數f的輸入。激活函數層的輸入大于0時,取ReLU函數值;小于0時,取SoftSign函數值,表示不同顏色的圖像通道。ac為不同顏色通道的值,控制負半軸的輸入。

采用softmax對圖像進行中式家具屬性分類,計算公式為:

式中:FurnitureP為中式家具特征屬性的概率輸出;hFC3為最后一層全連接層FC3的輸出。根據中式家具特征屬性的概率輸出,即可得到輸入樣本圖片具體的特征形容。

該網絡損失函數公式為:

式中:(x(i),y(i))為第i個樣本;m為訓練樣本的個數;hw(x)為假設函數,表示出數據分布。

求出softmax損失函數的最小值,則是該算法訓練的過程。最后模型末尾添加全局平均池化層和全連接層,三層的全連接層對卷積層提取的特征映射再進行抽象和非線性融合,得到更有效的特征表達,保持前兩個全連接層與原模型一致,將FC3的輸出修改為2。最后,把學習到的特征輸入到softmax分類層進行細化輸出,得到具體的中式家具特征識別結果,比如其形態是否符合中式家具形狀的識別條件,材質是否符合木質的紋理顏色條件等。

3)訓練模型并應用。在訓練時,可以使用傳統的分類模型訓練方法,例如交叉熵損失函數、隨機梯度下降等,然后需要指定合適的損失函數和優化器,例如softmax交叉熵損失函數、Adam優化器等。訓練模型需要輸入訓練數據train_data和標簽train_labels,以及驗證數據validation_data和標簽validation_labels,并指定訓練輪數epochs和批次大小batch_size。訓練參數會直接影響模型的最終應用效果。經過多次調整,具體參數如表2所示。采用Adam為優化器,它是一種自適應學習率的優化算法,兼具AdaGrad和RMSProp算法的優點,能夠在訓練過程中自動調整學習率。此處設置初始學習率為0.002。將步驟1)中建立的樣本庫按比例設置為訓練集與測試集,對無法打開的數據進行清洗,最終完成模型訓練。

表2 訓練參數Tab.2 Training parameters

為檢驗網絡能否正確識別椅子風格,輸入20張家具圖片進行實際測試,最終輸出的特征識別符合率為85.6%,說明該模型真實可靠。應用中式家具特征識別CNN模型對網絡爬蟲爬取的25 353張有效圖片數據進行特征標注,清洗不符合要求的圖片數據,得到每張家具樣本的識別特征并建立相應的數據集,為后續擴散模型的條件輸入與訓練提供數據集支撐。

3 中式家具的智能設計生成

智能設計在國內學界已經得到廣泛運用。李雄等[12]采用生成對抗網絡(Generative Ad-versarial Networks,GANs)和神經遷移進行手繪草圖的渲染。裴卉寧等[13]運用GANs的變體——深度卷積生成對抗網絡( DCGAN)快速生成汽車造型設計。程鵬飛等[14]采用基于卷積神經網絡的風格遷移技術完成泳衣的圖案設計。然而,目前國內對智能設計的生成算法大多都采用GANs,對于運用擴散模型進行智能設計相關研究較少。GANs的訓練往往需要大量的調試和超參數優化,而且容易遭遇模式崩潰等問題。相比之下,潛在擴散模型(Latent Diffusion Model,LDM)的訓練過程更加簡單和直觀,并且能控制圖像生成過程,使得生成的圖像更加符合用戶的需求[15]。然而,LDM在圖像生成中也存在一些缺陷。例如,對圖像細節、結構特征以及樣式的把控不足等問題[16]。相比而言,CNN在圖像處理和特征提取方面具有良好的性能,可以加強擴散算法在細節特征與圖形樣式方面的把控力。文化產品的智能設計開發需要注重其文化細節特征的呈現、保留與融合。因此,本文創新性地提出基于CNN與LDM的中式家具智能設計系統,不僅是在中式家具領域智能化設計的突破性嘗試,更是擴展了擴散模型的運用維度,打破了智能設計領域應用算法單一的現狀。

3.1 潛在擴散模型原理

2020年提出的去噪擴散模型(Denoising Diffusion Probabilistic Model,DDPM),首次將擴散模型運用于圖像處理領域[17]。2021年12月,CompVis和Runway團隊進一步提出了潛在擴散模型[18],在潛空間中完成擴散過程,相比純擴散模型快得多,在過去三年蓬勃發展,甚至間接引發了AI繪畫的技術浪潮。LDM的整體流程如圖3所示。

圖3 LDM整體流程Fig.3 LDM process

首先利用編碼器E將輸入圖像x壓縮為低維潛在數據z。前向擴散過程會逐步向z中加入高斯噪音,一共有T步,即z0,z1,z2…zt-1,zt…zT,最終則輸出噪音圖像數據zT。前向過程q(zt|zt-1)指的是通過向低維潛在數據zt-1中添加高斯噪音得到zt,它是一個從t=1到t=T的馬爾科夫鏈,分布公式為:

式中:z為一個從真實數據分布中抽出的數據q(z)[即z0~q(z)];βt(0≤βt≤1)為差異時間表(Variance Schedule),是一個隨時間變化的變量。

在此過程中,需要保證T足夠大和βt的設定合理。定義和αt=1-βt,再通過重參數技術,才能最后得到服從分布q(zt|z0)的任意一個樣本zt。

接著輸入需要條件,比如語義或者特征向量。本研究在此處對接了CNN特征識別模型輸出的中式家具特征向量,作為條件輸入。經語言模型τθ將它們轉換為嵌入向量即低維表征形式,一般采用BERT文本編碼器進行轉化,并與zT進行擬合,再通過交叉注意力(Q,K,V)映射到U-Net網絡層。U-Net作為擴散模型的主干網絡,可以對噪音進行預測,從而實現反向去噪過程,即從高斯噪音中采樣并繪制圖像。由于反向去噪過程未知,因此運用U-Net神經網絡對降噪過程p(zt-1|zt)進行學習。θ是神經網絡的參數,該神經網絡的目標是利用zt去學習zt-1的概率分布。去噪過程公式表示為:

式中:pθ(zt-1|zt)是一個需要計算均值μθ和方差Σθ的高斯分布,p(zt)=N(zT;0,I)是隨機采樣的高斯噪音。

正向添噪與反向去噪的過程反復進行,最終得到一個新的潛在數據z,再通過解碼器D,將其解碼回圖像,完成新圖像的生成。傳統GAN包括生成器和判別器,生成器用于生成畫作,判別器將判斷該圖像是否合格。兩者不斷競爭學習,迭代生成,最終輸出合格的畫作[19]。而LDM只需要生成器,通過正向擴散與反向去噪迭代運算完成后,重建一個以相同分布為先驗的全新樣本,進而解碼輸出圖像。擴散模型的算法更加簡單高效,在智能設計與方案生成方面具有很大的潛力與研究價值。

3.2 基于CNN和LDM的中式家具智能設計模型

搭建基于CNN和LDM的中式家具智能設計模型,首先要建立VAE變分自編碼器,將CNN輸出特征向量和原始圖片數據轉化為低維潛在向量。然后,將這些低維潛在向量輸入到所建立的LDM模型并完成模型訓練。最終輸出方案,并對生成模型進行評估,具體步驟如下:

1)搭建變分自編碼器(VAE),完成中式家具特征向量的輸入,作為LDM模型的初始狀態。在第二節中,筆者用CNN構建了中式家具特征識別模型,要將其輸出結果對接至潛在擴散模型。首先,需要通過VAE把高維特征向量與調用的圖像數據降維成低維潛在向量。VAE包括編碼器E與解碼器D,編碼器將輸入內容轉化為低維表示形式,使得擴散過程是在該低維表征中進行,擴散過程完成后,再通過解碼器將其解碼編譯成圖片,完成最后的圖像輸出。Python搭建VAE主要代碼見表3。

表3 VAE搭建代碼Tab.3 VAE building code

2)建立并訓練LDM模型。在Python中借助開源機器學習庫PyTorch載入預訓練的潛在擴散模型,定義一個包含多個擴散步驟的模型,每個擴散步驟包含一個可逆塊和一個通道注意力機制。這里定義1 000個擴散步驟,每次生成4個圖像。在潛在空間中,使用擴散模型來生成新的中式家具設計。在每個迭代步驟中,模型會從之前的圖像中提取特征,然后在潛在空間中執行一個擴散過程,生成新的潛在向量。最終通過VAE逆向映射到圖像空間中,生成新的中式家具設計方案。潛在擴散模型的目標是在潛在空間中生成新的樣本,使得這些樣本盡可能地接近于訓練數據的分布,越接近于原始數據分布,說明得到的數據越像真實數據,具體的損失函數:

式中:εt為添加的高斯噪音;εθ(zt,t)是一個神經網絡,用于預測從z0到zt時刻添加的噪聲。

訓練過程不需要對所有時間片進行訓練,可以直接采樣t時刻,然后得到xt并用神經網絡預測添加的噪音即可。訓練過程見表4 中的Algorithm 1。樣本生成過程是個反向去噪的過程,也就是zt到zt-1的過程。利用前一步訓練得到的εθ(zt,t),循環T步逐步去噪,即可從噪音中恢復一個像真實數據分布的新數據z0,樣本生成過程見表4的Algorithm 2。

表4 訓練和樣本生成的偽代碼Tab.4 Pseudocode for training and sample generation

完成樣本生成,以中式椅子樣本輸出為例,圖4分別采樣不同迭代次數下LDM生成網絡的4份輸出圖像數據,從左到右依此為擴散次數250次,500次,750次,1 000次??梢钥闯?,生成的圖片隨著擴散次數的增加越來越清晰,表明擴散過程在不斷擬合輸入的特征識別條件,并越來越接近真實圖像分布(圖4)。

圖4 不同迭代次數下LDM輸出圖像Fig.4 LDM output image with different number of iterations

3)生成模型評估。采用Frechet Inception Distance(FID)定量評估和專家主觀評估對生成圖像進行評估決策,以檢驗LDM模型的生成質量。FID是一種用于評估生成模型和真實數據分布之間差異的指標,主要用于評估圖像生成任務中生成圖像的質量[20]。FID計算生成樣本和真實樣本在Inception v3模型中的激活特征之間的Fréchet距離,即生成樣本和真實樣本在特征空間中的差異程度,公式表示為:

式中:μ1和μ2分別表示真實圖像和生成圖像在Inception模型中的特征向量均值;Σ1和Σ2分別表示真實數據分布和生成模型的協方差矩陣;Tr表示矩陣的跡操作。

通過計算兩個分布的均值和協方差,最終得到FID值,FID越小,則圖像質量越高,圖像分布越接近真實數據,如表5所示。當FID值在0~15之間時,通常被認為是非常優秀的結果,表示生成圖像與真實圖像非常接近;特別當FID值為0時,也就代表生成圖像與真實圖像一模一樣。FID值的大小標準與模型實際應用場景相關,當生成模型是為了進行圖片去噪、高分辨率圖像合成時,則FID值越接近0,效果越好[21]。但由于本研究的目的是為了輔助中式椅子創新設計工作,生成圖像需要與原始圖像有所不同,才有創新設計價值,因此FID值在15~30之間最佳。此時生成圖像與真實圖像有所差異與變動,并且圖像質量水平與細節特征的完整度已達到設計要求。在訓練智能設計模型時,迭代步數是指進行參數估計和主題更新的迭代次數[22]。通過多次實驗發現,當迭代步數超過250次時,學習曲線的代價值與訓練錯誤值[23]大幅增加,模型容易出現過度擬合訓練數據的情況。本研究把迭代步數設置為200次,此時模型輸出的圖像質量和FID值基本滿足設計需求,與真實圖像的差異合適。專家主觀評估[24]采取打分方式,邀請5位行業專家對生成方案的美觀性、特征細節、圖像完整性進行評分,并根據標準權重計算得出方案滿意度,滿意度越高則代表生成效果越好。

表5 FID值變化結果Tab.5 Change in FID value

為了進一步驗證本文提出的基于CNN和LDM的中式家具智能設計的可行性,將其與GAN生成模型、VAE生成模型[25-27]、圖文預訓練CLIP生成模型[28-30]進行對比分析,結果如表6所示。由數據可知,本文提出的基于CNN和LDM的設計模型FID值最終為21.76,方案滿意度為81.6%,優于其他生成模型。該創新性的智能設計模型得益于在設計生成階段融合了CNN所提取的特征向量,使得生成的椅子圖片所具有的中式家具特征細節更為完善美觀,智能設計效果更加成熟可靠,在文化產品的智能設計上表現出極大的可行性與優勢。

表6 對比結果Tab.6 Comparison results

4 結語

本文提出了一種運用CNN和LDM特性的智能設計模型,以中式椅子為例,通過CNN對椅子圖像的學習,提取中式家具形狀和色彩紋理特征,再將其所提取的特征向量輸入到LDM中,進而快速生成兼具傳統韻味和現代審美的中式家具創新設計方案。

通過對智能設計模型進行評估,與GAN、VAE、CLIP模型進行FID值和方案滿意度對比發現,該智能設計模型能夠有效實現中式家具的創新設計,最大化發揮了人工智能在圖像處理與內容生成方面的優勢,解決了文化產品的智能設計極易缺乏文化價值和傳統特征的問題。

針對后續研究,將繼續完善文化產品智能設計系統,建立人工智能輔助文化產品開發的科學體系,并進一步延伸至其他傳統文化產品的創造性轉化,為計算機技術與人文學科融合發展提供參考。

猜你喜歡
中式家具樣本
新年最美中式穿搭
用樣本估計總體復習點撥
家具上的“神來之筆”
現代家具創新化研究
向日常生活敬:2018danishdesign MAKERS家具展
新·中式生活美學Chinese NewAge
最美中式酒店,你去過幾個?
推動醫改的“直銷樣本”
隨機微分方程的樣本Lyapunov二次型估計
中式烹飪營養與健康
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合