?

基于量子生成對抗網絡的數據重構

2024-03-12 08:58江奕達王明明
計算機工程與應用 2024年5期
關鍵詞:量子重構混合

江奕達,王明明

西安工程大學計算機科學學院,西安 710048

生成對抗網絡(GAN)[1]自提出起就引起了各界人士的廣泛關注,成為經典網絡中用于完成生成任務的典型模型之一,其通過對生成網絡(生成器)和判別網絡(判別器)同步進行訓練進而實現數據生成的工作。在GAN中,生成器盡可能生成可以欺騙判別器的假數據,而判別器通過區分真實數據與生成的假數據得到訓練。GAN已被廣泛應用在圖像生成[2]、圖像修復[3]、風格遷移[4]、圖像編輯[5]和自然語言處理[6]等一系列任務之中。

圖像的數據重構,又稱超分辨率重建[7-9],是指將給定的低分辨率圖像通過一定的算法或者深度學習網絡恢復成相應的高分辨率圖像,是從給定的低分辨率圖像中重建出高分辨率圖像的過程。對于單幅圖像的超分辨率最早是由SRCNN 網絡[10]來實現的:輸入一幅低分辨率圖像,僅利用一幅圖像來重建得到高分辨率圖像;其是一種基于監督學習的圖像超分辨率算法。經典超分辨率重建方法包括:SRCNN[10]、FSRCNN[11]、ESPCN[12]、VDSR[13]、EDSR[14]、TTSR[15]、ETTN[16]等,以及拓展到三維數據的超分辨率重建[17]。SRGAN[18],是使用生成對抗網絡實現的超分辨率的網絡,其基本流程如下:生成器模型根據輸入的低分辨率圖像生成其對應的高分辨率圖像,而鑒別器用于判斷圖像屬于生成的高分辨率圖還是真實的高分辨率圖像。兩者相互迭代訓練,直到鑒別器無法分辨輸入圖像是假圖像還是真實圖像。訓練完成后,生成器模型能夠重構出以假亂真的高分辨率圖像。

量子計算是基于量子力學演化過程,利用量子疊加性和糾纏性等特性來達到加速經典計算一種新型計算模式。著名的量子算法有:Shor 算法[19]、Grover 算法[20]、HHL算法[21]。隨著人工智能的發展,已經有多種經典算法與量子計算相結合的量子人工智能算法,如:量子支持向量機(quantum support vector machine,QSVM[22])、量子主成分分析(quantum principal component analysis,QPCA[23])、量子玻爾茲曼機器[24]和量子聚類算法[25]等。近年來,量子機器學習(quantum machine learning,QML)也在快速發展[26],其中參數化量子電路(quantum parameterized circuits,QPC[27])為QML 在嘈雜的中等規模量子(noisy intermediate scale quantum,NⅠSQ)時代[28]實現量子優勢提供了另一條途徑,包括量子卷積神經網絡[29]、量子對抗神經網絡[30]、量子強化學習[31]等模型被提出和發展。

量子神經網絡被用于數據分類[32]和圖像生成[33]等任務[34-35]中。例如,參考文獻[32]是多分類任務,其使用的是MNⅠST數據集;而參考文獻[36]是利用量子神經網絡做圖像的分割任務;參考文獻[37]使用量子線路構造新的參數化門實現了圖像的插值算法;參考文獻[38]提出量子生成對抗網絡EQ-GAN 用于創建近似量子隨機存取機(quantum random access machine,QRAM),提高了分類任務的量子神經網絡性能;參考文獻[39]中利用量子對抗網絡實現使用經典噪聲對手寫數據集進行模仿生成;參考文獻[40]是利用離子阱的方式產生量子噪聲來對手寫數據集的模擬生成,參考文獻[33]利用多個網絡拼接出一個手寫數字。

本文在文獻[41]中研究了基于量子神經網絡的低維數據重構問題,分別提出了基于參數化量子線路和基于量子自編碼器的數據重構模型。為了驗證模型的效果,在MNⅠST 數據集上對量子模型的重構效果進行了模擬仿真,并將結果與經典網絡進行了對比,結果顯示量子神經網絡具有很好的數據重構效果。本文研究是基于QGAN的數據重構問題。與先前的工作[41]相比,本文使用了不同類型的重構網絡實現數據重構模型。且本文還對比了使用相同量子編碼方案和相同判別器情況下,純量子生成器與量子-經典混合生成器實現圖片重構任務。同時,對比了在不同量子編碼方案下,Q-CGAN對圖片數據重構的效果,以及,在使用較少的參數下,略好于同等放大尺寸的經典網絡。

本文的貢獻:(1)使用純量子生成器構建量子對抗生成網絡來重構數據;(2)使用混合量子生成器構建量子對抗生成網絡來重構數據;(3)縮小了與經典網絡的重構效果的差距。

1 量子生成對抗網絡

1.1 振幅編碼

若使用量子計算解決經典問題,首先要考慮如何將信息編碼到量子態的問題。振幅編碼是一種將經典信息編為量子信息的常用方式。對經典信息先按照如下方式完成歸一化:

然后,再將其編碼到n個量子比特上生成量子態,形式如下:

1.2 角度編碼

將經典數據轉變成量子態的另外一種形式是角度編碼,其中構成量子線路中的部分量子門中的角度由經典信息所決定,編碼形式如下:

其中,Rθ為旋轉門Rx,Rz,Ry中任意一種形式。

1.3 損失函數和保真度

在生成對抗網絡中傳統的損失函數Loss 為生成對抗損失,但是對于成對的數據進行重構,需要多添加一項像素級的MSE Loss[18]來進行加強細節特征。

1.3.1 MSE Loss

MSE Loss 也就是均方差誤差,被廣泛運用于各種深度學習的模型的損失函數,其公式可寫成:

其中,n為圖像數量,Ti為目標數據,G(L)i為重構數據。

1.3.2 對抗損失

生成對抗損失是生成對抗網絡的顯著性損失,由兩個網絡互相牽制,促使生成器產生的圖像欺騙鑒別器。生成損失Lossg1是根據訓練樣本上的判別器D(x)的概率定義的,GAN 由參數化生成網絡G(θg,z1)和鑒別器網絡D(θd,z2)組成,其中zi為輸入數據(數據為隨機噪聲或者為輸入網絡的任意數值),θg和θd是網絡的參數。

鑒別器獲取輸入樣本,并給出樣本真實(來自數據)或虛假(來自生成網絡)的概率。訓練對應于一個極值優化問題,訓練在提高鑒別器區分真假樣本的能力和提高生成器欺騙鑒別器的能力之間交替進行。具體來說,求解成本函數V(D,G)的最小ln(1-D(G(z)))和最大lnD(x)??偟膿p失函數可寫為:

其中,x為真實樣本數據。量子生成器G(z)可寫為:

其中,z是輸入生成器中的數據,為z編碼的量子態。此時,生成器損失化簡可得出Lossg1:

式中U(θ) 為參數化量子線路的酉矩陣。

為了加強細節,對應再加入MSE Loss,則損失Lossg1則轉換為Lossg2[18]:

1.3.3 保真度

量子保真度是衡量信息在傳輸過程中保持原來狀態的程度,并廣泛應用于量子通信和量子計算理論研究中。對于兩個純態,保真度定義為[42]:

1.4 量子混合網絡模型

參數化量子線路模型中,使用可訓練的參數化量子門表示量子網絡。不同的參數化量子門組成的線路,可以實現不同的功能或對量子態施加不同的旋轉操作,用來完成特定的量子操作[32]。本文使用參數化酉矩陣構建可訓練的量子線路。例如,由Ry(θ),Rz(θ),Rx(θ)構成的單量子比特旋轉門或組合的多量子旋轉門,其中θ為可訓練門旋轉參數,為了提高量子比特間的相互關聯而使用的兩量子比特糾纏門,包括受控非門(controlled-not,CNOT)或者受控Z 門(controlled-z,CZ)等。由于每個旋轉組合可以單獨構成一個酉矩陣,那參數化的量子線路的酉矩陣可以寫成:

經典神經網絡在數據處理和擬合過程中,為了使網絡更加能接近訓練目標,演化出了各種強大的非線性的處理操作。所以由可訓練的參數化量子線路加經典層同構成一個混合型生成網絡。本文使用了三種QGAN網絡模型:純量子生成器模型以及兩種編碼的混合生成器網絡模型,即:振幅編碼的混合生成網絡模型和角度編碼的混合生成網絡模型,如圖1所示。為了對比模型的效果,本文也是用了經典GAN模型,如圖1(d)所示。

圖1 四種生成器模型結構圖Fig.1 Structure diagram of four generator models

(1)圖1(a)為純量子生成器模型:由可訓練參數化的量子線路構成。例如:由一組N個Ry(θ)和CNOT構成量子線路的其中一個酉矩陣,由M個酉矩陣共同組合成一個生成器。

(2)圖1(b)為振幅編碼的混合生成模型:其中參數化量子線路由K個Ry( )θ和CNOT構成或者為CZ控制門,經典網絡由線性層構成。

(3)圖1(c)為角度編碼的混合生成模型:先由經典層提取小維度圖片的特征圖,再由量子旋轉門把信息編碼為量子信息,放入振幅編碼同樣的混合生成模型里。

(4)圖1(d)為經典生成器模型:由多層線性層構成,從小維度數據重構出大維度數據。

所有網路中均采用相同的鑒別網絡,即統一由多個經典的線性層構成,用于分辨生成器輸出的是數據重構還是原數據,如圖2所示。

圖2 判別器結構圖Fig.2 Discriminator structure diagram

本文中,量子網絡模型基于參數化量子線路實現。經過反復測試,選用了圖3中的兩種量子線路[43]。文獻[43]指出這兩種參數化線路具有較高的糾纏性,并且具有較好的數據表達能力。由此,當使用輔助量子比特時可以把相關的數據進行糾纏,使其具有相對較好的數據表達能力。

圖3 量子線路圖Fig.3 Quantum circuit diagram

數據重構的流程如圖4 所示。圖4 的模塊可以分為:生成器、鑒別器以及數據編碼模塊。首先,經典數據經過量子態的編碼線路成為包含經典信息的量子態。然后,量子態經過不同的生成器重構出對應的數據,輸出數據由經典神經網絡構成的鑒別器來進行判別。最后,再由目標數值進行比較得出對應的損失函數數值,再并行反向傳播,交替優化鑒別器與生成器。經過反復的迭代運算使得網絡可以優化到使得Loss 值達到相對一定的小數值的范圍區間內。

圖4 數據重構網絡流程圖Fig.4 Data reconstruction network flow chart

2 模擬實驗

本文使用了MNⅠST 手寫數據集[44]作為實驗數據對所提出的框架進行了模擬仿真。為避免數據維度過高影響實驗效果,對數據集進行了統一的降維處理。首先,使用64 維的MNⅠST 數據集,將其降到16 維。然后通過振幅編碼或角度編碼,將數據編碼到量子態上。接著,使用生成器重構數據到指定維度,并將其輸入判別器判別數據的真假。

實驗中,純量子模型的量子生成器由40 層量子線路構成,適當的增加糾纏層可以增強網絡的表達能力[45],如圖1(a);振幅編碼的混合生成器模型,由10層量子線路加1 層經典線路構成,如圖1(b);角度編碼的混合生成器模型,由1層經典線路、10層量子線路與1層經典線路構成,如圖1(c);經典生成器由3 層線性層[46]構成,如圖1(d)。所有模型中,判別器使用的是同一結構的經典判別器。

2.1 使用量子線路1構造量子生成器網絡

這里展示了使用量子線路1,如圖4(a),構造純量子模型、振幅混合模型、角度混合模型,以及使用經典生成器在不同數據下的訓練和測試效果對比。

圖5 為訓練情況下的生成器Loss 值和測試情況下的保真度情況。其中,第一列是圖像0的訓練圖與測試圖,第二列是圖像1的訓練圖與測試圖,第三列是0、1混合圖像的訓練圖與測試圖。

圖5 線路1下各模型的訓練和測試比較圖Fig.5 Comparison of training and testing of each model under line 1

由圖5中的對比數值可以看出,訓練Loss圖為生成器訓練150次后的數值,其整體趨勢是隨訓練次數向下減少。對于測試保真度的圖,測試圖是測試了30 張或60張圖片,增加經典層與不增加經典層產生的結果和數據會發生變化,其中混合生成器模型下重構出的保真度會比純量子生成器線路高一些。適當增加經典層后,網絡生成效果會相對有所提高。與經典網絡模型相比,重構出的效果也會相對較高。具體平均數值見表1。

表1 各網絡數據重構的測試保真度值Table 1 Fidelities of test data for reconstruction by using different networks

2.2 量子線路1的重構效果圖

這里展示了重構數據圖像0、圖像1、混合圖像的情況。圖6 為每組重構圖像,從左到右的圖像分別為:低維小圖、純量子模型生成圖、振幅混合模型生成圖、角度混合模型生成圖、經典生成器模型生成圖以及目標參考圖。

圖6 線路1下各結構的重構數據圖Fig.6 Reconstruction data diagram of each structure under line 1

由圖6 與圖5 數據可以看出,當使用混合模型時量子線路僅使用10 層的規模,再加上部分經典結構生成器,可以使生成效果以及對應的保真度數值提高。

2.3 使用量子線路2構造量子生成器網絡

這里展示了使用量子線路2,如圖4(b),構造純量子模型、振幅混合模型、角度混合模型,以及使用經典生成器在不同數據下的訓練和測試效果對比。

圖7 為訓練情況下的各生成器Loss 值和測試情況下的保真度情況。第一列是圖像0的訓練圖與測試圖,第二列是圖像1的訓練圖與測試圖,第三列是混合圖的訓練圖與測試圖。

圖7 線路2下各模型的訓練和測試比較圖Fig.7 Comparison of training and testing of each model under line 2

由圖7中的對比數值可以看出,訓練Loss圖為生成器訓練了150次后的數值,其整體趨勢同樣是隨訓練次數向下減少。同樣對于測試了30張或60張圖片來看測試保真度的圖,可以看出混合生成器模型下重構出的保真度會比純量子生成器線路和經典網絡高一些。具體平均數值見表1。

2.4 量子線路2的重構效果圖

這里展示了重構數據圖像0、圖像1、混合圖像的情況。圖8為每組重構圖像,從左到右的圖像分別為:低維小圖、純量子模型生成圖、振幅混合模型生成圖、角度混合模型生成圖、經典生成器模型生成圖以及目標參考圖。

圖8 線路2下各結構的重構數據圖Fig.8 Reconstruction data diagram of each structure under line 2

由圖7與圖8數據以及對照線路1的各項參數圖與重構圖,可以看出,使用混合模型時生成效果以及對應的保真度數值較高。

2.5 實驗結果分析

從損失函數來看,單獨使用對抗損失不能夠完成任務需求(等式(7)),測試時會出現重構出相似的圖片,如圖9 所示。圖9 中的三個圖片從左到右分別為:單個訓練數據0測試圖、單個訓練數據1測試圖、混合訓練測試圖??梢钥闯?,它們是在擬合圖像0的大概特點,1的大概特點,以及0與1的共同特點。

圖9 單獨使用對抗損失時的重構數據圖Fig.9 Reconstructed data plot under adversarial loss

上述只使用對抗損失的情況下,會擬合出共同特征。此時判別器的任務是使得生成器生成的數據更加符合目標的整體特征。加入MSE Loss(等式(8))之后,加強了不同類型生成數據的細節,可以較好地生成不同的數據特征。

從模型對比來看,混合模型相對于經典網絡優勢。首先,混合模型相對于經典網絡則使用量子資源作為輸入數據,進而可以使用更少的數據的輸入。其次,混合模型結合量子糾纏與并行的量子特性可以表現出較好的擬合能力,而量子參數化網絡具有更少的參數,使得構造混合線路可以相對經典網絡使訓練的參數更少,網絡規模也相對較小。

從線路1 與線路2 的重構圖來看,在純量子生成器的框架中,重構出的數據具有較好的效果。例如,使用線路1 的純量子生成器可以達到經典網絡相近的結果。在四個混合模型中,重構出的數據相比經典網絡具有更高的保真度。

從整體模型來看,純量子模型方面:(1)對于量子層來說由于量子的特殊性,輸入的數據可以指數級地減少,進一步使得數據的存儲空間大大減少;(2)量子數據的處理是并行處理的,理論上是可以減少數據處理的時長?;旌夏P头矫妫涸谶x擇合適的網絡構造之后,數據經過編碼輸入參數化量子層,接著使用糾纏門進行數據間的強相互關聯,增加信息間的關聯性,在量子的線性空間尋找位置并且使用少量的處理資源后,再結合經典層的后續處理與表達,其效果好于對應純量子模型以及構造的經典模型。

表1 為使用不同參數量的各種網絡下的保真度的數值??梢钥闯?,少量參數下擬合效果總體相對不高,當兩種網絡參數在4 000 左右時,可以得到較好的效果。對于在圖像0的數據重構中,經過加入經典層的量子神經網絡可以使得重構的數值普遍升高,大多達到0.95以上,比純量子線路以及經典網絡的數值略高。對于圖像1的數據重構中數值可以普遍達到0.93往上,同樣比純量子線路以及經典網絡的數值相對高一些。對于混合圖像的數據重構,數值與圖像0 和圖像1 相比會下降一些,但還是高于純量子線路以及經典網絡。其中,量子線路1 的效果普遍好于線路2。通過單一數據和混合數據的訓練和測試結果可以看出,在混合訓練或者是相對較為復雜的圖像重構恢復時,重構數據的保真度會有所下降。保真度下降的原因包括以下方面:(1)網絡的結構簡單或深度不夠;(2)數據的轉換方式需要進一步調整;(3)損失函數選取可能不合理,需進一步改造;(4)網絡中可能需引入預訓練模型。等等其他原因。擬對應改進措施:(1)由表1可知,相對復雜和相對較深的網絡的保真度是相對較好的??梢詷嬙旌线m的深度或復雜的網絡來改善復雜數據的重構。(2)由文獻[45],可知把初始數據轉換成另一種特征數據(如:重映射方法),提高了網絡表達效果。進行有效的數據轉換可以提高網絡的擬合能力。(3)由實驗可知對損失函數的合理改造可以提升網絡的性能。(4)由參考文獻[18]可知,當引入預訓練網絡,可以有效抽取出數據特征,并對其后續處理,進一步提高網絡的擬合能力。對綜上原因和一些其他原因進行合理改善,可以進一步提高網絡的表達能力,進而相對提高重構效果。

3 討論和總結

文獻[39]中提出了基于量子生成對抗網絡(QGAN)使用噪聲生成圖片,其圖片內容相對較為模糊,且QGAN由于在非線性表達中存在擬合能力不足的問題,使得該模型不能很好的適配成對數據,達到較好的生成效果。本文中,為了重構出特定數據且使得重構效果更加完善,引入了像素級損失來增強適配圖片的重構效果。提出了一種使用經典網絡非線性能力的PQC,搭建混合對抗生成網絡(Q-CGAN),實現圖片數據的重構。

本文分別使用純量子生成器模型、振幅編碼混合生成器模型和角度編碼混合生成網絡模型,考慮了使用不同類型PQC 的情況下,對于不同類別圖像數據的重構生成效果。結果顯示,純量子生成器的重構效果和經典生成器效果相近,混合生成器的重構效果優于經典生成器。文獻[47]中指出,在使用量子線路與經典的混合網絡時可以產生更好的效果。(1)使用量子層是為了使得特征圖能夠在指數級大的線性空間中探索相鄰數據點的相關性,加強數據間的關聯性。(2)使用經典層是為了非線性、以及對深度結構的可擴展性。量子線路是一個維度指數巨大的線性網絡,對于各種復雜的非線性任務來說線性網絡是滿足不了任務需求。從而利用量子性質結合經典層的非線性,可以使得網絡更加適配任務。本文結果進一步驗證了該結論。

與本文相關的一些研究的對比如表2所示,相同之處在于所列文獻與本文一樣都使用GAN的整體模型框架,采用手寫數據集作為驗證數據集。與之不同的是,本文提出了一種將量子與經典相混合的Q-CGAN 生成器網絡,用于圖像的重構任務。與純量子生成器相比,其在圖像重建任務中也展現出了一定優勢。

表2 本文與已有文獻的對比Table 2 Comparison with previous references

更進一步,從本文的數據來看,將經典數據合理編碼成量子態是一個比較重要的研究。文獻[48]指出,這影響著經典數據的有效轉換以及量子線路的有效表達和處理。本文的混合生成器模型相對于純量子網絡生成器擴大了訓練參數。接下來的研究工作以輕量化的網絡為方向。對應的輕量化主要研究想法由以下幾點展開。(1)設計參數化量子門:參數化量子線路擁有各種個性化的量子門,而量子門對于量子比特在空間中旋轉操作以及尋找到目標空間起著重要作用。設計參數化的量子門就顯得尤為重要。(2)編碼方式:編碼決定著經典信息是否可以高效轉換成量子信息,這樣使得訓練量子參數化線路可以更容易,進一步提高網絡表達能力從而可以減少網絡復雜度。

猜你喜歡
量子重構混合
2022年諾貝爾物理學獎 從量子糾纏到量子通信
混合宅
長城敘事的重構
一起來學習“混合運算”
決定未來的量子計算
新量子通信線路保障網絡安全
北方大陸 重構未來
北京的重構與再造
油水混合
一種簡便的超聲分散法制備碳量子點及表征
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合