?

基于深度學習的數字圖像隱寫和隱寫分析術研究概述

2021-02-19 05:28譚艷萍羅永張俊

現代信息科技 2021年13期

關鍵詞：數字圖像深度學習

譚艷萍羅永張俊

摘 ?要：隱寫術的不斷發展使得隱寫分析術面臨的挑戰越來越大。近年來，有不少學者圍繞深度學習網絡強大的圖像特征表達學習能力進行隱寫分析術研究，從而避開人工設計分類特征，減少人的參與度，用數據和算法驅動機器去實現數字圖像是否含密的判定。本文將從數字圖像的全局和局部統計分布特性這兩個方面出發，梳理傳統的和基于深度學習的隱寫與隱寫分析術在空域和JPEG域上的研究進展，并對數字圖像隱寫和隱寫分析術未來發展方向做簡要討論。

關鍵詞：深度學習;隱寫術;隱寫分析術;統計分布特性;數字圖像

中圖分類號：TP391.4;TP183 ? ?文獻標識碼：A文章編號：2096-4706（2021）13-0068-05

Study Overview of Digital Image Steganography and Steganalysis Based on

Deep Learning

TAN Yanping， LUO Yong， ZHANG Jun

（Guizhou University of Commerce， Guiyang ?550014， China）

Abstract： With the continuous development of steganography， steganalysis is facing more and more challenges. In recent years， many scholars have carried out steganalysis research around the powerful image feature expression learning ability of deep learning network， so as to avoid manually designing classification features， reduce people’s participation， and drive the machine with data and algorithm to determine whether the digital image contains secret. Starting from the global and local statistical distribution characteristics of digital images， this paper combs the research progress of traditional and deep learning based steganography and steganalysisg in spatial domain and JPEG domain， and briefly discusses the future development direction of digital image steganography and steganalysis.

Keywords： deep learning; steganography; steganalysis; statistical distribution characteristics; digital image

0 ?引 ?言

現代信息隱藏技術來源于古代一門有趣而又安全的傳遞秘密信息的隱寫術。隨著21世紀信息技術的發展和現代化進程的加快，古代隱寫術成為當今的研究熱點之一。嶄新的隱寫術在數理統計、多媒體處理技術和認知心里學等理論的基礎上應運而生。首先是對保護多媒體產品版權的數字水印研究的急劇升溫，公開發表的論文數量逐年遞增，有不少開發數字水印產品的公司如雨后春筍般涌現[1]，且數字水印在現實生活中應用極其廣泛?，F代信息隱藏技術的另一重要領域即數字隱寫術的研究也緊隨其后，很早就出現了一些簡單的數字隱寫術[2]，例如LSB替換[3]。數字隱寫術利用人類感官對細微變化的不敏感性和載體信息在時間和空間等方面的冗余性，將秘密信息嵌入載體（如：文本、圖像、音頻、視頻等）比較復雜且難以建模分析的區域之中，這樣隱藏的數據既不會改變原始載體信號的視（聽）覺效果，也不會改變其固有的統計分布特征，從而實現某種意義上的“不可視”的隱蔽通信[4]。數字隱寫術與傳統密碼通信技術不同的是，隱藏了“正在進行通信”這一事實本身，而且在數字隱寫的過程中，數據在嵌入載體前可以通過提前加密來進一步提高秘密通信的安全性。

數字隱寫術的發展，在帶來一種新的隱蔽通信方法的同時也帶來了網絡信息安全的威脅，在全球互聯的時代，每個人都能夠從互聯網上任意下載多媒體數據以及可以很方便地通過網絡獲取和使用相關隱寫工具，且近年來關于不法分子利用數字隱寫術開展非法活動的報道已經見諸報端，因此研究反隱寫技術具有非常重要的理論意義與實用價值。反隱寫技術即數字隱寫分析術，是一種與隱寫術相對抗的逆向分析技術，主要根據載體的統計分布特征來判斷其中是否含有秘密信息。根據研究目標的不同，可將數字隱寫分析術分為三個層次，第一層次就是檢測秘密信息的存在性，鑒于對數字隱寫術進行有效分析要遠比實現隱寫安全通信困難，因此現階段的研究基本上都還是停留在該層次。第二層次是要識別所用的隱寫工具、估計密鑰[5]、估計嵌入的秘密信息量[6]等，第三層次是要能截獲或提取隱蔽信息等，最高層次意味著難度最大但也最有實際意義。然而由于隱寫算法的層出不窮，尤其是時下最熱門的基于深度學習的數字隱寫術的出現以及海量的多媒體信息等，要從中搜尋隱蔽信息猶如大海撈針[7]。面對日漸嚴峻、層出不窮的信息安全問題，在信息隱藏領域中，研究數字隱寫分析術不僅可以通過檢測可疑信息的存在來阻止敵對勢力雙方的通信，還有益于整頓整個網絡的安全通信。當前關于數字隱寫和隱寫分析術的研究絕大部分集中在數字圖像領域，數字圖像隱寫及隱寫分析模型如圖1所示。

深度學習的概念，最早由杰弗里·辛頓于2006年提出。這是一門用于學習和利用“深度”人工神經網絡的機器學習技術，目前，深度學習已得到廣泛應用。如在博弈領域，AlphaGo通過深度學習，以4∶1的比分戰勝韓國棋手李世石，成為第一個擊敗人類職業圍棋選手的電腦程序，引起了業界的轟動;在圖像處理中，最通用的技術是計算機視覺，如圖像風格遷移、圖像修復、圖像上色、人臉圖像編輯以及視頻生成等;在數字圖像隱寫與隱寫分析術領域，深度學習帶來了活力與創新，借由深度學習網絡強大的特征表達學習能力，學者們發現通過對深度學習網絡結構進行相應的改進之后，就可以將深度學習與數字圖像隱寫和隱寫分析術相結合來提升該領域的算法設計及分類效果等，且取得了不少創造性的成果[8]。

本文從數字圖像全局和局部統計分布特性這兩方面出發，首先對傳統的數字圖像隱寫術做一個歸納性介紹，然后對基于深度學習的數字圖像隱寫術研究情況做簡要總結。對于數字圖像隱寫分析術主要介紹傳統的專用和通用隱寫分析術以及新式通用隱寫分析術即基于深度學習的數字圖像隱寫分析術的研究進展，最后對其還存在的問題做一個簡要討論。

1 ?數字圖像隱寫術

1.1 ?傳統數字圖像隱寫術

從數字圖像全局和局部統計分布特性出發，可以將傳統數字圖像隱寫術分為兩大類，一類是非自適應數字圖像隱寫術，圖像中的所有像素值或者變換域系數擁有同等的概率被嵌入秘密信息，即秘密信息可以嵌入整張圖像中的任意位置;一類是自適應數字圖像隱寫術，一張圖像會被劃分為不同的區域，只有那些非平滑區域或者邊緣部分才有較大概率嵌入秘密信息，即一般依據算法將秘密信息嵌入圖像紋理較為復雜的局部區域。

非自適應數字圖像隱寫術即從圖像的全局統計分布特性出發，將圖像看作一個整體來進行秘密信息的嵌入，根據數字圖像隱寫術嵌入域的不同，可以將其分為空域及變換域。在空域圖像中的典型隱寫術有：LSB（Least Significant Bit）[3]、LSBM（LSB Matching）、LSBMR（LSB Matching Revisited）、±K與隨機調制隱寫、EAMR等。數字圖像變換域隱寫術中最常見的隱寫方法是基于JPEG域的，后續關于變換域的介紹均以JPEG域代替?；贘PEG域的隱寫術是將秘密信息嵌入到JPEG壓縮過程中量化后的DCT系數。常見的基于JPEG域的隱寫術有Jsteg、Outguess、F5、Fridrich等人基于濕紙碼提出了一種擾動量化隱寫術nsF5等。這些隱寫術在嵌入秘密信息時操作簡單，但缺點是抗隱寫分析能力弱，易被發現。

自適應數字圖像隱寫術即從圖像的布局統計分布特性出發，將圖像中復雜度高的局部區域作為秘密信息嵌入的優先載體，通過設計合理的嵌入失真函數并使其最小化為依據來選擇嵌入點，這樣就使得同一幅圖像中的每個像素值或者變換域系數被嵌入秘密信息的概率有大有小，成為局部式而非全局式嵌入秘密信息。根據自適應數字圖像隱寫術的嵌入域不同，可以分為空域圖像和JPEG域。在空域圖像中典型的自適應隱寫術有：基于LSB算法的各種數字圖像自適應隱寫術[9-11]、HUGO、WOW、S-UNIWARD、HILL等，均將秘密信息嵌入空域圖像紋理復雜或邊緣等難以建模的區域?；贘PEG域的自適應隱寫術有：Huang等人提出的一種高安全性的基于JPEG域格式的隱寫術[12]塊熵Wang等人[13]基于量化的DCT系數的塊熵和STC（Syndrome-Trellis Coding）矩陣編碼提出的一種高安全性的JPEG隱寫術、J-UNIWARD等。這些自適應隱寫術嵌入過程相較于非自適應隱寫術更為復雜，但是從躲避攔截等方面來看，其抗隱寫分析能力強，安全性更高，更有利于秘密信息的傳送。為了更形象地展示出自適應數字圖像隱寫術嵌入秘密信息的特點，本文采用WOW隱寫術在空域圖像上分別演示這四種嵌入率0.1 bpp、0.2 bpp、0.3 bpp、0.4 bpp下圖像的載密情況，如圖2、圖3、圖4、圖5、圖6所示。從圖中可以清晰看出數字圖像自適應隱寫術可以完美地將秘密信息嵌入圖像紋理較為復雜的區域。

1.2 ?新式數字圖像隱寫術

為了區別于傳統數字圖像隱寫術，本文將基于深度學習的數字圖像隱寫術稱為新式數字圖像隱寫術，其大致可以分為采用生成對抗網絡和借鑒對抗樣本思想這兩類來生成載密圖像?；谏蓪咕W絡的數字圖像隱寫術一般集中于空域圖像，主要是從載體或隱寫失真代價方面“被動”地增強自身對隱寫分析的抵御能力[8]，典型的隱寫模型有：SGAN（Steganographic GAN）、SSGAN（Secure SteganographyBased on GAN）、HayesGAN、HiDDeN（Hiding Data With Deep Networks）等。而借鑒對抗樣本思想的數字圖像隱寫術一般通過“主動”干擾隱寫分析采用的機器學習模型來提高隱寫安全性[8]，主要有：Zhang等人[14]、Tang等人[15]、Ma等人[16]提出的數字圖像隱寫術。若從數字圖像全局和局部統計分布特性角度來看，SGAN、SSGAN及Stego-WGAN這三個數字圖像隱寫方法主要是基于圖像全局嵌入秘密信息，Tang等人[15]提出的ASDL-GAN和Yang等人[17]提出的UT-SCA-GAN通過在對抗訓練中利用生成網絡得到每個像素的嵌入改變概率得到像素修改圖[18]，主要從圖像局部嵌入秘密信息。新式數字圖像隱寫術依賴于網絡自主學習和數據驅動，與傳統數字圖像隱寫術最大的不同在于避開了由人工設計秘密信息嵌入算法，不再依賴于人的先驗知識和相關經驗，且在抗隱寫分析的能力上也變得更強。SGAN、SSGAN、Stego-WGAN、ASDL-GAN、UT-SCA-GAN在0.4bpp嵌入率下抗隱寫分析能力對比如表1所示。表中的數據均來源于提出該隱寫方法時的參考文獻，隱寫分析準確率越高代表該隱寫分析方法安全性越差，綜合比較之下，Stego-WGAN和UT-SCA-GAN性能較優。

2 ?數字圖像隱寫分析術

本節將從基于數字圖像全局和局部統計分布特性的角度出發，闡述近年來數字圖像隱寫分析術研究進展情況。

2.1 ?基于數字圖像全局統計分布特性的隱寫分析術

基于數字圖像全局統計分布特性的隱寫分析術將載體圖像或載密圖像作為一個整體，無差別對待圖像中的每一個像素或者每一個變換域系數。從應用范圍來看，基于數字圖像全局統計分布特性的隱寫分析術可分為兩大類，一類是針對特定隱寫術的檢測即專用隱寫分析術，一類是不針對任何隱寫術的通用檢測即通用隱寫分析術，而且還可以從空域和JPEG域來劃分專用隱寫分析術和通用隱寫分析術。針對空域圖像的專用隱寫分析術主要有：卡方檢驗方法、RS方法、SPA方法等，針對JPEG域特定隱寫術檢測的專用隱寫分析術主要有：卡方檢驗方法、定量隱寫分析檢測、基于直方圖的檢測等。這些方法均是專為某些特定的數字圖像隱寫術而設計的，具有較好的檢測效果，但是現實中往往很難提前獲知數字圖像采用的是哪一種隱寫術，因此其實用性及適用性均不強。而通用隱寫分析術則不受數字圖像所選隱寫術的限制，更具實際應用價值。在空域圖像通用隱寫分析術中，一般將嵌入的秘密信息視為高頻擾動信號，那么會先利用高通濾波器得出殘差圖像，以減少圖像內容本身所帶來的分類效果的負面影響而凸顯出秘密信息的存在，然后在殘差圖像的基礎上再使用各種統計模型來提取分類特征。從數字圖像全局統計分布特性出發，根據是否由人工參與設計分類特征，可以分為傳統數字圖像通用隱寫分析術和基于深度學習的新式數字圖像通用隱寫分析術：

（1）傳統數字圖像通用隱寫分析術。傳統數字圖像通用隱寫分析術主要分為特征構造和分類訓練這兩個階段，重點在于由人工設計分類特征，所以非常依賴設計者的先驗知識及分類器的判別能力。在空域圖像上，典型的通用隱寫分析術有：SPAM、SRM、PSRM、TLBP等，其中SRM在各類隱寫術的檢測中表現均不錯，贏得最多認可與關注。在JPEG域上，典型的通用隱寫分析術有：PEV、JRM、DCTR、PHARM、GFR等。無論是空域還是JPEG域，以上這些傳統的數字圖像隱寫分析術均是從數字圖像的全局分布提取有效特征。

（2）新式數字圖像通用隱寫分析術。在這里用新式數字圖像通用隱寫分析術指代基于深度學習的數字圖像通用隱寫分析術，主要用來區分人工設計分類特征的傳統數字圖像通用隱寫分析術?；谏疃葘W習的數字圖像通用隱寫分析術根據預處理層內部權重參數是否參與反向傳播可分為半學習隱寫分析和全學習隱寫分析[19]。

基于空域圖像的半學習隱寫分析模型主要有：Qian等人提出的GNCNN網絡、Xu等人提出的Xu-Net網絡、Yedroudj等人提出的Yedroudj-Net網絡、Li等人提出的ReST-Net網絡等;基于JPEG域的半學習隱寫分析模型主要有：Xu在原有Xu-Net基礎上提出的Xu-Net-JPEG網絡、Chen等人在Xu-Net的基礎上提出的VNet與PNet網絡、Zeng等人提出的Zeng’s model頻域分析模型等。這些空域半學習隱寫分析模型在嵌入率為0.4bpp，隱寫術為S-UNIWARD時隱寫分析準確率對比如表2所示，隱寫分析準確率越高，代表該隱寫分析模型性能越好，從表2中可以看出，ReST-Net網絡具有最高的檢測準確率。

基于空域圖像的全學習隱寫分析模型主要有：Tan等人首次將隱寫分析與深度學習相結合而提出的TanNet網絡、Ye等人提出的Ye-Net網絡、Boroumand等人提出的SRNet網絡（且SRNet網絡也可應用于JPEG域），Zhu等人提出的Zhu-Net網絡等?；谏疃葘W習的數字圖像通用隱寫分析術就是利用深度學習網絡強大的特征表達學習能力從圖像全局統計分布特性出發將特征構造與分類訓練融于一體，避免人工設計特征，利用數據驅動和計算機算力來實現隱寫分析。從實驗結果來看，全學習隱寫分析模型相對于傳統數字圖像通用隱寫分析術與新式數字圖像通用隱寫分析術的半學習模型具有更高的檢測精度，但是其所需要的訓練時間更長，也更容易出現過擬合情況等[19]。

2.2 ?基于數字圖像局部統計分布特性的隱寫分析術

基于數字圖像局部統計分布特性的隱寫分析術可根據載體圖像或載密圖像的局部紋理復雜度高、邊緣部分變化程度劇烈的區域來提取分類特征，一般先用高通濾波器得到圖像的高頻殘差圖像，然后在殘差圖像上進行直方圖或共生矩陣統計特征的構建，這樣操作就是為了最大化載密信息在分類中的作用。

對于空域圖像，根據圖像局部統計分布特性進行隱寫分析的方法從某種意義上可稱為自適應隱寫分析術，主要有：maxSRM、tSRM、σSRM、黃思遠等人[20]提出的基于顯著性檢測的圖像隱寫分析方法、Tang等人[21]提出的利用選擇信道信息的自適應隱寫分析等。對于JPEG域，其自適應隱寫分析術主要有SCA、李德維等人[22]提出的基于噪聲感知殘差網絡的JPEG隱寫分析方法等?；跀底謭D像局部統計分布特性的隱寫分析術強調的是自適應選擇圖像較復雜區域進行特征提取，盡可能將秘密信息的嵌入擾動量最大化，將圖像內容本身對于隱寫分析準確率的影響最小化。

3 ?結 ?論

本文從數字圖像的全局和局部統計分布特性這兩方面出發，梳理了數字圖像隱寫和隱寫分析術在空域和JPEG域的發展情況，重點在于近年來開展的如火如荼的基于深度學習的數字圖像隱寫和隱寫分析術。深度學習確實給這個領域帶來了不一樣的關于載密圖像生成和判別的思路，但是現階段的研究大部分還是停留在對深度學習網絡結構的改造上，且還存在以下幾個方面的問題：

（1）基于深度學習的隱寫術生成的含密圖像一般視覺質量不佳。

（2）基于深度學習的數字圖像隱寫分析術在面對隱寫算法比較復雜和秘密信息低嵌入率的情況中表現不佳，有待進一步尋求新的突破口。

（3）還未實現完全端到端的學習模式，依賴人工干預。

（4）基于深度學習的數字圖像隱寫分析術訓練效率較低，擬合度速度較慢。

（5）基于深度學習的數字圖像隱寫分析術通用性不夠，跟不上隱寫術的發展腳步，等等。在今后的研究過程中，將圍繞這些問題進行探索。

參考文獻：

[1] 王朔中，張新鵬，張衛明.以數字圖像為載體的隱寫分析研究進展 [J].計算機學報，2009，32（7）：1247-1263.

[2] JOHNSON N F，JAJODIA S. Exploring Steganography：Seeing the Unseen [J].Computer，1998，31（2）：26-34.

[3] PETITCOLAS AP F，ANDERSON J R，KUHN G M. Information hiding-a survey [J].Proceedings of the IEEE，1999，87（7）：1062-1078.

[4] 周翠紅，秦姣華，左偉明，等.空域圖像隱藏信息檢測技術研究 [J]. 湖南城市學院學報（自然科學版），2010，19（2）：55-60.

[5] TRIVEDI S，CHANDRAMOULI R. Secret key estimation in sequential steganography [J]. IEEE Transactions on Signal Processing，2005，53（2）：746-757.

[6] TRIVEDI S，CHANDRAMOULI R. Active steganalysis of sequential steganography [C]//Conference on Security and Watermarking of Multimedia Contents V Jan 21-24.Santa Clara CA：Proceedings of SPIE - The International Society for Optical，2003.

[7] 茹炳晟.JPEG圖像隱寫信息盲檢測系統的設計與開發 [D].上海：上海交通大學，2008.

[8] 翟黎明，嘉炬，任魏翔，等.深度學習在圖像隱寫術與隱寫分析領域中的研究進展 [J].信息安全學報，2018，3（6）：2-12.

[9] YANG C H，WENG C Y，WANG S J，et al. Adaptive Data Hiding in Edge Areas ofImages With Spatial LSB Domain Systems [J].IEEE Transactions on Information Forensics and Security，2008，3（3）：488-497.

[10] HUANG W，ZHAO Y，NI R R. Block-Based Adaptive Image Steganography Using LSB Matching Revisited [J]. Journal of Electronic Science and Technology，2011（4）：291-296.

[11] LIU G J，LIU W W，DAI Y W，et al. Adaptive steganography based on block complexity and matrix embedding [J]. Multimedia Systems，2014，20（2）：227-238.

[12] HUANG F J，HUANG J W，SHI Y Q. New channel selection rule for JPEG steganography [J].IEEE Transactions on Information Forensics and Security，2012，7（4）：1181-1191.

[13] WANG C，NI J Q. An efficient JPEG steganographic scheme based on the block entropy of DCT coefficients[C]//2012 IEEE International Conference on Acoustics， Speech and Signal Processing （ICASSP）.Kyoto：IEEE，2012.

[14] ZHANG Y W，ZHANG W M，CHEN K J，et al. Adversarial Examples Against Deep Neural Network based Steganalysis[C]//Proceedings of the 6th ACM Workshop on Information Hiding and Multimedia Security. ACM，2018：67-72.

[15] TANG W X，LI B，TAN S Q，et al. CNN Based Adversarial Embedding with Minimum Alteration for Image Steganography [J].IEEE Transactions on Information Forensics and Security，2018.

[16] MA S，GUAN Q X，ZHAO X F，et al. Weakening the Detecting Capability of CNN-based Steganalysis [EB/OL].（2018-03-29）.https：//www.researchgate.net/publication/324104295_Weakening_the_Detecting_Capability_of_CNN-based_Steganalysis/fulltext/5abdb18daca27222c755994b/324104295_Weakening_the_Detecting_Capability_of_CNN-based_Steganalysis.pdf？origin=publication_detail.

[17] Yang J，Liu K，Kang X，et al. Spatial image steganography based on generative adversarial network [EB/OL].（2018-04-21）.https：//arxiv.org/abs/1804.07939v1.

[18] 付章杰，李恩露，程旭，等.基于深度學習的圖像隱寫研究進展 [J].計算機研究與發展，2021，58（3）：548-568.

[19] 陳君夫，付章杰，張衛明，等.基于深度學習的圖像隱寫分析綜述 [J].軟件學報，2021，32（2）：551-578.

[20] 黃思遠，張敏情，柯彥，等.基于顯著性檢測的圖像隱寫分析方法 [J].計算機應用，2021，41（2）：441-448.

[21] Tang W，Li H，Luo W，et al. Adaptive steganalysis against WOW embedding algorithm[C]//Proceedings of the 2nd ACM workshop on Information hiding and multimedia security.2014：91-96.

[22] 李德維，任魏翔，王麗娜，等.基于噪聲感知殘差網絡的JPEG隱寫分析方法 [J].計算機應用研究，2021，38（10）：3148-3152+3165.

作者簡介：譚艷萍（1990—），女，漢族，湖南邵陽人，講師，碩士研究生，研究方向：數字圖像隱寫與隱寫分析;羅永（1991—），男，漢族，貴州畢節人，講師，碩士研究生，研究方向：物聯網技術應用;張?。?987—），男，漢族，河南信陽人，副教授，博士，研究方向：物聯網技術應用。

猜你喜歡

數字圖像深度學習

離散數列的傅里葉變換

科技資訊(2016年27期)2017-03-01

數字圖像處理在機械零件測量中的應用

科技資訊(2016年26期)2017-02-28

有體驗的學習才是有意義的學習

江蘇教育·中學教學版(2016年11期)2016-12-21

電子商務中基于深度學習的虛假交易識別研究

現代情報(2016年10期)2016-12-15

MOOC與翻轉課堂融合的深度學習場域建構

新教育時代·教師版(2016年23期)2016-12-06

大數據技術在反恐怖主義中的應用展望

法制與社會(2016年32期)2016-12-01

數字圖像時代應用型本科院校美術學專業轉型研究

美與時代·美術學刊(2016年8期)2016-11-09

深度學習算法應用于巖石圖像處理的可行性研究

軟件導刊(2016年9期)2016-11-07

基于深度卷積網絡的人臉年齡分析算法與實現

軟件工程(2016年8期)2016-10-25

一種對矢量地圖的理論研究

科教導刊·電子版(2016年1期)2016-03-14

現代信息科技2021年13期

現代信息科技的其它文章: 基于虛擬儀器皮蛋無損分選系統設計; 基于指紋USBKEY和監控功能的強身份認證設計; 高校在線課堂微學習空間小程序設計與實現; 基于CNN的人臉識別研究與實現; 水利工程建設項目管理信息系統設計; 基于Nmon監控工具的Linux服務器性能監控研究

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合