?

水下無線傳感網的自適應時域壓縮方法

2024-01-10 01:35應蓓華王子聰
浙江工商職業技術學院學報 2023年4期
關鍵詞:壓縮算法壓縮比原始數據

應蓓華 王子聰

(浙江工商職業技術學院,浙江 寧波 315012)

1 研究背景

覆蓋地球表面70%多的海洋對人類的生存與發展具有重要而深遠的意義。隨著科學技術的進步和海洋經濟的興起,世界各國對海洋權益及其蘊含的巨大能源和多種資源愈發重視,人類對海洋勘測和開發等相關領域的技術需求亦日顯迫切[1]。在此背景下,水下無線傳感網(Underwater Wireless Sensor Network,簡稱UWSN)正成為興起的新的研究熱點[2]。

UWSN 是指將低能耗、具備短距離通信能力的水下傳感器節點以固定在海底或懸浮于海中的形式部署在指定海域中,節點內部集成用于測量溫度、鹽度、深度、壓力、波高、剖面流量等海洋環境參數的傳感器,且能通過聲學網絡通信的方式將采集的數據傳遞至漂浮于水面的基站或船舶,并通過無線網絡通信,經由衛星或互聯網最終達到用戶端[3]。圖1、圖2 所示分別為水下無線傳感網的系統示意圖及其基本架構。在海洋勘探與開發、環境監測、溢油檢測、潛艇探測、災害預警預報等眾多軍用和民用領域,UWSN 有著廣闊的應用前景和發展潛力。不管是理論探索還是技術實踐,對高可靠性、高使用壽命的UWSN 進行研究都具有深刻而重大的意義。

圖1 水下傳感網的系統示意圖

圖2 水下傳感網的系統架構

然而,水下無線傳感網的傳輸能力弱和傳輸能耗大是其區別于其他無線網絡的最大不同。在低通信帶寬、低傳輸速率、高誤碼率和高發射功率的共同影響下,相對于目前再生能源供給技術并不成熟的高制造成本和高部署成本來說,水下節點僅靠有限的電池供電,其能量的高效使用無疑是亟待解決的重要問題之一。而水下網絡的特性及其對能耗提出的嚴格要求,將深刻影響UWSN 四層體系結構的設計,同時也給水下網絡的進一步研究帶來了更多的挑戰。

2 研究現狀及存在的問題

2.1 國內外研究現狀

在WSN 的早期研究中,網內信息處理是數據傳輸協議中較為重要的研究分支之一。鑒于節點計算資源和存儲資源受限,適用于WSN 的數據處理大多為輕量級算法,即在引入少量額外計算能耗的前提下,降低節點的總能耗。根據數據相關性的不同處理角度,現有WSN 數據壓縮算法可分為以下三種:時域壓縮、空域壓縮和時空域壓縮。

在時域壓縮中,得益于較低的計算復雜度,以分段常數逼近(PMC-MR 和PMC-MEAN)[4]、滑動窗口平均[5]、類似旋轉門趨勢壓縮的輕量級時域壓縮機制LTC(Lightweight Temporal Compression)[6]為代表的線性回歸算法,與預測編碼[7]、小波變換[8]等成為該領域的主流技術??紤]到處理器的計算能力和存儲能力,預測編碼多采用一階自回歸和一次移動平均作為預測模型,而小波變換則以基于提升格式(lifting scheme)的二代小波為主,最常用的是5/3 小波和2/6 小波。

2.2 存在的問題

可以看出,作為最貼近UWSN 的無線網絡,WSN在網內信息處理方面已有一定程度的研究積累,但由于這些方法的適用性受限于WSN 的自身特點,無法直接拓展至水下,分析其原因,大致有以下幾點:

一是輕量級的算法制約了信息處理的效果??紤]到WSN 節點的計算和存儲能力有限,且處理器的工作功率和節點通信功率基本處于同一數量級,算法的輕量級是設計的基本要求。大多數壓縮方法在降低復雜度的同時也損失了大部分的壓縮效果。從近幾年研發的水下節點來看,在MCU 的選擇上已從2006 年USC 節點[9]的ATMEGA 128L、UCI 節點[10]的MSP430 發展為2012 年GaWoNU[11]節點的ARMCortex-M3??梢钥闯?,處理器性能的提升令執行壓縮有了更多的選擇。更重要的是,由于發射功率遠遠高于處理功率,水下節點可以通過適當增加計算復雜度來獲取更好的壓縮效果,進一步凸顯網內信息處理在水下網絡通信中的節能優勢。

二是水下數據的類型和特點有別于陸上WSN應用。在UWSN 應用場景中,大部分原始數據采集于水下。水下環境復雜多變,存在很多隨機的不確定性。以最常見的溫度數據為例,圖3 所示為傳感器在相同時間、不同海拔高度下測得的溫度變化曲線,此實測數據取自熱帶太平洋觀測系統[12](Tropical Atmosphere Ocean project)??梢钥吹?,即便是同一種數據類型,在不同環境下也會表現出不同的變化特性,這將直接影響陸上WSN 的信息處理方法對水下數據的適應程度。另一方面,陸上WSN 并未對水下測量特有的物理量如水深、波高、波向、鹽度、導電率、溶解氧、濁度、剖面流速、剖面流向、潮汐水位高度等的變化特性進行深入研究,進而無法獲知適合各個數據類型的信息處理方法。

圖3 相同時刻、不同監測位的溫度變化曲線

三是UWSN 的稀疏部署弱化了原始數據的空間相關性,影響著水下節點的工作模式。由于WSN 屬于密集部署型網絡,節點密度高、距離近,通常情況下,原始數據間存在著較大的空間冗余。因此,WSN研究大多側重于節點的空間相關性。而對于高節點成本的UWSN 來說,節點間的距離通常達到幾百米,稀疏型部署使節點的空域相關度明顯減少,基于空間冗余而提出的信息處理方法大多不再適用,而時域相關的方法研究則仍待加強。此外,由于原有方法涉及的信息頻繁交互方式將帶來大量通信損耗,水下節點需要盡可能地減少交互的次數,更多地采用自學習的方式和預測機制來實現節點的協同工作。

鑒于以上幾方面原因,WSN 的信息處理方法不適宜直接移植并應用于水下,而目前針對UWSN 提出的信息處理及其相關算法的研究則仍處于起步階段,不少文獻僅僅提及要在UWSN 中使用數據壓縮,但并未深入展開[13]。在已發表的應用于UWSN的信息處理方法中,有研究提出將傳統的網絡編碼延伸到水下,運用水下模擬測試平臺,驗證了簡單網絡拓撲下(菱形拓撲),利用數據相關性對其進行網絡編碼,能有效彌補水下環境帶來的信號損失,提高差錯恢復率[14]。還有研究提出,可在多跳傳輸機制中使用隨機線性網絡編碼,提高信道吞吐量[15]。

3 適用于水下網絡的自適應時域壓縮

能量的高效使用是UWSN 的首要設計目標。數據壓縮(Data Compression)技術被引入UWSN 中,得益于其在去除數據冗余方面的能力。在滿足應用需求的前提下,對原始數據進行適當的網內處理,減少數據傳輸量,進而有效地節省能耗,延長網絡生存壽命,是數據壓縮的基本功能。

3.1 背景技術

通過對現有時域壓縮算法的節能效益進行評估后發現,數據壓縮算法不能保證在任何情況下都能獲得節能效果。在某些應用場合中,節點的密集部署使得通信的射頻功率降低,而數據的精度要求較高則直接影響壓縮的執行效果。在這種情況下,執行網內數據壓縮未必能夠實現預期的節能目的,反而會因為額外增加的計算能耗超過節省的通信能耗,使執行壓縮算法得不償失。由此,一種針對單一時域壓縮算法進行節能優化的節點級壓縮判決機制被提出,并用來在執行壓縮前,對壓縮是否節能進行預判[16]。

將 “壓縮判決方法” 應用于傳感器節點,能夠有效避免壓縮可能帶來的不必要的能量損失,但此方法仍然存在著一定的不足:壓縮判決僅針對單個節點進行能量優化,并未考慮網絡全局和無線通信的信道質量。該方法從節點自身的能量損失來判斷壓縮是否節能,通過將節點執行壓縮的計算能耗與節點發送壓縮后數據能夠節省的發射能耗進行比較,得到判決結果。由此可見,此方法只實現了節點級的能量優化,并未涉及網絡中普遍存在的多跳傳輸情況以及實際信道的多變性。在多跳傳輸中,壓縮帶來的通信數據量的減少,不僅能夠節省本地節點的發射能耗,而且也能降低后續中繼節點的通信能耗,與此同時,無線信道的不確定性帶來了數據重傳的可能。因此,在壓縮與否的判定中,需要進一步考慮網絡中的其他節點和實際信道質量,實現全網級別的能量優化。

3.2 具體實現

圖4 為傳感器節點的硬件框架。該基本架構以微處理器為主要控制單元,兼備一定的存儲功能。其余各個模塊的功能如下:傳感器(或稱為執行器)負責實現數據采集;射頻收發器進行數據的無線傳輸;能量供應單元分別給射頻收發器、微處理器以及傳感器提供能量;用戶接口負責節點與上層管理終端的通信連接,包括應用參數的設置以及相關信息的讀取。

圖4 傳感器節點的硬件框架

圖5 為軟件架構體系,該體系位于節點微處理器的處理單元內,該體系在數據處理層中添加了壓縮決策的模塊,以此實現自適應壓縮控制。整個軟件體系共分五個層次,與互聯網所使用的五層協議類似,從頂至下依次為:應用層、數據處理層、網絡傳輸層、數據鏈路層以及物理層。其中,數據處理層包括兩個子功能模塊:數據壓縮和壓縮決策,壓縮決策執行本研究所闡述的壓縮判決過程,數據壓縮執行數據壓縮過程。所需的預知信息均讀取自微處理器的存儲單元,分別由與微處理器連接的各個模塊提供。通過壓縮決策可以得到最佳的壓縮執行策略: 執行備選壓縮算法中的一種或是不執行任何壓縮操作。

圖5 傳感器節點的軟件架構體系

本設計中,整個自適應壓縮方法包括兩個部分:建模和決策執行。由于壓縮決策需要預測出各種備選壓縮策略的總能耗并加以比較,因此在執行決策前要建立相應的預測模型。本研究涉及到的預測模型包括:壓縮比的預測模型和壓縮執行時間的預測模型。通過數據庫技術建立的這兩種預測模型,采用不同種類的備選壓縮算法,基于同一種原始數據,以不同精度要求下獲得的壓縮比和執行時間作為建模輸入,在MCU 中對數據進行統計分析及插值計算,進而構筑預測所需的二維表格,當壓縮比的預測模型和壓縮執行時間的預測模型建立后,通過查表的方式,由壓縮比的預測模型得到CR,由壓縮執行時間的預測模型得到TMCU。本研究所需的預測模型,是基于精度要求e 的二維表,其屬性分別為:

壓縮比預測表={(精度要求),(平均壓縮比)}壓縮執行時間預測表={(精度要求),(平均壓縮時間)}

不同的壓縮算法均構筑對應的兩張預測二維表,并通過查表完成壓縮比和壓縮執行時間的預測。若應用提出的精度要求無法直接在表中查得,則采用插值運算獲得所需值。本設計采用分段多項式插值中的分段線性插值,當然,其他低復雜度量的插值運算也可用于本研究,不限上述幾種。

分段線性插值的基本原理是:設函數y=f(x)在節點:a≤x0<x1<…xn≤b 上的函數值為: f(x0),f(x1),…,f(xn)則在區間上[xk,xk+1],對應節點x 的插值I(x)可由下式計算得到:

以上建模過程稱為自適應壓縮方法的機器學習,由節點在線完成。機器學習程序使用所記錄的樣本數據,通過統計分析和插值計算,得到兩種預測模型的二維表格,以此取代人工輸入參數的離線建模方式。

在網絡運行初期,節點執行各種備選壓縮算法,記錄不同精度要求下各種算法的壓縮比和壓縮執行時間,以此作為樣本輸入,構筑兩種預測模型的二維表,并將其存儲于微處理器中,完成首次建模。為了保證預測的準確性,在之后的網絡運行過程中,節點將隨機選取若干新樣本進行模型驗證,若其預測誤差超過設定的閾值將觸發節點再次進入機器學習,對模型予以修正和調整。機器學習過程中,節點將不執行任何壓縮算法,直接傳輸原始數據。

自適應壓縮方法的決策執行部分即為實際執行壓縮判決的過程。圖6 為本設計提出的壓縮決策的工作流程。整個工作流程包括以下幾個步驟:

圖6 傳感器節點的軟件架構體系

步驟1: 如果壓縮決策所需的任一預知信息發生改變,則壓縮決策啟動。預知信息中,發射功率、精度要求、節點位置(跳數)和數據重傳率的變化相對頻繁,故而成為啟動壓縮決策的主要因素。

步驟2: 壓縮決策模塊從應用層中獲取相關信息。所涉及的信息包括:數據類型、精度要求以及壓縮算法種類,相應地保存于微處理器的存儲單元內,可以通過用戶接口預先設置(節點部署前),也可以取自射頻模塊提供的控制幀信息(節點部署后)。

步驟3:根據應用層提供的相關信息,預測各種備選壓縮算法(本文為一次移動平均預測、LAA、PMC-MR 和LTC)所能獲得的平均壓縮比CR。預測過程需要借助自適應壓縮方法在機器學習階段建立的預測模型。本文涉及到的壓縮比,其定義為壓縮后的數據總量與原始數據量之比。經由樣本統計所獲得的壓縮比預測模型,通過查表或插值運算,可以預測出確定類型的原始數據,在特定的壓縮算法和不同的精度要求下,能夠達到的平均壓縮比CR。本文的精度要求也可表示為應用背景給出的數據誤差容限。

步驟4:根據應用層提供的相關信息,預測執行各種備選壓縮算法(本文為一次移動平均預測、LAA、PMC-MR 和LTC) 所需的平均時間作為TMCU。該預測過程與步驟3 中所述的過程相類似,即預測過程需要借助自適應壓縮方法在機器學習階段建立的預測模型。經由樣本統計獲得壓縮執行時間的預測模型,通過查表或插值運算,預測出確定類型的原始數據,在特定的壓縮算法和不同的精度要求下,能夠達到的平均壓縮時間TMCU。

步驟5: 壓縮決策模塊從網絡傳輸層中獲取相關信息,包括:發射功率、節點位置(跳數)、數據重傳率、接收功率、數據傳輸速率以及MCU 計算功率等。

步驟6: 計算各種備選壓縮算法的總能耗Ecomp以及不執行壓縮時的總能耗Euncomp。壓縮算法的總能耗Ecomp和不執行壓縮時的總能耗Euncomp經由以下推導給出:

壓縮算法的總能耗由兩部分組成: 微處理器(MCU)執行壓縮的能耗和射頻(RF)模塊的通信能耗;不執行壓縮時的總能耗則僅有射頻模塊的通信能耗??紤]到射頻模塊的喚醒能耗是所有情況共有的(無論是否執行壓縮算法,或是執行哪種壓縮算法),因此不會對能耗比較結果產生影響;同時,數據幀的幀頭部分長度相比于數據部分而言微乎其微,也是可以忽略的,因此,總能耗Ecomp和Euncomp可以簡化為:

其中,PMCU為微處理器MCU 的功率;L 為原始數據總長度;TMCU為在已知精度要求e 下,節點壓縮1 個字節數據的時間開銷,由壓縮執行時間的預測模型計算得到(步驟4);PTX為節點間通信距離d 下,射頻模塊的發射功率;CR 為在已知精度要求e 下,算法的平均壓縮比,根據壓縮比預測模型計算得到(步驟3);Ttran為節點發送1 個字節數據所需的時間,由數據傳輸速率決定;PRX為射頻模塊的接收功率;節點位置即跳數h=1 表示的是匯Ttran聚節點的鄰居節點,由于匯聚節點是能量不受限的超級節點,因此這種情況下的總能耗僅考慮發射部分,而無需包含接收部分;數據重傳率g 反映出節點多跳路由中通信信道質量,數值越大,表示接收誤碼率越高,通信信道越惡劣。

步驟7: 比較各種備選壓縮算法的總能耗Ecomp和不執行壓縮時的總能耗Euncomp,選擇其中能耗最低的一種壓縮策略,并予以執行。能耗最低即表示策略的節能效果最佳,其比較結果可能為備選壓縮算法中的一種,也可能是不執行任何壓縮,直接發送原始數據。

步驟8:節點結束一次壓縮決策過程。

4 實驗結果

為了檢驗自適應壓縮方法對網絡能耗的優化作用,我們首先選取采自于實際物理環境下的傳感器數據及適用于該數據特性的壓縮算法,以此建立所需的兩種預測模型,即完成自適應壓縮方法的機器學習階段;然后通過仿真來比較傳統的數據壓縮算法與結合了壓縮決策的自適應壓縮方法,在等同條件下的能耗差異。此外,為了驗證預測模型的在線建模方式對數據特性變化的跟蹤能力,我們選擇兩種不同變化特性的數據樣本,比較其與離線建模方式的預測準確性,并同時對本課題采用數據庫建模技術取代數據擬合方式的可行性進行了驗證。

這里選取的原始數據來自于太平洋海洋環境實驗室的熱帶大氣海洋計劃。此外,我們選擇的4種備選壓縮算法分別代表了復雜度和壓縮效果的不同折中,包括復雜度較低、但壓縮效果較差的LAA 和一次移動平均預測,以及復雜度較高、但壓縮效果較好的PMC-MR 和LTC。需要特別指出的是,根據我們對大量數據類型和壓縮算法的仿真,本課題提出的自適應壓縮方法并不局限于特定的數據類型和備選壓縮算法,這里選擇特定的數據類型和備選壓縮算法只是為了更好地說明這一方法所能獲得的效果。

表1 給出了TAO 中原始數據海水溫度在一次移動平均預測算法作用下獲得的平均壓縮比二維表。同理可以獲得壓縮算法執行時間的預測模型。為了比較數據擬合與本課題所述的數據庫關系模型在預測精度上的差異,我們選取實際數據的真實壓縮比進行對比,如表2 所示。其中,“查表值” 即為關系模型建立后得到的二維表中的數值??梢钥闯?,基于數據庫技術的壓縮比預測并未引入太多的誤差,反而大大簡化了預測過程,降低了預測的計算量和復雜度。

表1 一次移動平均預測的平均壓縮比表

表2 數據擬合和關系模型對比

若二維表中無法查到所需的預測值,本課題提出可通過插值計算得到。表3 所示為插值得到的壓縮比預測,作為對比,同時給出數據擬合下的壓縮比預測值和真值。從表3 的對比結果可以看到,通過插值計算得到的壓縮比預測并未損失太多的準確度。

表3 數據擬合和插值計算對比

為了驗證預測模型的修正特性,測試采用兩種不同特性的原始數據作為樣本,以此模擬數據特性發生變化,進而觸發機器學習的情況。表4 給出的是啟動新一輪機器學習后,一次移動平均預測的平均壓縮比表。表5 所示則為更進一步的修正前后兩張二維表的壓縮預測值對比。由此可見,本研究提出的基于機器學習的在線建模方式和結合插值計算的關系模型構筑能夠很好地實現對壓縮比和壓縮執行時間的預測,為后續的壓縮決策提供準確的參考指標。

表4 一次移動平均預測的平均壓縮比表

表5 修正前后二維表的預測對比

鑒于水下無線傳感器節點與WSN 節點僅在通信信道參數方面存在差異,且由于本課題未能順利采購水下無線傳感器節點,能量優化的驗證實驗采用加州大學伯克利分校開發的MicaZ 試驗節點作為替代的硬件平臺,后期若能獲取水下無線傳感器節點的實際參數,則將本研究涉及的參量進行替換即可。本試驗節點的處理器平臺參考ATMEGA 128L。以50 個數據為單位(組)執行壓縮,共選取100 組。為了確保驗證的準確性,所用的原始數據不同于機器學習階段使用的統計樣本。實驗中的網絡拓撲采用等密度分布的柵格(grid)結構。網絡規模為25*25,共625 個節點,其中,匯聚節點位于全網中心,其余為同構的傳感器節點。源節點以最短路徑樹(Shortest Path Tree,簡稱SPT)的形式路由到匯聚節點。由于源節點的分布密度相等,因此假定節點采用統一級別的發射功率進行數據傳送,且各無線信道設定為相同的數據重傳率。隨著網絡節點的失效,網絡密度將會降低,射頻發射功率和數據重傳率則相應增大。

事實上,如果節點的每組數據都能采用能耗最低的策略完成數據傳送任務,則可認為是網絡節能的最理想情況。實驗即以該理想情況作為參照,將各種情況下節點總能耗的統計結果與之相比,給出各種實現方式相對于理想情況的最大偏差(用百分比表示),如表6 所示。表中 “E” 代表所設精度要求級別,“RF” 代表發射功率級別,“γ” 代表數據重傳率,即 “E2_RF7_γ0.1” 表示所設精度要求的級別為2,發射功率級別為7,數據重傳率為10%。從表6 中的統計結果可以看到,加入了壓縮決策的自適應壓縮方法,針對不同的精度要求、發射功率和數據重傳率,全網節點都能以接近能耗最優的情況完成數據傳送任務。當精度要求較高時(如 “E2”),壓縮算法未能達到理想的數據壓縮效果,反而增加了額外的計算損耗,由此,節點的總能量損失背離理想情況較多,此時,不執行壓縮或是執行復雜度較低的算法反而會使能耗逼近最優值。隨著精度要求的降低,壓縮算法逐級顯露出在節能上的優勢,尤其是壓縮效果好且執行復雜度低算法,將被越來越多的節點所采用,而此時,不執行壓縮卻逐漸增大了其與理想情況的偏離程度。

表6 各種實現方式與理想情況的最大能耗偏差

由于受到壓縮比及壓縮時間預測精度的限制,在實現節能優化機制過程中,不可避免地會有誤判產生,這也導致了某些情況下,單一執行壓縮策略的能耗更接近最優情況(如 “E10_R7_γ0.1”)。但從總體而言,自適應壓縮方法能夠為節點提供較為準確的節能策略,使其能以能耗接近最優的情況完成數據傳送,最高的偏離度不超過5%。

5 結論

作為UWSN 體系結構中應用層的實現功能,對原始數據的信息冗余進行網內信息處理,在保留應用所需信息量的前提下,將需要傳輸的數據量最小化,這樣,不僅能夠有效應對水下傳輸能力弱的問題,提高數據傳輸速率和帶寬利用率,避免網絡擁塞,更重要的是,通過壓縮來減少通信量,有利于降低水下節點的通信能耗,延長節點乃至整個網絡的使用壽命,提高有限能源的使用效率。本研究嘗試在節點的軟件框架中增加網絡級的節能優化機制,提出了一種符合海洋數據特性的自適應壓縮方法,保證了各個位置上的節點均能根據自身的實際情況以能耗接近最優的效果完成數據傳送任務。

猜你喜歡
壓縮算法壓縮比原始數據
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
受特定變化趨勢限制的傳感器數據處理方法研究
質量比改變壓縮比的辛烷值測定機
基于參數識別的軌道電路監測數據壓縮算法研究
全新Mentor DRS360 平臺借助集中式原始數據融合及直接實時傳感技術實現5 級自動駕駛
更正聲明
PMU數據預處理及壓縮算法
低溫廢氣再循環及低壓縮比對降低歐6柴油機氮氧化物排放的影響
高幾何壓縮比活塞的燃燒室形狀探討
采用兩級可變壓縮比系統提高車用汽油機的效率
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合