?

一種基于改進差分的測井數據可逆變長碼壓縮方法

2018-07-28 07:19林永強唐露新劉海熊陵
電腦知識與技術 2018年11期
關鍵詞:基準值

林永強 唐露新 劉?!⌒芰?/p>

摘要:隨鉆測井系統需要提高速率和可靠性,常用的差分脈碼調制可去除數據時域冗余,但受干擾時會引發錯誤擴散。本文根據測井數據及信道傳輸特性,提出一種改進差分測井數據壓縮編碼方法,先將測井數據進行基準值的動態分段求差預處理,采用不等重保護策略,對處理的差值數據進行量化和可逆變長碼信源編碼、對基準值進行糾錯信道編碼,并采用非等重保護的幀結構和脈沖間隔調制進行傳輸。通過仿真實驗表明,數據壓縮可以達到48%,數據傳輸的可靠性明顯提升。

關鍵詞:改進差分;基準值;可逆變長碼

中圖分類號:TP3 文獻標志碼:A 文章編號:1009-3044(2018)11-0254-04

A Kind of Inverse Variable Length Code Compression Method for Logging Data Based on Improved Difference

LIU Yong-qiang1, TANG Lu-xin1, LIU Hai2, XIONG Ling2

(1.Guangdong University of Technology, School of Electromechanical Engineering, Guangzhou 510006, China; 2.Zhongtian Qiming Petroleum Technology Co, Guangzhou 510535, China)

Abstract: While logging-while-drilling systems require increased speed and reliability, commonly used differential pulse code modulation removes data time-domain redundancy but causes false proliferation when disturbed. In this paper, based on the logging data and channel transmission characteristics, an improved differential logging data compression coding method is proposed. First, the logging data is pre-processed by dynamic subsection difference of reference value. The unequal weight protection strategy is adopted to deal with the difference The value data is quantized and reversibly variable length code source code, the error correction channel code is used for the reference value, and the frame structure and the pulse interval modulation which are not equal weight are used for protection. Simulation results show that the data compression can reach 48%, and the reliability of data transmission is obviously improved.

Keywords: improved difference; reference value; reversible variable length code

1 引言

目前最常用鉆井是隨鉆系統,隨鉆測井系統需將數千米的井下數據傳輸到井上,常用數據傳輸主要有鉆井液脈沖傳輸與電磁波數據傳輸,前者利用鉆井液壓力正/負脈沖傳輸信號比較穩定可靠,國內研發的鉆井液正脈沖發生器傳輸速率在0.5~3.0bit/s,國際主流的鉆井液正脈沖發生器傳輸速率一般在10bit/s[1]。目前油氣勘探開發向復雜地層發展,需要快速傳輸更多、更精確的測井數據,但目前鉆井液脈沖傳輸難以滿足數據傳輸實時性和抗干擾的更高要求,因此提高測井數據傳輸性能成為隨鉆測量技術的一個重點。

為提高隨鉆測量信息傳輸能力,發達國家已經將數據壓縮技術、信息傳輸技術引入地質導向鉆井領域,取得較好效果,為了保密較少發表論文。斯倫貝謝公司利用圖像壓縮技術將井下井眼成像圖像壓縮50倍后傳輸至地面,很好地解決了信息傳輸能力不足的難題,保證了數據實時性[2]。國內鉆井液脈沖傳輸的數據編碼研究開展較晚,2010年,張煜提出了基于差分脈碼調制的數據壓縮編碼算法,可將實時傳輸數據量壓縮為原始數據量的一半以下,將數據傳輸效率提高一倍以上,但信道噪聲導致數據錯誤時,會引起誤差擴散導致數據錯誤傳播[3]。2016年,李婷提出一種LZW壓縮編碼和RS糾錯碼聯合編碼的算法LZW-RS,實現壓縮比為2:1~3:1的無損數據壓縮,在信噪比為5.5dB時,LZW解碼能達到良好的重構性能,使數據傳輸效率最高提升2/3倍,誤碼率降低為LZW編碼的1/4倍~1/8倍,但編譯碼表是動態生成的,數據傳輸錯誤會導致譯碼錯誤[4]。同年,江佩佩提出一種聯合卷織編碼與脈沖間隔調制(PIM)的網格編碼脈沖間隔調制(TC-PIM)方法,在相同信息速率條件下,在誤碼率為10-5的時候,3比特TC-PIM與2比特PIM相比有大約2.5dB的增益,相同速率下,在信噪比為-2dB時,3比特TC-PIM誤碼率降低為2比特PIM的1/102倍左右,但卷積編碼和Viterbi算法會造成傳輸延遲[5]。

針對上述差分易引起錯誤傳播、動態編譯碼表不一致和糾錯碼帶來傳輸延遲問題,本文提出一種改進差分的可逆變長碼壓縮編碼方法。對測井數據進行基于基準值的求差預處理,采用不等重保護策略,對處理后的差值數據進行可逆變長碼信源編碼,對基準值進行糾錯信道編碼,然后封幀傳輸。解碼端對數據進行解碼,對于錯誤的數據利用預測方式進行恢復,實現測井數據的實時可靠傳輸。

2 隨鉆測井數據編碼及傳輸方式分析

隨鉆測井無需中斷正常鉆進操作而將在鉆頭附近測量的多種信息傳輸到地面,其數據測量和環境具有相應特性,數據編碼及傳輸方式應根據數據特點和傳輸因素進行設計。

2.1測井數據及傳輸特性分析

井下地質測量參數有電阻率和方位伽馬,鉆井軌跡參數有井斜、方位、工具面,以8比特或12比特的數據形式進行編碼。井下發射器將傳感器測量的地質、軌跡等參數以0.5~3.0bit/s的傳輸速度通過泥漿信道傳輸到地面。井下傳感器測量的每種數據都有其獨立性,但根據文獻[6]對測井數據的分析,井下大部分參數變化趨勢相對保持平穩,

泥漿脈沖信號在傳輸過程主要受到信號衰減和噪聲干擾的影響。泥漿信號的衰減與泥漿信號的工作頻率、井深深度以及泥漿的密度等因素有關。泥漿脈沖信號符合指數衰減規律,泥漿壓力脈沖波幅的衰減模型為:

[P=P0*exp(-xL)] (1)

[L=Vd2ρπfu] (2)

式(1)中:P0為信源信號的脈沖幅度,單位為Pa;x為信號傳輸距離,單位為m;L為信號源衰減到1/e時的傳輸距離,單位為m;式(2)中:P為傳輸x距離后的信號強度,單位是Pa;V為信號的傳輸速度,單位為m/s;d為管路內徑,單位為m;ρ為鉆井液密度,單位是kg/m3;u為鉆井液粘度,Pa*s;f為脈沖信號的頻率,單位是Hz。由上式分析可知信號頻率與鉆井液粘度對信號衰減有顯著的影響,尤其是信號頻率,頻率越高信號衰減越大,隨鉆測量系統需要提供更多的能量來補償信號衰減。

誤碼主要由噪聲產生,通常分以下幾類:1)泵沖噪聲。其為多頻噪聲,其基波頻率與有用信號的基頻很接近,具有周期性。2)扭矩噪聲。由堅硬的巖層、鉆頭、穩定器等產生,可以通過改變鉆進參數使其噪聲頻率遠離有用信號頻率而消除。3)其他噪聲,其他噪聲可以近似為白噪聲。

2.2數據采集編碼和傳輸方式

為提高速率和可靠性,可以分別從數據采集編碼和傳輸過程采取措施。

數據采集編碼采用基于基準值的動態分段差分處理方式,經進一步量化處理后進行可逆變長碼壓縮編碼。因參數變化相對平穩考慮采用鄰值差分方式去除數據時域冗余,但泥漿信道噪聲復雜易造成錯誤傳播,因而需對差分方式進行改進,采用基于基準值的動態分段差分處理。壓縮編碼中LZW編碼和動態統計編碼的編解碼表是動態生成的,數據傳輸錯誤會導致譯碼錯誤,因而考慮使用固定的編解碼表,算術編碼實現復雜,變長碼有唯一可譯的特性因而可以做錯誤自檢,不用對每一個數據加額外一個比特進行奇偶校驗,傳統的變長碼抗誤碼性能較差,因而考慮采用可逆變長碼方式進行壓縮編碼。

傳輸采用非等重保護的幀結構和脈沖間隔調制??紤]到基準值和差值的重要性不均等,因而采用不等重保護策略對幀結構進行設計,設計關鍵幀和非關鍵幀兩種幀結構,其中,關鍵幀用前向糾錯碼方式保護基準值,而非關鍵幀利用可逆變長碼自身的抗誤碼能力對差值進行保護。目前泥漿波隨鉆傳輸系統中井下采用的是Drilog脈沖發生器,該發生器采用的編碼方式主要有曼切斯特編碼和脈沖間隔編碼[7]??紤]到曼切斯特編碼傳輸速率只能達到0.5~0.8bit/s,傳輸速率過低,因而采用脈沖間隔編碼進行調制。

3基于改進差分的可逆變長碼壓縮方法

改進差分采用基于基準值的動態分段差分方式對測井數據預處理,經進一步對差值量化處理后進行可逆變長碼壓縮。

3.1測井數據預處理

為了減少數據變化范圍,在編碼前對測井數據進行預處理,主要包括基于基準值的差分預處理和差值量化兩部分。

3.1.1基于基準值的差分預處理

鄰值差分在數據傳輸錯誤時會引起錯誤傳播,除此之外,如果對差值量化,還會存在量化誤差,其積累可能導致解碼值偏離原始數據過大。因而對鄰值差分進行改進,提出一種基于基準值的動態分段差分處理方法,預設基準值和閾值,以后續數據和基準值的差值替代原始數據進行傳輸,當差值超過設定的閾值時對基準值進行更新處理。這里的基準值根據不同參數變化特點選取。

對于升/降、平穩趨勢的數據,如圖1(a),存10個相鄰的歷史數據,以最鄰近3個數據為起始數據,采用滑動窗口法按時間點從近到遠依次查找最值點,當查找到最值點時停止查找,以時間鄰近值點和最值點計算斜率,當大于45度時判為升/降趨勢,以時間鄰近值加/減半區間為基準值,否則判為平穩趨勢,對窗內數據取平均作為基準值,當下一數據點不在基準值區間時視為趨勢誤判,以另外兩種方式取基準值,當都不在區間時,視為斷層做進一步處理。對于斷層,如圖1(b)所示,初判此點為異常點,以時間相鄰值替代輸出。當下一個數據在基準值區間時,此點判定為異常點,否則視為斷層點。下一個數據與此點絕對差值少于半區間時,以下一數據與此數據求取均值作為基準值。當不在半區間,但與此點值絕對差值大于半區間時,以下一個數據作為基準值。

對于基本呈上升趨勢如圖1(c)的數據,根據鄰值加/減半區間范圍為基準值對此時數據是否在基準值區間范圍進行判斷以確定基準值,如果都不在區間范圍,以斷層方式進行處理。

3.1.2 差值量化

不同參數精度要求不一,因而可以通過量化方式變更差分范圍。設定量化因子k,對于不同的輸入x有不同的輸出y,如式(3)所示。

y=kx (3)

3.2可逆變長碼

可逆變長碼(RVLC)是指在滿足前后綴條件下可正反向解碼的變長碼,根據碼字是否滿足對稱條件,其可分為對稱和非對稱形式,對稱可逆變長碼在進行雙向解碼時只需要單一碼表,而非對稱可逆變長碼雙向解碼時需要兩套碼表,需要占用多一倍的存儲容量[8]。在目前的測井數據傳輸中,最大的瓶頸是傳輸帶寬而并非編解碼器設備的存儲容量,相對于對稱可逆變長碼,非對稱可逆變長碼的構造更為靈活,效率也更高,因此采用非對稱可逆變長碼對數據進行編碼。

在RVLC碼樹的自頂向下的構造過程中,核心問題有兩個:第一個是各層應選取多少個葉子節點,第二個是葉子節點位置又該如何選取[9]。

考慮到要實現8比特和12比特數據的碼表統一以及壓縮性能,只根據非對稱可逆變長碼的前后綴條件對-12~+12差值進行編碼,如表1所示。對于8位數據只用到-7~+7范圍的差值,而對于12位數據用到-12~+12范圍的差值。

4幀結構與信道調制

4.1幀結構設計

根據不等重保護策略設置非關鍵幀和關鍵幀兩種不同的幀結構類型。非關鍵幀的結構如圖2所示,同步字節(FSB)包含1bit關鍵幀標志(KF)、1bit帶關鍵幀標志(CKF)、4bit序列號(SN)和2bit幀未填零個數(FTZN)四部分,其中關鍵幀標志位為0時表示非關鍵幀,為1時表示關鍵幀,帶關鍵幀標志為0時表示下一幀不是關鍵幀,否則下一幀為關鍵幀,序列號表示不同的參數組合,最大組合類型為16種,幀未填零個數是由于變長碼碼字長度的不確定,由于幀長是4的倍數,因而需要在尾部填零,從而有利于可逆變長碼的反向解碼,接下來的可變長傳輸數據(VLTD)是不同參數的差值的變長碼字的組合,DC1~DCn各表示4bit數據 ,FB表示的是填零比特數,范圍從1~4。關鍵幀的結構如圖3所示,同步字節包含1bit的關鍵幀標志(KF)、3bit的基準值個數(NDV)、2bit的CRC校驗位(CRC)、2bit的幀未填零個數(FTZN)四部分,3bit的基準值個數代表幀內數據的基準值個數,2bit的CRC校驗位用于檢驗幀內數據正確性,接下來的數據是多個基準值在參數組合中的位置和對應的值的組合(PBC),糾錯碼(FEC)和填零比特數(FB),其中糾錯碼用于保護基準值的數值和位置。

4.2 脈沖間隔調制

脈沖間隔調制(PIM)是一種利用兩個脈沖之間的時間間隔攜帶信息的調制方式,其符號如圖4所示。

在圖4中,TPW( pulse width)表示脈沖寬度;TMP(min pulse time)表示最小脈沖間隔時間,用于減少碼間干擾,對應的數值M為0,TBW(bit width)表示位寬度,是數據編碼的時間間隔最小分辨值。PI碼編碼中脈沖間隔的計算公式如下:

Interval=TMP+M×TBW (4)

式4表明,當傳輸一個數值為M的數據時,經過PI編碼后,數據對應的脈沖間隔的時長Interval的值為TMP與M個TBW時長的和。脈沖間隔通常分為兩類,一類是普通的數據位,用4比特表示,數據的取值范圍為0~15,可看作一個十六進制數,另一類是同步字節,用8比特表示,取值范圍為16~255。

假設M在0,1,...,2N-1中等概率分布,N比特PIM的傳輸碼率為

Tr(N,TMP,TBW)=[NTMP+2N-12TBW] (5)

非等重的幀結構實現了差值和基準值的不等重保護,以脈沖間隔調制方式對數據進行傳輸,與曼切斯碼相比提升了數據的傳輸速率。

5仿真與分析

5.1壓縮比仿真與分析

在Matlab仿真平臺上,通過基于改進差分的可逆變長碼壓縮算法分別對三口井的井斜角、方位角、電阻率和方位伽馬各2000個左右數據進行壓縮,從而對壓縮比和壓縮時間進行性能分析。

通過表2可以看出,8bit的電阻率和伽馬數據壓縮比在60%左右,12bit井斜角和方位角的壓縮比在50%左右,表明壓縮性能隨著數據比特位數的增大而有所提升。文獻[3]中提出的差分脈碼調制壓縮編碼,8比特數據以3比特、4比特、5比特編碼時壓縮率分別是37.5%、50%、62.5%,12比特數據以5比特、6比特、7比特編碼時壓縮率分別是41.7%,50%,58.3%。與文獻[3]提出的方法對比,本壓縮算法在8比特數據時,和5比特編碼壓縮性能相當,12比特數據時,和6比特編碼壓縮性能相當。在壓縮時間方面,數據壓縮時間和壓縮比是成反比關系的,這是由于壓縮比越高,其基準值個數越少,從而減少了基準值變更所消耗的時間,由于井斜角是基本呈上升趨勢的,其基準值選取耗時較低,遠小于方位角、電阻率和伽馬值參數數據壓縮時間。

5.2誤碼率仿真與分析

為驗證非對稱可逆變長碼的抗誤碼性能,將非對稱可逆變長碼和常規變長碼編碼方案進行對比。發送端把可逆變長碼的4比特碼字轉換成十進制,組合一個數字序列,每次隨機從序列中抽取一個數據轉換成4比特數,每抽取32次為一幀,共抽取500幀數據,信道模型采用高斯白噪聲(AWGN)疊加周期為5Hz的泵沖噪聲信道,接收濾波器采用FIR濾波器。驗證在不同信噪比下的噪聲對常規變長碼和可逆變長碼編碼方式下的誤符號率,最終的抗誤碼性能用誤符號率(Pe)來衡量。

從圖5可以看出,非稱可逆變長碼的誤符號性能明顯優于常規的變長碼的。在疊加噪聲信道下,相同誤符號率下,非對稱可逆變長碼的信噪比變長碼低1~2dB,也就是說在相同誤符號率要求的條件下,非對稱可逆變長碼編碼可以增加傳輸距離,或者在相同的傳輸距離條件下,其可以降低誤符號率。

6結論

測井數據采集編碼采用基于基準值的動態分段差分的可逆變長碼壓縮方法,克服了鄰值差分的錯誤傳播和動態編譯碼的譯碼錯誤,經仿真實驗得出壓縮率最大可達48%,提升了數據的傳輸速率。傳輸采用不等重保護策略對基準值進行糾錯編碼,對差分值利用可逆變長碼的自身抗誤碼能力編碼,減少了數據的傳輸延遲,利用脈沖間隔調制提升了數據的傳輸速率。雖然變長碼有錯誤自檢的功能,但也存在抗誤碼性能差的特性,經過對變長碼和可逆變長碼抗誤碼性能分析可知,在同誤符號率下,非對稱可逆變長碼降低1~2dB的信噪比。因此,本算法在提高數據傳輸速率的同時也提高了數據傳輸的可靠性。

參考文獻:

[1] 張煜.基于新型編碼技術的隨鉆測井實時數據傳輸方法研究[D].北京交通大學,2013.

[2] 秦緒英,肖立志,索佰峰.隨鉆測井技術最新進展及其應用[J].勘探地球物理進展,2003,26(4):313-322.

[3] 張煜,裘正定,熊軻,等.基于差分脈碼調制的隨鉆測量數據壓縮編碼算法[J].石油勘探與開發,2010,37(6):748-754.

[4] 李婷,史曉鋒.泥漿信道數據壓縮和糾錯聯合編碼研究[J].電子測量技術,2016,39(4);133-135.

[5]陳偉,江佩佩,顧慶水,等.用于MWD遙傳系統的聯合編碼調制方法[J].測控技術,2016,35(9):33-35.

[6]李忠偉,王瑞和,房軍.無線隨鉆測量系統的數據報協議[J].石油學報,2011,32(5);887-892.

[7]江佩佩.泥漿波隨鉆傳輸系統中信號處理方法的研究[D].電子科技大學,2016.

[8]S Kumar,L Xu.RVLC decoding scheme for improved data recovery in MPEG-4 video coding standard[J]Real-Time Imaging , 2004 ,10(5) :315-323.

[9]范晨,崔慧娟,唐昆.一種高效可逆變長碼的構造算法[J].清華大學學報(自然科學版),2002,42(7):860-862.

猜你喜歡
基準值
輪胎實車磨耗試驗數據分析方法的研究
更正通知
地表水環境質量標準綜述(三)
——標準銜接中常見問題及分析
上海海岸帶沉積物地球化學基準值特征
發電機組勵磁回路電阻基準值選取研究
廣東韶關地區土壤地球化學基準值研究
基于加權模糊C-均值聚類的鍋爐運行參數基準值建模
馬拉硫磷水生生物基準推導研究
復合材料基準值計算程序及其與可靠性關系
復合材料B基準值計算程序
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合