?

四川盆地威遠區塊頁巖氣單井產量預測方法及應用

2022-02-02 08:19車明光肖毓祥吳忠寶陳建陽汪莉彬
特種油氣藏 2022年6期
關鍵詞:單井氣井頁巖

韓 珊,車明光,2,蘇 旺,肖毓祥,吳忠寶,陳建陽,汪莉彬

(1.中國石油勘探開發研究院,北京 100083;2.中國科學技術大學,安徽 合肥 230027)

0 引 言

近年來,得益于理論的創新突破與技術的快速進步,中國頁巖氣勘探開發取得了跨越式發展。為了準確計算頁巖氣單井可采儲量,科學開展頁巖氣井產能規劃和投資決策,明確影響頁巖氣產量的主控因素及優選適用于頁巖氣產量預測方法顯得尤為重要。頁巖氣藏資源潛力巨大[1],產能評價較為復雜。常規的頁巖氣產量預測方法主要為數值模擬方法和公式推導法,2種方法可對單井可采儲量(EUR)及日產量進行預測。龐進等[2]通過流態劃分得到不同地層流動階段的預測產量,認為復合線性流之后預測效果最好。劉傳斌等[3]利用數值模擬方法對SEPD模型、Duong模型和YM-SEPD模型進行分析,認為組合模型預測日產量精度更高。李海濤等[4]提出基于裂縫流主導的產量遞減預測新方法預測EUR。然而,前人對于頁巖氣單井首年累計產量的預測研究較少。

近年來,機器學習方法已經應用于石油工業中的多個領域,并初步取得了良好效果。位云生等[5]、彭成勇等[6]利用機器學習方法開展了壓裂選井評層研究。孫東生等[7]、馬志國等[8]利用人工神經網絡法對水力壓裂效果進行了評價。嚴禛等[9]將機器學習方法應用于油田產量預測工作中。機器學習方法可以實現在有限數據量的條件下對復雜問題進行建模、優化及預測。

目前,四川盆地威遠區塊頁巖氣勘探開發正處于大規模發展階段,其優越的地質條件為頁巖氣賦存與富集提供了良好的條件。以四川盆地威遠區塊頁巖氣田為研究對象,基于132口投產1 a以上氣井的地質與工程數據及動態生產數據,采用灰色關聯法研究影響產量的主控因素,在此基礎上使用支持向量機與BP神經網絡方法預測該氣田單井首年累計產量及初期產量,并對上述方法進行對比及應用效果分析,進而優選出適用于頁巖氣產量預測的機器學習方法。對單井首年累計產量及初期產量進行預測,可為新開采井進一步預測單井EUR工作提供更準確的基礎數據,進而可有效地調整現場開發方案,對頁巖氣田的產能規劃和快速開發起到積極作用,對頁巖氣田的后續開發具有指導性意義。

1 原理與方法

1.1 支持向量機法

支持向量機(Support Vector Machine,SVM)是機器學習方法中的一種,最早由數學家Vapnik提出。支持向量機可以實現分類和回歸2種功能,此次研究使用支持向量機回歸法(SVR)對頁巖氣井首年累計產量進行預測。支持向量機在樣本數量較少的情況下能夠保證一定的預測精度,在壓裂效果預測及增油量預測中可發揮一定的優勢[10]。對于線性問題,首先使用線性回歸函數,將給定樣本數據進行擬合。

f(x)=wx+b

(1)

式中:w為斜率;b為截距;x為樣本數據;f(x)為樣本數據的擬合函數。

式(2)為支持向量機回歸的目標函數,其可以提高模型的泛化能力,避免出現過度擬合的問題。式(3)用于減少模型誤差[11]。

(2)

(3)

引入拉格朗日乘子以及對偶變量對模型進行優化,將式(2)、(3)轉化為式(4)、(5)。

(4)

(5)

由于該研究的氣井產量預測問題為非線性問題,需通過核函數將樣本數據映射到高維空間中進行線性回歸。為此,引入RBF(Radial Basis Function)核函數,通過調整RBF核函數參數以適用于所用樣本集[12]。

k(x,xp)=exp(-g‖x-xp‖2)

(6)

式中:k(x,xp)為核函數;g為超參數。

1.2 BP神經網絡

BP(Back Propagation)神經網絡為機器學習方法中應用較為廣泛的方法,其可以處理大量的非線性數據,通過模擬大腦神經網絡處理信息的方式,將輸入的樣本數據進行數據處理、訓練學習。在頁巖氣田單井首年累計產量預測工作中,BP神經網絡法可僅通過輸入靜態數據,得到誤差較小、精度較高的預測結果,適用于壓裂后產氣量預測工作[13]。BP神經網絡主要為3層前饋網絡,包括輸入層、隱含層及輸出層。該方法的核心是“誤差反向傳播”學習算法,即當正向傳播中樣本輸出結果與預期不同時,轉為反向傳播進行學習。神經網絡的學習過程為2個傳播過程周期循環[14]。神經元輸出值的計算公式為。

(7)

式中:h為連接神經元的權重值;a為基礎值。

(8)

建立BP神經網絡模型,并利用式(9)計算誤差E。當誤差足夠小或達到迭代步數時,停止該算法計算[15]。

(9)

(10)

式中:E為誤差;Ep為中間誤差;L為迭代步數;di為期望輸出值;zi為實際輸出值。

2 數據預處理與模型建立

四川盆地威遠區塊頁巖氣田地質條件優越,資源豐富,儲層連續性好且相對穩定,開發潛力大。以威遠區塊132口投產1 a以上氣井的地質、工程及生產數據作為樣本數據,建立單井產氣量預測模型;采用該區塊投產首年氣井累計產量及初期產量為目標屬性分別開展模型預測工作。

前期研究表明,影響頁巖氣產量的因素眾多,包括地質、工程等多方面因素。通過系統梳理,統計了該氣田132口氣井的基礎數據,包括水平井垂深的中值(m)、孔隙度(%)、總有機碳含量(%)、壓力系數、水平段長度(m)、壓裂段長度(m)、壓裂改造段數、平均簇間距(m)、壓裂液量(m3)、支撐劑量(m3)、石英砂用量(t)、平均砂比(%)、施工排量(m3/min)、平均段長(m)、加砂強度(t/m)、用液強度(m3/段),共計16項參數。其中,壓裂液均為滑溜水,支撐劑均為70/140目石英砂和40/70目陶粒。上述影響因素之間存在著一定的相關性,單個因素的改變會對其他因素產生不同程度的正相關或負相關影響。因此,通過單因素擬合分析來預測產氣量的方法并不準確可靠,局限性較大。在預測產量時,需要綜合考慮多因素的復雜情況,而機器學習方法能夠更好地將問題簡單化,從而快速準確地預測目標屬性。

2.1 主控因素分析

為了明確影響頁巖氣單井產量的主控因素,采用灰色關聯法[16]對上述16個因素按影響氣井產量的強弱程度排序?;疑P聯評價方法的主要步驟如下。

(11)

(2) 對序列進行無量綱化處理。使用初始值方法,將整個序列值除以序列中的第一個值,得到新的序列。

新形成的序列為:

(12)

式中:Xi=[X1(1),X2(2),X3(3),…,Xi(n)],i=0、1、2…m。

運用式(12)對初始值進行無量綱化:

(13)

式中:k*=1,2,…,n。

(3) 對序列進行求差。將矩陣(12)中的第一列與其他各列求取對應的絕對差列,形成絕對差值矩陣:

矩陣中的最大值(MAX)和最小值(MIN)即為最大差和最小差。

Δ0i(k*)=|x0(k*)-xi(k*)|

(14)

(15)

(4) 計算關聯系數。將矩陣(14)中的數據用式(16)進行變換,得到如下矩陣。

(16)

式中:ξ0i(k*)為關聯系數。

分辨系數ρ在(0,1)內取值,ρ值越小,表明各系數之間的差異越大。關聯系數ξ0i(k*)是不超過1的正數,Δ0i(k*)值越小,ξ0i(k*)值越大。當Δ0i(k*)=0時,ξ0i(k*)=1,這說明第i個比較序列Xi與參考序列X0在第k*期值相同。

(5) 關聯度計算。由于得出的每個關聯系數所反映的信息比較分散,將n個關聯系數取平均值即可得到關聯度,可以反映各因素對于因變量的影響程度。

(17)

式中:r0i為關聯度。

(6) 關聯度排序。對各比較序列與參考序列的關聯度進行從大到小的排序,當關聯度越大時,說明比較序列和參考序列的變化趨勢越趨于一致。通過關聯度可以判斷比較序列和參考序列的曲線相似度。當2個序列曲線趨勢越接近時,表示兩者關聯度越大;反之,則關聯度越小。

通過上述方法,得到關聯程度排序前8位的影響氣井產量的主控因素(表1),即支撐劑量、壓裂改造段數、水平井垂深的中值、壓裂段長度、壓裂液量、孔隙度、壓力系數、加砂強度。

表1 影響氣井產量的各因素關聯度及權重大小Table 1 The correlation degree and weight of factors affecting gas well production

2.2 構建樣本集

基于灰色關聯法分析所得出的影響產量的主控因素,設定Xi為目標區塊氣井的特征向量。目標屬性為預測氣井生產首年的累計產量。選取目標區塊132口井基礎數據作為樣本數據集。抽取一定的樣本數據作為訓練集,剩余樣本數據作為測試集。

2.3 評價指標

為了評價模型的穩定性及預測精度,采用線性回歸決定系數(R2)和均方誤差(mse)這2個評價指標。線性回歸決定系數表示擬合優度,能夠反映訓練集擬合結果的好壞。

R2=SSR/SST=1-SSE/SST

(18)

SST=SSR+SSE

(19)

式中:SST為總平方和;SSR為回歸平方和;SSE為殘差平方和。

mse表示參數預測值與真實值之差平方的期望值,其值越小,越表明模型具有更好的精確度。

(20)

2.4 模型建立

使用MATLAB軟件實現算法。首先導入樣本數據集,將訓練集數量初始值設定為100,測試集數量為32,通過學習訓練在樣本數據集中隨機產生訓練集和測試集。創建支持向量機(SVM)預測模型,將SVM類型設置為e-SVR,其中,損失函數p值設為0.1,核函數類型設置為RBF核函數。

創建BP神經網絡模型,將學習速率設定為0.1,訓練的最大次數定為1 000,顯示中間結果周期設定為10,全局最小誤差定為0.000 1。

分別對上述2個模型的訓練集進行學習訓練,模型訓練結束后對測試集進行驗證,返回均方誤差和線性回歸決定系數2個評價參數值。不同的訓練集數量會對模型預測精度產生一定的影響,因此,需要對訓練集數量不斷調整,將訓練集數量從100逐一遞增至122進行模型訓練,將返回的mse與R2值進行統計分析比較,具體結果如圖1所示。

由圖1可知:支持向量機模型的大部分R2數據點在BP神經網絡模型之上,表明支持向量機訓練擬合程度要更高、更穩定。在訓練樣本數量為117時,支持向量機模型的線性回歸決定系數達到最高點,R2最大值為0.951;在訓練樣本數量為113時,BP神經網絡模型的線性回歸決定系數達到最高點,R2最大值為0.912。

圖1 不同訓練樣本數量下的SVM與BP神經網絡 預測模型的評價參數值Fig.1 The evaluation parameters of SVM and BP neural network prediction models with different number of training samples

從預測誤差來看,支持向量機模型的mse值基本處于較低的范圍內,對比而言,BP神經網絡的mse值波動幅度較大且數值較高。在訓練樣本數量為121時,支持向量機模型的mse值最低,mse最小值為0.003;在訓練樣本數量為118時,BP神經網絡模型的mse值最低,mse最小值為0.007。

對比圖1中2個評價參數曲線可知,支持向量機模型的R2值基本在BP神經網絡模型之上,而mse值相反,因此,支持向量機模型的穩定性和精確度都要優于BP神經網絡模型。綜合考慮mse和R22個評價指標,選用mse值較小且R2值較大的模型為最優模型。對于支持向量機模型來說,優選出訓練樣本數量為118,測試樣本數量為14,此時模型訓練集擬合結果中R2為0.925,mse值為0.004;對于BP神經網絡模型,優選出訓練樣本數量為121,測試樣本數量為11,此時模型訓練集擬合結果中R2為0.892,mse值為0.009。

3 結果與討論

3.1 預測首年累計產量

利用上述優選的支持向量機模型,預測目標區塊氣井首年累計產量,通過對比實際產量值,支持向量機預測模型的測試集擬合結果的R2為0.927,mse為0.005。根據SVM產量預測模型結果可知:在訓練集中,預測結果與實際數據點基本重合,訓練效果擬合較好(圖2);在測試集中,模型在預測產量上表現出較高的擬合精度,與實際產量趨勢線基本一致,數值也較為接近(圖3)。

圖2 SVM預測模型的訓練集擬合結果Fig.2 The fitting results of training set of SVM prediction model

圖3 SVM預測模型的測試集中預測值與實際值對比 (mse=0.005,R2=0.927)Fig.3 The comparison between predicted and actual values in the test set of SVM prediction model (mse=0.005, R2=0.927)

利用上述優選的BP神經網絡預測模型,預測目標區塊氣井首年累計產量,通過對比實際產量值表明,BP神經網絡預測模型的測試集擬合結果的R2為0.892,mse為0.009。根據BP神經網絡產量預測模型返回的數據可以看出,在訓練集中,實際產量與預測產量較為吻合,但存在一定的誤差(圖4);在測試集中,模型在預測產量時與真實值趨勢基本一致,數值較為接近(圖5)。

圖4 BP預測模型的訓練集擬合結果Fig.4 The fitting results of training set of BP prediction model

圖5 BP神經網絡預測模型的測試集中預測值與實際值 對比(mse=0.009,R2=0.892)Fig.5 The comparison between predicted and actual values in test set of BP neural network prediction model (mse=0.009, R2=0.892)

根據研究區的單井實際資料,由經驗法擬合的氣井首年平均日產量與測試產量的相關系數為0.746,產量預測模型公式如式(23)所示,擬合曲線如圖6所示。

圖6 研究區氣井首年平均日產量與測試產量關系Fig.6 The relationship between average daily production and test production of gas wells in study area in the first year

Y=0.4499Xa

(21)

式中:Y為首年平均日產量,104m3/d;Xa為測試日產量,104m3/d。

由式(23)可預測研究區單井首年累計產量,將其與實際首年累計產量數據進行可視化對比處理(圖7)。圖7可知,由經驗公式所預測的首年累計產量與實際產量之間存在一定偏差,R2為0.805,mse為0.025。

圖7 經驗擬合法實際值與預測結果對比 (mse=0.025,R2=0.805)Fig.7 The comparison between the actual value of empirical fitting method and the predicted result (mse=0.025, R2=0.805)

通過上述3個模型的預測結果對比分析表明(表2),SVM模型的預測結果與實際累計產量的趨勢基本一致,均方誤差結果最小,線性回歸決定系數最大,比BP神經網絡模型和傳統經驗公式法預測得更為準確。采用經驗公式求得的首年累計產量預測值的均方誤差較大,線性回歸決定系數較小,較上述2個機器學習模型來說預測精度較低??傮w來看,SVM模型對于研究區首年氣井累計產量的預測效果較好,精度較高。

表2 SVM、BP神經網絡及經驗公式預測結果指標對比Table 2 The comparison of prediction result indicators of SVM, BP neural network and empirical formula

3.2 預測初期產量

利用支持向量機模型預測研究區氣井初期產量(前期產量穩定后30 d平均日產量),通過對比實際產量值,支持向量機預測模型的測試集擬合結果的R2為0.883,mse為0.010。根據SVM產量預測模型結果可知,在訓練集中,預測結果與實際數據點基本重合,訓練效果擬合較好(圖8);在測試集中,模型在預測產量上表現出較高的擬合精度,與實際初期產量趨勢線基本一致,數值也較為接近(圖9)。

圖8 SVM預測模型的訓練集擬合結果Fig.8 The fitting results of training set of SVM prediction model

圖9 SVM預測模型的測試集中預測值與實際值對比 (mse=0.012,R2=0.863)Fig.9 The comparison between predicted and actual values in the test set of SVM prediction model (mse=0.012, R2=0.863)

利用BP神經網絡預測模型預測研究區氣井初期產量,通過對比實際產量值得到,BP神經網絡預測模型的測試集擬合結果的R2為0.863,mse為0.012。根據BP神經網絡產量預測模型上返回的數據可以看出,在訓練集中,實際產量與預測產量較為吻合,但有一定的誤差存在(圖10);在測試集中,模型在預測產量時與真實值趨勢基本一致,數值較為接近(圖11)。

圖10 BP預測模型的訓練集擬合結果Fig.10 The fitting results of training set of BP prediction model

圖11 BP神經網絡預測模型的測試集中預測值與實際值 對比(mse=0.140,R2=0.900)Fig.11 The comparison between predicted and actual values in test set of BP neural network prediction model (mse=0.140, R2=0.900)

通過上述2個模型的預測結果對比分析結果可以看出(表3),SVM模型的預測結果與實際初期產量的趨勢基本一致,均方誤差結果最小,線性回歸決定系數最大,其預測結果較BP神經網絡模型和傳統經驗公式法預測得更為準確??傮w來看,SVM模型對于研究區初期產量的預測效果較好,精度較高。

表3 SVM、BP神經網絡及經驗公式預測結果指標對比Table 3 The comparison of prediction result indicators of SVM, BP neural network and empirical formula

3.3 預測單井采出程度

利用支持向量機模型預測目標區塊氣井采出程度,通過對比遞減法計算的采出程度,支持向量機預測模型預測的平均誤差為4.14%(表4)。根據SVM采出程度預測結果,與遞減法計算的采出程度基本一致。

表4 遞減法計算及SVM預測采出程度結果指標對比Table 4 Comparison of results and indicators of the recursive calculation and SVM prediction of recovery percent

4 結 論

(1) 采用灰色關聯法,考慮了地質因素、工程因素及生產數據,影響產量的主控因素為水平井垂深的中值、孔隙度、壓力系數、壓裂段長度、壓裂改造段數等因素。應用SVM和BP神經網絡法建立了產量預測模型,SVM模型更適用于研究區。

(2) SVM實現了基于數據分析方法的頁巖氣井首年累計產量及初期產量的準確預測。與BP神經網絡、傳統經驗公式預測方法相比,SVM顯示出了良好的預測能力和較小的誤差,能夠快速分析并準確預測氣井的首年累計產量。與傳統數值模擬軟件相比,SVM模型不需要建立物理模型,基于有限的靜態數據,就能夠快速得到精度較高的產量預測結果。SVM模型可以進一步對壓裂參數進行優化設計,為后期評價氣井遞減規律、計算氣井單井可采儲量提供可靠的數據,對其他頁巖氣區塊的開發和產能評價也有著重要的借鑒指導意義。

猜你喜歡
單井氣井頁巖
一種應用于高含硫氣井的智能取垢器系統設計
氣井用水合物自生熱解堵劑解堵效果數值模擬
基于STM32F207的便攜式氣井出砂監測儀設計
氣井出砂動態監測技術研究
一種頁巖封堵性評價測試方法
采油“一井一策”全員效益目標的構建與實施
單井成本核算分析
頁巖氣開發降溫
加息,壓垮美國頁巖氣的稻草?
本月起實施頁巖氣儲量行業標準
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合