?

大數據驅動的極端氣象災害態勢要素提取模型與優化

2022-12-09 04:54楊繼君曾子軒
關鍵詞:災體局中人態勢

楊繼君, 曾子軒, 鄭 琛

(1.廣東財經大學公共管理學院,廣東廣州 510320;2.廣西財經學院跨境電商智能信息處理重點實驗室,廣西南寧 530003;3.中共北京市委黨校公共管理教研部,北京 100044)

0 引言

隨著全球氣候變暖,近些年來我國極端氣象災害事件呈現高發態勢,其影響范圍越來越廣,造成的生命財產損失也異常嚴重[1],比如2012年北京“7.21”特大暴雨、2014年“威馬遜”超強臺風、2015年“東方之星”沉船事件(龍卷風)、2016年“霸王級”寒潮、2018年“山竹”超強臺風、2019年“利奇馬”超強臺風等等都給政府部門的應急管理能力帶來了巨大的考驗。極端氣象災害的高效防范和快速應對需要建立在極端氣象災害態勢要素提取、態勢威脅評估和態勢預測的基礎之上。隨著大數據災害治理2.0時代的到來[2],如何在海量的極端氣象災害態勢要素中快速地提取關鍵態勢要素則成為關鍵。目前,關于態勢要素提取的研究多集中在軍事戰場[3-7]、網絡安全[8-13]等領域,而在自然災害特別是極端氣象災害領域鮮有涉及,但也有學者做了開創性研究,比如,Moumita等[14]針對Twitter和Facebook等在線社交媒體上充斥著大量災害信息的狀況,提出了基于互動眾包的災害態勢信息提取框架模型,以便對災害損失和需求評估提供決策支持;黃偉等[15]基于態勢感知的3個階段,對電網臺風預警防御系統中態勢要素采集、實時態勢理解和臺風風險預測等關鍵技術進行歸納,并構建了臺風預警防御系統的態勢要素指標體系,但是其關鍵態勢要素究竟如何提取沒有涉及。

綜上所述,極端氣象災害態勢要素提取雖有一些開創性研究,但具體的可操作性的方法比較缺乏。因此,本文試圖采用數據降維的方法從諸多的極端氣象災害態勢要素中提取關鍵態勢要素。首先以極端氣象災害中的臺風災害為例,設計災害態勢要素提取框架模型以及態勢要素提取的基本原則,隨后采用主成分分析法對極端氣象災害態勢的諸多的態勢要素進行數據降維處理并提取關鍵態勢要素。鑒于主成分分析法中主成分權重確定具有明顯的主觀性[16,17],為此引入合作博弈的思想,將所確定的主成分影射為合作博弈中的局中人并以態勢要素權重誤差平方和最小作為合作博弈目標函數構建態勢要素權重優化模型,并采用Shaply值法求解優化,以此確定態勢要素權重的大小(客觀賦權),進而為災害態勢威脅指標體系構建提供科學依據。

1 臺風災害態勢要素提取描述框架

災害態勢要素是指描述災害事件發展演化的內在因子和外部條件,而災害態勢要素提取就是從海量災害數據中剔出冗余數據進而提取描述災害狀態的關鍵特征要素,為災害態勢威脅評估和態勢預測奠定基礎。當影響災害態勢的某些關鍵要素超過臨界點或遇到一定的觸發條件時會導致災害事件發生,在未超過臨界點或者沒有被觸發前不會造成破壞作用。依據宏觀公共安全體系的“三角形模型”理論[18]可知:致災體是指可能對人、物或社會系統帶來災害性破壞的事件;承災體是指致災體作用的對象;救災體是指預防或減少災害事件發生及其后果的各種措施和手段。這樣致災體、承災體和救災體構成了三角形的三條邊,連接三條邊的節點為災害要素,構成了一個完整的閉環三角形框架。該框架描述了公共安全體系中最重要的3個方面,彼此之間相互影響和動態互動。由此可見,災害嚴重程度不僅與致災體直接相關,還與承災體的脆弱性、救災體的應急能力密切相關。因此,需要從致災體、承災體和救災體等3個方面對極端氣象災害態勢要素進行描述和提取。

1.1 災害態勢要素提取的原則

極端氣象災害態勢要素提取是指在造成極端氣象災害的諸多要素中提取描述災害態勢的關鍵特征要素、去除冗余要素,從而形成災害態勢指標體系,為災害態勢威脅評估和態勢預測奠定基礎。因此,災害態勢要素提取的本質是一個特征要素篩選過程,即通過相關簡約規則去除冗余要素,從而提取必要且關鍵的災害態勢要素。為了全面、準確地為極端氣象災害態勢威脅評估和態勢預測提供數據支持,災害態勢要素提取須遵循如下原則:全面性和相關性;可操作性和經濟性;科學性和顯著性;魯棒性。

1.2 災害態勢要素提取框架設計

依據范維澄院士提出的公共安全三角形理論,以臺風災害為例,設計如圖1所示的災害態勢要素提取框架模型。從圖1可知,臺風災害態勢的描述涉及致災體、承災體和救災體等3個方面的諸多要素。

在圖1中,所設計的框架模型列出了26個影響臺風災害態勢的要素,并且各態勢要素之間關系錯綜復雜。倘若對每一個要素都加以考慮分析,勢必會對災害態勢威脅評估和應急處置的及時性造成影響,因此,有必要找到一種快速高效的態勢要素提取方法,在保障災害原始信息盡量不損失或損失很少的情況下提取造成災害的關鍵態勢要素,從而有利于對災害態勢進行快速威脅評估和快速應急處置。

圖1 臺風災害態勢要素提取框架模型

2 基于主成分分析法的災害態勢要素提取模型

2.1 主成分分析法極其改進策略

主成分分析法(又稱主分量分析法或主軸分析法)是由Hotelling[19]于1933年首次提出來的,是一種兼顧數據降維與特征提取的多元統計分析方法。其基本思路是將多個具有一定相關性的指標通過線性變換轉化為少數幾個綜合指標(主成分),其中每個主成分都能反映原始變量的大部分信息,而且所含信息相互不重復。該方法雖然具有上述優點,但也存在明顯不足即各主成分的權重確定帶有明顯的主觀性[16,17]。為了更好地發揮主成分分析法的數據降維優勢并克服其不足,引入合作博弈理論構建基于合作博弈的災害態勢要素權重優化模型(通過要素權重的大小提取關鍵態勢要素)即將確定的各主成分影射為合作博弈中的局中人,其可能的組合方式影射為策略集,以誤差平方和最小為目標函數,將臺風災害態勢要素提取問題轉化為對態勢要素權重合作博弈模型的求解問題。

合作博弈[20]所描述的情形是單個局中人為了克服自身的不足,為了最大限度提高自己的效用水平,具有與他人合作的動機和行動,在合作中他們彼此交換情報、充分協商,并制定具有約束力的協議,從而形成穩定的合作聯盟。合作博弈通常采用Shapley值法[21]求取,該法的最大優點是Shapley值法的構造是以合作博弈中局中人對聯盟的潛在貢獻為基礎,充分體現了多勞多得、同工同酬和不勞不得的公平原則,從而有力保障了合作聯盟的長期穩定性[22]。

2.2 基于合作博弈的災害態勢要素權重優化策略描述

(1)局中人(主成分)

假設一項綜合評價中有k個主成分(即有k個主成分權重需要確定),那么這k個主成分就構成災害態勢要素權重博弈的局中人集合,記為K={i=1,2,…,k},其中,i∈K表示第i個主成分。

(2)博弈策略

集合K的任一子集C∈2K構成的集合就形成合作博弈中的一個聯盟,結成聯盟的目的就是通過對不同主成分的權重相互博弈,最終實現降低總體權重誤差的目的。在主成分組成的所有聯盟中(聯盟用C表示),任意一個或幾個主成分都構成聯盟的博弈策略,其集合記為Si。

(3)博弈收益

對特定的主成分來說,與其他主成分的不同組合可以形成不同的災害態勢要素權重博弈聯盟,這些不同的組合聯盟將會產生一定的收益,該收益采用態勢要素權重誤差量的倒數來表示,即誤差越小,則收益越大。合作聯盟的收益記為P(C)。

(4)收益函數

定義1設主成分個數集合K={i=1,2,…,k},P(C)是定義在K的一切子集C上實值函數,且滿足如下條件:

則P(C)定義為該聯盟的收益函數,在態勢要素權重合作博弈過程中,收益函數用權重誤差的倒數來表示即誤差越小,其收益越大。另外,P({i})表示局中人i不結盟時的單獨收益。

假設由不同主成分組合成兩個不同的聯盟C,D∈K并且C∩D=Φ,聯盟C能獲得的最大收益記為P(C),聯盟D能獲得的最大收益記為P(D)。即使聯盟C和聯盟D在不合作的情況下也能取得最大收益P(C)+P(D),為此,如果這兩個聯盟進行合作組成一個更大的聯盟M=C∪D,若式(8)成立,則這兩個聯盟有合作的可能,在經濟學上稱為超可加性(也稱協同效應),即所謂1+1>2。

若一個聯盟不滿足超可加性,那么其成員也就沒有形成聯盟的動機,即使已形成的聯盟隨時都面臨著解散的風險。此外,P(C∪D)=P(C)+P(D)稱為聯盟的可加性。

(5)博弈模型

災害態勢要素權重博弈聯盟的形成是為了進一步減少態勢要素權重的誤差,其模型可以表示為k個主成分之間的合作博弈:

其中,Vi為局中人i(即第i個主成分)在合作博弈中的效用函數即在一個特定的組合策略下局中人i期望得到的效用水平。對于k人合作博弈G={K,(Si)i∈K,(Vi)i∈K,P(C)},分配集中P(K)中不被任何分配優超的分配全體稱為核心[23]。一個合作博弈的核心是由滿足如下方程的全體支付向量組成:

其中,式(10)為個體理性條件即x提供給聯盟C的收益分配不少于C自身所得的總收益P(C);式(11)為集體理性條件即滿足式(11)的支付向量使合作成員最大限度地獲得合作帶來的好處。

在災害態勢要素權重博弈中,第i個主成分確定災害的第ξ個態勢要素(ξ=1,2,…,m)的權重記為ωξi,對應的博弈方法確定的權重為ωξG,其誤差記為:

為滿足所有指標誤差平方和最小的要求,構造如下非線性規劃函數:

(6)博弈目標

態勢要素權重合作博弈的目標就是要滿足整體權重誤差平方和最小,從而實現整體效用最大化。此處,局中人i的效用函數采用誤差的倒數表示即則博弈聯盟C的目標函數具體如下:

3.3 合作博弈模型求解

采用Shapley值法求解上述合作博弈G應該首先滿足如下3個公理[24]:

(1)有效性公理

假設對所有包含i的子聯盟C?K都有P(C{i})=P(C),則有P(C)=0;同時,合作聯盟中所有成員收益滿足:為合作聯盟的總收益,該公理體現了不勞不得(即沒有貢獻就沒有收獲)的原則。

(2)對稱性公理

假設局中人i∈K,j∈K,對任一的子聯盟C?K{i,j},總有P(C∪i)=P(C∪j),則有Pi=Pj。該條公理表明在合作博弈G中每一個局中人都是平等關系,體現了同工同酬的原則。

(3)累加性公理

對合作博弈G中任意兩個C?K,D?K,有Pi(C+D)=Pi(C)+Pj(D)。該條公理體現了多勞多得的原則即在合作博弈G中每一成員展開了多項相互獨立的合作,則所得收益為各項獨立合作的收益之和。

如一個合作博弈G滿足上述3條公理,則Shapley值法可以確定G的唯一解而達成合作博弈之目標即:

其中,|C|表示聯盟C中局中人的個數;P(Ci)表示局中人i離開聯盟C后聯盟的收益值。

3 實證分析

本文選取2006~2018年間對我國造成災害損失的13個臺風案例為樣本,具體數據如表1所示。臺風采用編號表示,比如0608表示2006年第8號“桑美”臺風。表1中的數據主要來源于《熱帶氣旋年鑒》[25]、《中國海洋災害公報》[26]、《中國統計年鑒》[27]、中國臺風網[31]、中國氣象數據網[32]、應急管理部災害統計數據庫[33]、中國統計信息網[28]。

表1 臺風樣本數據

3.1 要素初始權重確定

采用MATLAB[29]編程求解各主成分特征值、特征向量、權重以及累計權重如表2所示。

從表2可知,前4個主成分的累計權重為83.21%,滿足大于80%的要求[30,31],因此可以選擇前4個主成分進行臺風災害綜合態勢描述,即:

表2 各主成分特征值、特征向量及其累計權重

而每一主成分又由26個態勢要素線性構成即

將式(11)代入式(10)得:

式(12)中F的系數參見表2(從右至左第2列),26個態勢要素系數的大小反應了對災害嚴重程度的影響,系數越大說明對災害影響越重要。另外,系數前面的正負號分別表示對災害的正向影響和負向影響,比如態勢要素中心最低氣壓(x1)的系數為負,表示臺風中心氣壓越低,造成的災害越嚴重。通過對26個態勢要素系數絕對值大小的比較,排名前10的關鍵態勢要素為:①中心最低氣壓(x1);②登錄最大風速(x2);③每萬人擁有醫療機構床位數(x22);④臺風持續時間(x3);⑤過程降雨量極值(x5);⑥農作物種植面積(x7);⑦房屋總間數(x8);⑧日最大降雨量(x4);⑨風暴增水極值(x6);⑩每萬人醫護人員數(x21)。

3.2 基于合作博弈的災害態勢要素權重優化方法

現將描述極端氣象災害態勢的4個主成分(F1,F2,F3,F4)構成一個合作博弈的局中人集合,記為K={i=1,2,3,4},而4個主成分中的某一個或幾個所形成的集合構成此合作博弈中的一個聯盟C,則該合作博弈的聯盟共有如下幾種形式:

上述聯盟的收益函數按照主成分中各自的權重求取,具體如下:

另外,將極端氣象災害態勢要素提取的4個主成分的權重分別設為ω1,ω2,ω3,ω4,且滿足ω1+ω2+ω3+ω4=1,0≤ω1、ω2、ω3、ω4≤1,故 有P({F1,F2,F3,F4})=1。

上述合作博弈滿足Shapley值求解算法的3個公理,故依據方程(9)求解該合作博弈的核心如下:

同 理 可 求 得:ω2(P)=0.261 5;ω3(P)=0.127 4;ω4(P)=0.115 7

將所求的ω1(P),ω2(P),ω(P)3,ω4(P)代入下式:

則有:

式(14)中Fimproved的系數參見表2最后一列,排名前10的關鍵態勢要素為:①中心最低氣壓(x1);②日最大降雨量(x4);③登錄最大風速(x2);④人口密度(x11);⑤農作物種植面積(x7);⑥每萬人擁有醫療機構床位數(x22);⑦房屋總間數(x8);⑧過程降雨量極值(x5);⑨每萬人醫護人員數(x21);⑩臺風持續時間(x3)。此時,根據式(13)求得最小總體誤差平方和為:

則最小總體誤差為e=0.083 6。

3.3 結果對比分析

改進前后的前10個關鍵態勢要素如表3所示。通過結果對比分析,可以得出如下結論:

表3 模型改進前后關鍵態勢要素提取結果對比

(1)所設計的災害態勢要素提取模型是有效的。如前所述,為了完整地提取災害關鍵態勢要素,需要從致災體、承災體和救災體等三個方面進行綜合考量。本文的災害態勢要素提取模型本著這一要求進行設計,從提取結果來看,臺風災害10個關鍵態勢要素分別分布在致災體、承災體和救災體之中,并且致災體中的態勢要素占主導地位(超過一半),故模型構建滿足了設計要求。另外,本模型提取結果與文獻[32]的分析結論基本一致,也間接說明該模型是有效的和可行的。

(2)如表3所示,臺風中心最低氣壓(x1)這個描述臺風災害的最為關鍵的態勢要素在提取模型改進前后都排在了第一位的位置,這是符合科學事實的。根據臺風形成原理可知,臺風中心氣壓的高低是形成臺風風速大小和降雨量多少的內在動因。一般情況下,臺風中心氣壓越低,空氣流動就越快,從而形成的風速和雨量越大,破壞力就越強。另外,從這13個臺風樣本的實際情況來看,也符合這一規律即中心氣壓越低,所形成的風速越強,雨量也越大。

(3)從式(16)可知,第一、第二、第三、第四主成分的權重為45.33%、21.94%、8.55%、7.39%,而式(19)中前四個主成分的權重(49.54%、26.15%、12.74%、11.57%)與之存在較大差異,這是因為式(19)給出的權重是基于合作博弈模型算出的,具有客觀性。另外,由于權重的變化,各態勢要素在表2中的排序也發生了明顯的變化,尤其是日最大降雨量(x4)由原來的第8位上升到了第2位(參見表3),為此排在前三位的核心態勢要素分別為:臺風中心最低氣壓(x1)、日最大降雨量(x4)、臺風登陸最大風速(x2),這也是與實際情況相符的,因為臺風災害的嚴重程度主要是由上述3個核心態勢要素造成的。

(4)態勢要素提取模型改進后也出現了一些新問題,需要進一步探索和完善。比如該災害態勢要素提取模型改進后,影響災害態勢的關鍵要素風暴增水極值(x6)跌出了前10的位置(如表3所示,在模型改進前x6雖然比較靠后,但仍處于第9位),這一點是違背臺風災害常識的。據相關資料統計[37,38],臺風一般都會引發不同程度的風暴潮,并且目前每年因臺風引發較強風暴潮的頻率有增大的趨勢,為此造成的災害損失也越來越嚴重。出現上述情況的原因大概有兩個方面:一方面可能是模型本身存在不足,比如在數據處理過程中,各指標數據是按線性處理的,而實際上有些指標數據之間可能是非線性的,這樣必然導致提取結果出現偏差;另一方面可能是本文采用的樣本數據太少(僅13個臺風樣本),不具有完整的代表性。

4 結語

極端氣象災害態勢要素提取是災害態勢威脅評估和災害態勢預測的前提和基礎,大數據時代背景下,在海量的災害數據中快速高效地提取災害關鍵態勢要素尤為重要。本文從致災體、承災體和救災體等三個方面設計了極端氣象災害態勢要素提取框架模型,采用主成分分析法對影響極端氣象災害態勢的關鍵要素進行提取。鑒于主成分分析法在態勢要素權重確定過程中存在明顯的主觀性,引入合作博弈的思想,將各主成分映射為合作博弈中的局中人,從而設計了基于合作博弈的災害態勢要素權重優化方法。實證結果表明,改進后的態勢要素提取模型更加合理和有效,也具有更強的解釋力。此外,改進后的模型也存在不足之處,比如關鍵態勢要素x6(風暴增水極值)沒有被提取,這與實際情況不太相符,故該提取模型需要進一步的探索和完善,這為下一步的研究工作指明了方向?;跇O端氣象災害態勢要素提取模型的優化,通過推動自然災害類突發事件監測與預警理論創新,推動應急管理由注重災后救助向注重災前預防轉變,更好地從根本上減輕災害風險。

猜你喜歡
災體局中人態勢
我國海洋生態災害承災體脆弱性評估
災害脆弱性相關概念探討
2019年12月與11月相比汽車產銷延續了增長態勢
匯市延續小幅震蕩態勢
我國天然氣供需呈現緊平衡態勢
張一山、潘粵明聯手 演繹《局中人》
2×2型博弈決策均衡的歸一化解法
超對策模型中多形式結局偏好認知信息融合的0—1規劃方法
基于災害鏈效應的小秦嶺亂石溝礦山泥石流風險評價
縣鄉一體化探索呈加速態勢
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合