?

基于大數據分析的電網外包單位安全評價研究

2024-01-31 10:35
電氣技術與經濟 2024年1期
關鍵詞:分值單位指標

劉 聰 楊 輝 魏 琨 景 鈺

(國網甘肅省電力公司定西供電公司)

0 引言

電力安全與政治安全、經濟安全、網絡安全、社會安全等諸多領域密切關聯,一旦發生大面積停電事件,可能引發跨領域連鎖反應,導致重大經濟財產損失,甚至引發社會恐慌,危及國家安全。隨著電網建設步伐的不斷加快,電網工程量持續增大,電力工程外包隊伍不斷增多,電力外包工程和外包施工單位的安全管理被提到越來越重要的位置,建立電力外包施工單位安全管理評價體系成為提升外包安全管理水平的迫切需要[1]。

國家電網有限公司2023年安全生產工作相關意見指出,應“鞏固和延伸安全生產專項整治三年行動成效,常態化抓好長期風險管控,鞏固整治成效”。為確保生產作業安全和建設施工安全,牢牢守住安全生命線,科學運用大數據分析技術,開展外包單位安全體系評價建設,是深入落實安全生產專項整治行動的一項具體實踐,有助于健全完善安全管理體系,提升科學管理水平,建設安全生產長效機制,推進安全治理體系和治理能力現代化[2]。

1 電網外包單位安全評價研究思路

首先,開展理論研究,對電網企業安全管理、外包單位安全管理、評價方法及模型等概念進行梳理,為打通電網企業外包單位安全評價體系構建的底層邏輯提供理論支撐。其次,開展實證研究,通過文獻綜述法、對標方法論,開展外包單位安全評價體系實踐分析,梳理不足和薄弱環節,以問題為導向構建基于大數據分析方法的的外包單位安全評價體系。再次,構建基于大數據分析的外包單位安全評價指標體系,以3C要素作為理論基礎,結合外包單位安全管理實際,構建“4S”外包單位安全評價指標體系,初步選定外包單位安全評價指標。然后,進行安全評價指標數據的采集和預處理,通過特征工程對指標進行特征衍生、特征抽象化等一系列操作,利用皮爾森相關性圖譜篩選出與目標變量相關性較高的特征,降低模型學習難度。接著,采用隨機森林算法對特征的權重進行評判和排序,確定最終指標及權重。最后,進行算例分析,通過模型計算出外包單位安全評價分值,并根據分值將外包單位安全評價分級[3]。

2 基于大數據分析的電網外包單位安全評價研究

2.1 指標選取

(1)安全屬性指標

安全屬性指標主要考核外包單位在資歷、規模、業績等方面所具備的綜合條件及進行投標或履約的基本能力。評價指標體系下設二級指標和三級指標,二級指標包括企業資源、經營狀況、獎懲記錄三項,下設的三級指標為具體的評價項。

(2)安全行為指標

安全行為指標主要指電網施工外包單位在國網系統內生產作業中累計的安全行為信息,反映電網施工外包單位在工程建設過程中的安全施工能力,評價指標體系下設二級指標和三級指標,二級指標包括施工安全違章、安全作業風險、安全負面清單數、違章記分數四項,下設的三級指標為具體的評價項。

(3)安全資質指標

安全資質指標主要是評估電網施工外包單位是否具備足夠施工能力且資信良好的企業,是外包單位安全準入的重要標準之一。評價指標體系下設二級指標和三級指標,二級指標包括安全資信、安全承載力、安全投入三項,下設的三級指標為具體的評價項。

(4)安全否決性指標

“安全具有否決權”的原則指安全生產工作是衡量工程項目管理的一項基本內容,它要求對各項指標考核,評優創先時首先必須考慮安全指標的完成情況。安全指標沒有實現,即使其他指標順利完成,仍無法實現項目的最優化,安全具有一票否決的作用。

依據安全生產監管基本原則中“安全具有否決權”的原則,本研究構建的外包單位安全信用評價指標體系設立安全否決性指標,即近三年內發生人身安全事故的外包單位評價得分為0。

2.2 模型構建

(1)數據采集

對于內部數據源,主要從各業務生產系統后臺導出相應數據,以安全生產風險管控平臺及其手機APP、隴源掌培為核心數據源。對于外部數據源,主要使用網絡爬蟲進行采集,以應急管理部、國家發改委和信用中國網站為核心數據源。以2021年1月1日至2022年12月21日為時間區間,共采集獲得超過60張表單,10.3萬條數據,80MB大小的數據文件。

(2)數據預處理

1)數據清洗

電網施工外包單位安全評價數據內外部數據源頭眾多,數據采集方法不同,所采集的安全信用基礎數據也難以避免存在錯誤、重復、無效、相互沖突等(即“臟”數據)問題。本研究采用均方差方式檢測異常值,采用數據分桶技術減少次要觀察誤差的影響,實現數據格式標準化,清除異常數據,糾正錯誤數據,清除重復數據。

2)特征工程

特征抽象(feature abstraction)是指將數據轉換成算法可以理解的數據。對于獨立變量,比如將有安全生產許可證編碼為1,無安全生產許可證編碼為0。特征縮放(peature scaling)是指將變量數據經過處理之后限定到一定的范圍之內。特征縮放本質是一個去量綱的過程,同時可以加快算法收斂的速度。

3)特征選擇

當數據預處理完成后,需要選擇有意義的特征輸入機器學習的算法和模型進行訓練。

基于Filter,主要采用了方差選擇法、Pearson相關系數、卡方檢驗、互消息法四種方法進行特征選擇,最后將選擇結果進行匯總,得出最終使用的特征變量。

(3)指標權重計算

數據集劃分。鑒于數據規模,本研究采用自助法來劃分數據集,即每次從數據集D中取一個樣本作為訓練集中的元素,然后把該樣本放回,重復該行為m次,這樣就可以得到大小為m的訓練集,在這里面有的樣本重復出現,有的樣本則沒有出現過,把那些沒有出現過的樣本作為測試集。

評價指標。在模型訓練結束后,采用AUC作為模型評價指標。為了直觀表示邏輯回歸中正負例的界定現象,引入ROC曲線,根據分類結果計算得到ROC空間中相應的點,連接這些點就形成ROC曲線。一般情況下,ROC曲線越接近左上角,該分類器的性能越好,其泛化性能就越好。同時,如果ROC是光滑的,那么基本可以判斷沒有太大的過度擬合。

3 算例分析

3.1 計算安全評價分值

本研究以5家外包單位的安全屬性、安全行為、安全資質三個維度下設的各項指標數據做算例分析,采用隨機森林算法,將其作為計算安全評價分值的基礎技術。

首先,讀取實驗使用的數據集;接著,通過均等階梯記分、功效系數法等評價方法,將5家外包單位各項指標數據得分情況進行計算,并基于計算結果生成相應熱力圖。

然后,通過最終的相關性計算結果,選取與外包企業安全評估相關性大于0.5的16個指標?;谶@16個指標,對之前選定的所有指標進行篩選,去除其余指標,以確保最終外包企業安全評估得分的科學性與真實性。

最后,將篩選后的數據送入隨機森林中進行訓練,通過隨機森林求得每一個指標占取外包企業最終安全評估指標得分的權重,見下表。

表 篩選后指標權重計算結果

觀測計算結果可知,由于指標數較多,每一個指標的所占權重都較小。因此,本研究基于這16個指標的權重,與其對應的企業指標值相乘,并將計算得到的所有指標值相加,最終得到該企業的安全評價分值,實現外包企業安全量化評估。

根據計算,5家外包單位的安全評價分值分別為:企業A得分57.42分;企業B得分80.00分;企業C得分64.61分;企業D得分77.37分;企業E得分79.31分。

3.2 劃分安全信用等級

在通過隨機森林計算出外包單位安全評價得分后,針對得分情況,將其劃分為五個等級,即差(D級,<60分)、較差(C級,60~69分)、達標(B級,70~79分)、良好(A級,80~89分)和優秀(A+級,90~100分)?;谝陨现笜?,在每次計算出外包單位安全評價得分后對其進行歸類,最終實現對外包單位的安全評級。

根據前述安全評價分值計算結果,企業A安全評價分值57.42分,根據劃分結果,安全信用等級為D級,安全信用差,在安全準入評估時可以選擇排除,不予考慮這類單位;企業B安全評價分值80.00分,安全信用等級為A級,安全信用良好,在安全準入評估時可以優先選擇這類單位;企業C安全評價分值64.61分,安全信用等級為C級,安全信用較差,在安全準入評估時應盡量避免選擇這類單位;企業D和企業E的安全評價分值分別為77.37分和79.31分,安全信用等級為B級,安全信用達標,在安全準入評估時可以多加關注這類單位。

3.3 算法對比分析

為驗證隨機森林在計算外包單位安全指標之間相關性的有效性,本課題將隨機森林算法與SVM支持向量機算法、BP神經網絡算法三種算法進行了對比。

從計算復雜度來看,神經網絡由多個神經節點組合而成,每一個節點都要計算與另一個節點之間的權重。SVM支持向量機算法則需選擇一個核函數,通過該函數對相關性進行求解,但這個核函數也較為復雜。對比之下,隨機森林算法由于可對樹數量進行設置,而本研究選用的指標為27個,樹數量設置為10以下即可,因此計算復雜度相較于以上二者較低。

從實現時間來看,隨機森林算法需5min,SVM支持向量機算法需12min,神經網絡算法需17min,隨機森林算法所需時間遠遠小于其他兩種算法。

從實現效果來看,由于采集數據中含有人工生成的數據,整體數據規模也較小,使用神經網絡算法和SVM決策樹算法會導致過擬合的情況(即低復雜度的數據采用了高復雜度的算法實現),最終效果較差,而隨機森林算法能夠很好地解決該問題。

為了獲得更好的算法對比計算效果,本研究搭建了算法對比所需的實驗環境,具體軟、硬件參數為:Ubuntu20.04.1操作系統,Intel(R)Core(TM)i7-9700K處理,七彩虹RTX2080super顯卡(16GB內存),3.8.12版本Python軟件、1.12.0版本Pytorch軟件。

4 結束語

通過對驗證集的指標進行計算,最終得出3種算法的最終效果,隨機森林算法0.89,SVM支持向量機算法0.64,神經網絡算法0.74。因此,隨機森林算法在外包單位安全評估任務上,相較于其他兩種算法所需時間更少、實現效果更好,更適用于本研究的外包單位安全指標權重計算。

猜你喜歡
分值單位指標
一類帶臨界指標的非自治Kirchhoff型方程非平凡解的存在性
一起來看看交通違法記分分值有什么變化
鳴謝單位(排名不分先后)
填單位 要推敲
看錯單位
最新引用指標
莫讓指標改變初衷
按病種(病組)分值結算:現狀、做法和評價
協辦單位
Double圖的Kirchhoff指標
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合