?

基于Apriori算法的海事事故中人為失誤致因探討

2023-11-22 08:35蔡源忠九江市港口航運管理局
珠江水運 2023年21期
關鍵詞:項集置信度海事

◎ 蔡源忠 九江市港口航運管理局

近年來,隨著海上經濟的快速發展,海事事故的發生頻次也在不斷增加,據相關統計數據顯示,多達90%以上的海事事故均為人為因素引發,及時掌握海事事故當中人為因素所帶來的影響,是強化海事事故預防,降低事故影響的重點所在。通過關聯規則當中的Apriori算法,能夠較為直觀地挖掘出人為失誤與海事事故之間的相互關系,為海洋運輸管理部門的有關舉措提供更加客觀準確的參考,使海事事故的預防方案能夠進一步契合事故實際情況,保障海上運輸業安全。

1.Apriori算法基本原理

Apriori算法是最為常見的一種關聯規則挖掘算法,其主要運用逐層搜索的迭代方法對項集當中的關聯性進行挖掘,進而形成關聯規則。在海事事故致因分析過程中,可將事故案例作為事物集D,將導致事故發生的各項信息組成項集I,其中,I={i1,i2,i3,...,ik},項集當中的各項要素涵蓋了事故信息、事故誘因等涉及海事事故致因分析工作的關鍵要點。將人為因素作為條件X,將事故信息作為結論Y,分析條件X至結論Y之間的強度則能夠得到人為因素與海事事故之間的關聯性,進而實現對事故致因的探討[1]。

由于項集I當中涉及的事故信息較為復雜,給分析工作帶來了一定難度。因此可選取典型性信息作為分析代表,并對其進行編碼,設最小支持度為min_sup=20%,最小置信度為min_conf=70%,能夠針對編碼后的信息進行篩選,得到頻繁項集。與此同時,按照上述支持度與置信度計算要求對項集內部信息進行多次迭代,并基于置信度公式對信息置信度進行驗證。公式為:

待置信度驗證完成后,能夠明確頻繁項集當中海事事故相關因素與事故影響之間的關聯性特征,為實現針對海事事故的有效預防提供支持。

2.海事事故致因要素整合處理

在Apriori算法下,海事事故致因要素的分析更加嚴謹,為減少算法誤差對分析精度造成的影響,在致因分析之前,需要對項集模型當中涉及的要素進行整合處理,使其能夠符合Apriori算法分析要求。

2.1 布爾數據轉化

作為一種單維布爾型的數據挖掘算法,在針對海事事故人為致因進行分析和研究的過程當中,應將多維要素進行轉化,使數據挖掘結論更加全面。事故項集I當中的信息內容涵蓋的布爾信息包括違規值班、能見度不良等等,在針對算法模型進行構建的同時,應當具備對信息數據形態進行辨識的功能,模型內部應將單維布爾型數據的屬性值設定為1,將多維信息數據的屬性值設定為0,使Apriori算法下不同事故致因要素在事物集D當中的比重能夠較為直觀地展現在模型當中?;诓紶枖祿D化過后的要素分析主要涉及組織管理、監督安全以及事故發生條件等三個層次。具體數據見表1至表3。

表1 組織管理層次在要素分析當中的占比

表2 監督安全層次在要素分析當中的占比

表3 事故發生條件層次在要素分析當中的占比

2.2 枚舉數據處理

上文當中,主要針對海事事故發生過程當中涉及的布爾型數據進行了初步梳理,為了覆蓋更加廣泛的海上事故狀況,提升海事事故預防工作成效,還需要從枚舉角度對項集當中涉及的事故信息進行全面分析,使天氣要素、人為失誤要素等信息進一步細化,使Apriori算法的分析工作開展更加合理[2]。本文以人為因素為例進行論證。在海事事故人為失誤致因要素當中,可分為人員因素與管理因素兩類,其中人員因素涵蓋了海上運輸工作人員的適任性情況、工作人員的身心狀態、對海上運輸環境的感知、對運行風險的辨識判斷與決策、風險處理過程當中的操作行為等,管理因素主要涵蓋了船上資源管理、處置流程優化、安全氛圍建設、風險行為監督、安全運行規劃、違規行為處置等。針對枚舉數據進行處理過后,能夠使Apriori算法下的數據挖掘工作得到較為全面的內容支撐,保障數據挖掘價值。

2.3 數值數據離散

海洋運輸業發展過程當中涉及的各項事故信息類別較為豐富,這就給數據之間非線性關系的描述和分析帶來了一定的挑戰。此外,事故信息項集內部可能存在的一些異常數據信息也會對最終的分析結果帶來一定的負面影響。因此在運用Apriori算法進行海事事故信息數據整合處理的同時,還應當針對數值數據進行離散處理,使其能夠回歸自身屬性值,進而摒棄異常數據對于算法分析結果產生的影響,確保致因分析的準確性。在基于Apriori算法針對海事事故數據信息進行挖掘的同時,主要涉及支持度、置信度兩項指標,因此離散化處理的過程中也應當做好變量控制,使數據結論更加完善。

在離散分析之前,將項集內部有關于海事事故的信息要素的支持度閾值控制在20%,同時將置信度閾值控制在25%,進而對項集I內部各項信息要素與事故發生時的關聯特性以及關聯規則進行比對分析,并且在支持度閾值不變的前提下,針對項集I當中數據信息的置信度閾值進行調整,對最終獲取到的信息關聯規則進行排序,最終得到離散分析過后的關聯規則?;谏鲜鲆巹t,能夠進一步減少異常信息給致因分析結論造成的影響,實現對規則冗余的充分排除,為海事事故人為失誤的致因分析提供支持。

3.基于Apriori算法的人為失誤致因分析

3.1 信息來源

作為一項布爾型數據挖掘算法,Apriori算法需要大量數據作為基礎和支持,在選擇海事事故案例的過程當中,研究者應當遵循以下幾方面原則。第一是時效性原則,為了使海事事故調查報告具備更加充分的參考價值,減少社會環境變化以及技術發展對項集內部信息產生的影響,應盡可能將案例選擇的時間閾值控制在10年以內。第二是權威性原則,相關海事事故的調查報告必須來源于各國官方機構。第三是隨機性原則,在針對海事事故調查報告進行篩選與整理的同時,應盡可能保障篩選過程的隨機性,避免事故類別以及事故影響范圍對研究造成的影響。第四是完整性原則,在基于Apriori算法對不同海事事故調查報告進行分析與梳理的過程中,應保障調查報告內容的全面完整,其內部應涵蓋事故原因、事故影響、事故類別等多項關鍵性內容,使人為失誤與海事事故之間的關聯性得到進一步凸顯[3]。

為適應Apriori算法分析要求,滿足上述信息來源與篩選原則,本次研究過程中基于各國海事事故調查報告選擇了100個樣本,具體案例如表4所示。

表4 海事事故調查報告樣本

3.2 相關性分析

在基于Apriori算法針對人為失誤與海事事故之間的關聯性進行調查與研究的過程中,應依托上述篩選完成后的100個權威海事事故調查報告為例對其涉及的數據信息進行相關性分析,從而獲取到人為失誤與海事事故之間的關聯性規則。

首先,基于上述海事事故調查報告設定事故事物集D,其中包括篩選完成的100個各國發布的典型性海事事故案例,同時,依托案例調查報告,將海事事故調查過程中所涉及的影響要素納入項集I當中,本次研究涉及的人為失誤共13類,事故影響要素共32類,因此項集I當中的要素總數為45個。與此同時,將A設定為海事事故當中人為失誤集合,將B設定為事故影響要素集合。

其次,在依托Apriori算法進行關聯分析的過程中,應明確各要素之間的支持度與可信度閾值。一般可采用經驗法以及變量控制法兩種方法對要素關聯閾值進行設定,為了減少誤差因素對于最終數據挖掘結果造成的影響,提升Apriori算法分析結論的可信性,本次研究當中采用了變量控制的策略對項集I當中各要素的支持度、可信度閾值進行設計,經迭代計算過后,最終確定支持度閾值為30.5%,可信度閾值為34.7%。

最后,基于迭代分析得到的信息支持度與可信度閾值,針對要素與事故之間的關聯規則進行明確。計算公式為:

式中,s為海事事故致因分析過程當中的要素支持度,c為海事事故致因分析過程當中的要素可信度。最終的關聯規則如表5所示。

表5 Apriori算法計算過后的要素關聯規則

3.3 資料勘探

在不同閾值條件下,最終得到的分析結論也存在一定的差異,進而得到的人為失誤與海事事故之間的關聯性也存在相應區別。其中,在海洋運輸航行過程當中,對于風險信息的處理能力、航道選擇能力、航行知識經驗、風險監督以及作業注意力等相關要素與海事事故之間的關聯性較強,可能引發海事事故的概率較高。

4.海事事故預防建議

為了進一步降低海事事故發生概率,減少海事事故給海洋運輸業以及海上經貿活動造成的影響,有關單位與從業者應分別基于內部環境與外部條件兩方面做好事故預防工作。

4.1 內部環境預防

從內部環境來看,海上運輸作業人員的能力與素質與海事事故的發生具有較為明確的關聯性,因此有關企業與單位應當積極加強有關作業團隊的選拔與培養工作,同時因地制宜做好運輸作業監管,避免嚴重海上事故的發生[4]。

4.2 外部條件預防

從外部條件來看,在海上航行作業之前,應當加強對航行環境以及航行條件的監控,避免在惡劣環境或密集交通下進行作業,保障海上航行安全。

5.結論

綜上所述,在海上航行作業過程中,人為失誤對事故的發生具有重要影響。相關研究者可基于Apriori算法對人為失誤與海事事故之間的關聯特征進行分析和明確,力求規避海事事故造成的影響,為海事監管工作的正常開展奠定基礎。

猜你喜歡
項集置信度海事
信息精要與海事掃描
硼鋁復合材料硼含量置信度臨界安全分析研究
信息精要與海事掃描
信息精要與海事掃描
信息精要與海事掃描
正負關聯規則兩級置信度閾值設置方法
置信度條件下軸承壽命的可靠度分析
一種頻繁核心項集的快速挖掘算法
多假設用于同一結論時綜合置信度計算的新方法?
一種新的改進Apriori算法*
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合