?

基于LSTM神經網絡的海纜保護區船舶擱淺預測模型

2023-06-25 07:42吳仕良林業茂張雪峰黃撥劉莉莉
現代信息科技 2023年7期

吳仕良 林業茂 張雪峰 黃撥 劉莉莉

摘? 要:針對我國沿海地區,船舶擱淺可能損壞海底電纜的問題。設計一種基于雷達網和AIS數據的軌跡預測模型。該模型通過采集船舶的經緯度,航速航向等信息,預測五分鐘內的船舶位置。使用LSTM神經網絡對船舶五分鐘內的軌跡進行預測,準確預測船舶軌跡可以及時發出預警信息,降低船舶觸纜的風險。5分鐘內船舶軌跡點平均距離誤差約為124米,5分鐘時刻,船舶坐標點平均距離誤差約為185米。

關鍵詞:船只擱淺;軌跡預測;LSTM

中圖分類號:TP391? 文獻標識碼:A? 文章編號:2096-4706(2023)07-0082-05

Abstract: In view of the problem of coastal areas in our country, the ship grounding may damage the submarine cables. This paper designs a trajectory prediction model based on radar net and AIS data. The model can predict the ship's position in real time within five minutes by collecting information such as the ship's latitude and longitude, speed and course. It uses the LSTM neural network to predict the trajectory of the ship within five minutes, and the accurate prediction of the ship trajectory can send out early warning information in time and reduce the risk of the ship touching the cables. The average distance error of ship trajectory point within 5 minutes is about 124 meters, and the average distance error of the ship coordinate point at the time of 5 minutes is about 185 meters.

Keywords: ship grounding; trajectory prediction; LSTM

0? 引? 言

近年來,數據傳輸需求日益增長,近海區域鋪設了大量的海纜,海纜區域可能與船舶航線發生交會,因船舶擱淺或拋錨,從而導致觸纜時有發生。海南聯網系統海纜監視警戒區船只拋錨事件信息表顯示,目前危險行為干預主要依賴于值班人力,若能提前進行航跡預測并給出告警信息,及時通知相關人員進行甚高頻通信或應急船干預,有助于提升海纜安全性,有效節省人力物力,降低損失。

本文以海南周圍雷達網大數據平臺為基礎,采用AIS和雷達數據相結合,訓練和使用預測模型。軌跡預測模型采用LSTM神經網絡(Long Short-Term Memory,長短期記憶網絡)對數據進行訓練。海纜的水深與埋深數據主要參考2016年份的海纜路由、埋深檢測報告。

1? 數據采集與預處理

1.1? 數據采集

本研究的大數據平臺架構如圖1所示。

如圖1所示,HDFS和hive儲存有船只的歷史原始數據。由于離線數據庫中含有大量持續時間短,突然出現并突然消失的雷達目標,為盡可能篩選船舶軌跡作為軌跡預測的樣本,設置篩選條件MMSI不能為空值。本文篩選船舶ID、MMSI號、時間戳、經度、緯度、航向、航速作為原始字段。觀察海纜數據經緯度坐標,主要選擇我國近海被雷達網覆蓋的某兩度范圍內船舶數據?;贏IS數據的格式,船舶運動軌跡的研究大體分為兩種方式:以航跡點為研究對象[1,2]及以航跡線為研究對象[3,4]。

實時數據主要通過kafka傳輸,通過flink流處理消費數據并進行實時計算。最后將預警信息實時同步到redis或kafka中。

1.2? 數據分析

船舶目標的軌跡預測,模型輸入應為過去一段時間內的船舶航速、航向、經緯度等特征信息,模型輸出應為一定時間內的經緯度坐標數據。實際的AIS目標中包含部分錯誤的數據[5],雷達和AIS數據融合后,觀察原始數據得出以下結論。

數據中某些重要特征為空值:例如MMSI號、時間戳、經緯度坐標。這部分數據因難以插值或判斷,將視為無效數據,直接在原始數據中刪除。

數據中會包含一定量持續低航速目標(航速低于2海里/小時),分析認為有兩種可能:

1)目標為雜散目標,非正常船舶航行數據,此類目標通常持續時間較短。

2)目標為船舶目標,船舶處于錨泊狀態,經緯度坐標通常固定于較小的區域內,此類目標通常也無軌跡預測的必要。

數據中船舶的軌跡在時間上不連續。船舶的軌跡預測應當包含時序信息,一系列的經緯度點具有時間連續性的特征。分析認為,船舶時間間隔不統一主要有四種因素:

1)船舶處于不同航行狀態時(例如錨泊、定速航行、停航),AIS收發數據的時間會發生改變。

2)在數據傳輸的過程中,難免會出現延遲與漏發,導致時間戳間隔不等。

3)數據清理時,刪除了部分數據。

4)船舶目標丟失,雷達網和AIS未接收到數據。

綜上所述,數據預處理時,將對數據的時間戳進行調整,需要進行數據的插值和航行軌跡的分段。

數據中經緯度坐標點出現軌跡偏移或異常點跳變,此類數據視為臟數據予以剔除,對于時間間隔較大的軌跡和部分點位缺失的軌跡,將作插值處理。

取數據時取了固定區域內的船舶軌跡,且船舶軌跡難以覆蓋各種類型的航速和航向角,將對數據進行處理,增加數據量并防止模型依賴于訓練數據的經緯度。將預測經緯度的值轉換為預測經緯度基于初始點的變化值。

原始數據中包含船舶MMSI,時間戳、經度、緯度、航速、航向。特征較少,將擴充上述特征,通過計算獲取ROT(轉艏速率)、經度方向變化量、緯度方向變化量、航向的正弦、余弦等。

軌跡預測數據獲取步驟如圖2所示。

2? 實驗方法

2.1? 模型選用

深度學習可通過學習一種深層非線性網絡結構,實現復雜函數逼近,具有從少數樣本集中學習數據集本質特征的能力[6]。循環神經網絡RNN作為深度學習的一種典型模型,可用來處理時間序列數據[7]。

RNN是一種特殊的神經網絡結構,它與DNN、CNN不同的是:它不但考慮了前一時刻的輸入,還使網絡對前面的內容具有一定的“記憶”能力[8]。

循環神經網絡RNN又被稱為遞歸神經網絡,是一種深層次的神經網絡模型。一個標準的RNN的層次結構包含輸入層、隱藏層和輸出層。RNN最主要的特征就是隱藏層含有所有歷史時刻的狀態信息,該隱藏層是RNN中的記憶單元。雖然RNN有其獨特的優點但是仍存在著梯度消失、 梯度爆炸等問題。LSTM就是為了解決梯度消失、梯度爆炸等問題應運而生的[9]。

在船舶軌跡預測中,歷史信息對當前狀態的影響不同,與當前時刻接近的數據更有參考價值,權重更大;與當前時刻時間差距大的數據,權重較小。

因此LSTM長短期記憶模型是一種改進的RNN模型,更適合于船舶軌跡預測。LSTM可以解決傳統RNN的長期依賴問題,即解決當前系統狀態可能會受很長時間之前系統狀態影響的問題。它對傳統RNN的隱藏層進行了結構上的改進[10]。LSTM替換了RNN模型中的記憶單元,記憶單元包含三種門結構:輸入門、輸出門和遺忘門。這種結構使得記憶單元不僅可以長時間記憶歷史信息,還可以通過遺忘門拋棄部分歷史信息。LSTM網絡結構如圖3所示。

2.2? 數據預處理

2.2.1? 數據異常值清理

MMSI號與時間戳缺失的數據,難以歸類于完整的軌跡中,故丟棄數據表中的該條數據。

丟棄部分航速航向數據,判斷依據為航速低于2 nm/h或船速高于40 nm/h的數據,將根據等時間間隔的經緯度數據,計算實時航速與實時航向作為補充。

2.2.2? 數據分段與數據時間間隔統一

首先通過MMSI號將所有軌跡按船舶分類,時間間隔小于300秒的數據,將統一時間間隔后插值處理;時間間隔大于300秒的數據,將該點位作為斷點,前后數據視作兩段軌跡。

時序模型訓練時,數據維度必須相同。原始數據中時間戳間隔長短不定,需將數據調整為等時間間隔。觀察數據和通過實驗,選擇30秒為時間間隔長度,具體步驟如下:

1)對時間戳除以時間間隔,去除余數,保留整數部分。

2)同一時間戳存在多條數據時,僅保留第一條數據及原始時間戳與當前時間戳間隔最小的數據。

3)時間間隔大于300秒,分割軌跡。

4)時間間隔小于300秒,根據前后點經緯度數據線性插值,暫時選取首點的航向航速,作為該時段的航向航速。

5)得到時間間隔為30秒的多條軌跡。

2.2.3? 數據分組

定義模型輸入數據條數N_input和輸出數據條數N_output。因時間間隔為30 s,故預測時所需歷史數據時間長度為N_input*30秒,輸出數據時間長度為N_output*30秒。故一組數據的條數為N_input和N_output之和。當輸入為20條數據,輸出為10條數據時:即以過去10分鐘的經緯度點預測未來5分鐘的經緯度點。

2.2.4? 數據特征整理

獲取分組后等時間間隔的數據,當前特征包括經度、緯度、航向、航速。特征擴充步驟如下:

1)一組數據中所有經緯度減去初始點的經緯度,即將軌跡初始點平移至與原點重合(防止訓練的模型對固定的經緯度區域產生依賴)。

2)根據經緯度計算軌跡點的瞬時航速與瞬時航向,瞬時航速為距離的變化量除以時間變化量,瞬時航向由方位角的變化量除以時間變量。

3)根據經度和緯度計算經度方向變化量,緯度方向變化量。

4)根據當前航向(航向數據為以正北為0度,范圍為0度至359度)計算航向的正弦值和余弦值。

5)計算航速在經度方向和緯度方向(水平方向為經度方向,豎直方向為緯度方向)上的分量

6)根據航速的變化與時間間隔計算加速度,然后結合正弦值余弦值計算經度與緯度方向上的加速度分量。

7)根據航速和時間間隔計算轉艏速率。

經過上述處理后,當前的特征有經度、緯度、航速、航向、經度變化量、緯度變化量、瞬時航速、瞬時航向、加速度、航向正弦值、航向余弦值、航速正弦值、航速余弦值、加速度正弦值、加速度余弦值、轉艏速率,特征共計16個。

2.3? 模型訓練

對于軌跡預測算法,其結果應當為一段軌跡的經緯度坐標,LSTM模型對時序信息有嚴格限制,所以每條數據的順序不應被改變。

設定LSTM為序貫模型,添加兩層LSTM層,兩層dropout層和一層全連接層,設定函數的損失函數(loss)為均方誤差,學習率優化器選擇adam,評價為acc,模型的epochs為100,batch_size為32,verbose為1。

結合船舶進距分析,按照IMO規范,縱距不超過4.5倍船長,橫距為旋回直徑的一半,而旋回直徑不超過5倍船長,船舶軌跡的模型以預測5分鐘為標準。

模型輸入為20條船舶數據,模型輸出為10條船舶數據。每條數據的時間間隔為30秒。輸入數據包含經度、緯度、航速、航向、經度變化量、緯度變化量、瞬時航速、瞬時航向、加速度、航向正弦值、航向余弦值、航速正弦值、航速余弦值、加速度正弦值、加速度余弦值、轉艏速率16個特征。輸出數據包含經度和緯度數據。綜上所述,模型的輸入為前10分鐘的船舶航行數據,模型的輸出為后5分鐘的船舶經緯度數據。

由于模型輸入輸出經緯度數據均進行了平移,在得到模型的輸出數據后,需要對經緯度進行反平移,獲取真實的經緯度。

3? 實驗分析

3.1? 評價指標

軌跡預測模型關注預測軌跡與真實軌跡的相似度,故采用平均距離誤差作為衡量模型準確度的標準。平均距離誤差包含不同時間間隔的平均距離誤差和軌跡整體的平均距離誤差(單位為米)。例如,30秒時平均距離誤差為真實點與預測點的距離誤差的均值,用于衡量30秒時,預測點位相比于真實點位的偏移程度。用整體軌跡的平均距離誤差,衡量整段軌跡預測結果的偏移程度。地球半徑取6 371.393千米,距離誤差由經緯度坐標和地球半徑計算。

3.2? 實驗結果

選取瓊州海峽附近真實AIS與雷達數據作為原始樣本共包含船舶1 843條,插值處理前的數據約有324萬條。在將數據分為多條軌跡后,時間順序前4/5為訓練數據,后1/5為測試數據,另選取80條包含轉向的軌跡(MMSI號,時間戳等均與訓練數據不同,確保為未經訓練的數據)作為測試數據。

選取輸入數據10個點(右上框0~9號),預測數據10個點(左下框10~19號),真實未來軌跡10個點(左下框0~9號),繪制于海圖中。預測軌跡與真實軌跡航行趨勢吻合,如圖4所示。

如表1所示,不同測試集中平均距離誤差均隨預測時間增加而增加,原始測試集平均距離誤差為163米,轉向測試集中平均距離誤差為184米,總時段內平均距離誤差分別為139米和124米。

分別挑選直行軌跡與轉向軌跡進行對比,直行軌跡預測如圖5所示。模型能較好的預測直行船舶的狀態,預測軌跡與真實軌跡趨勢一致。

圖6為轉向軌跡預測結果。預測軌跡與真實軌跡基本一致,模型能夠預測包含較大轉向角度的軌跡。圖中為多組輸入數據、預測數據、真實軌跡數據同時繪制。所以部分點位有重合,會被重復繪制。

如表2所示,隨機選取一段直行軌跡和轉向軌跡,直行軌跡平均距離誤差為80.054米,轉向軌跡平均距離誤差為95.096米。

4? 結? 論

為了提高海纜的安全性,降低過往船舶觸纜風險。本文通過大數據平臺篩選了1 843條船舶真實軌跡作為訓練數據,針對原始數據的不足進行數據預處理,使用LSTM長短期記憶模型進行訓練,通過軌跡預測模型進行航行安全的預警,軌跡預測結果與真實軌跡基本吻合。在讀取海纜埋深數據后,將軌跡預測結果與水深線作比較,若線段相交則輸出預警信息,能夠有效的進行船舶軌跡預測并及時的輸出擱淺預警,提高了海纜的安全性。

參考文獻:

[1] PALMA A T,BOGORNY V,KUIJPRS B,et al. A clustering-based approach for discovering interesting places in trajectories [C]//SAC '08:Proceedings of the 2008 ACM symposium on Applied computing.New York:ACM,2008:863-868.

[2] VESPE M,VISENTINI I,BRYAN K,et al. Unsupervised learning of maritime traffic patterns for anomaly detection [C]//9th IET Data Fusion & Target Tracking Conference (DF&TT 2012):Algorithms & Applications. London:IET,2012:1-5.

[3] DE VRIES G K D,VAN SOMEREN M. Machine learning for vessel trajectories using compression,alignments and domain knowledge [J].Expert Systems with Applications,2012,39(18):13426-13439.

[4] DOUGLAS D H,PEUCKER T K. Algorithms for the reduction of the number of points required to represent a digitized line or its caricature [J].Cartographica:The International Journal for Geographic Information and Geovisualization,2003,10(2):112-122.

[5] 劉興龍,初秀民,馬楓,等.AIS報文異常動態信息甄別方法 [J].交通運輸工程學報,2016,16(5):142-150.

[6] BIERE A,FROHLICH A. Evaluating CDCI. Variable Scoring Schemes [C]//Proceedings of the 18th International Conference on Theory and Applications of Satisfiability Testing.Bioinformatics:Springer International Publishing,2015:405-422.

[7] CHEN J. A Dynamic Phase Selection Strategy for Satisfiability Solvers [J].Computer Science,2012,13(5):208-213.

[8] PERERA L P,OLIVEIRA P,SOARES C G. Maritime Traffic Monitoring Based on Vessel Detection,Tracking,State Estimation,and Trajectory Prediction [J].IEEE Transactions on Intelligent Transportation Systems,2012,13(3):1188-1200.

[9] 權波,楊博辰,胡可奇,等.基于LSTM的船舶航跡預測模型 [J].計算機科學,2018,45(S2):126-131.

[10] 趙萬香.基于馬爾科夫預測法的車道偏離預警系統研究 [D].西安:長安大學,2014.

[11] 孫平闊.海底光纜路由設計影響因素 [J].電信工程技術與標準化,2022,35(2):76-80.

[12] 葉胤,王超,莫仁蕓.海底光纜通信系統技術發展分析 [J].廣東通信技術,2021,41(1):19-23.

[13] 魏巍,王增,張偉,等.新一代海底光纜綜合信息傳輸網技術發展現狀 [J].光通信技術,2022,46(4):61-67.

[14] 劉興華.海底通信光纜水下設備原理及設計研究 [J].廣東通信技術,2022,42(5):68-72.

[15] 盧聃.海底光纜突圍在即 [J].產城,2021(11):70-71.

[16] 陳宇俊,解江,張澤,等.海底光纜環境影響因素綜述 [J].電子產品可靠性與環境試驗,2018,36(S1):232-236.

[17] 施炎,李文川,叢丕宇.海底光纜風險警告解決方案 [J].電信技術,2018(11):54-58.

作者簡介:吳仕良(1988—),男,漢族,廣西平南人,助理工程師,本科,主要研究方向:光纖通信;林業茂(1986—),男,漢族,海南萬寧人,助理工程師,碩士研究生,主要研究方向:光纖通信;張雪峰(1983—),男,漢族,湖南衡陽人,工程師,碩士研究生,主要研究方向:通信工程;黃撥(1985—),男,漢族,湖南長沙人,助理研究員,碩士研究生,主要研究方向:遙感技術;劉莉莉(1988—),女,漢族,福建泉州人,本科,助理工程師,主要研究方向:光纖通信。

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合