?

一種基于用戶群的高鐵專網斷點定位方法與實踐

2018-12-21 02:33張璐巖賈磊
電信工程技術與標準化 2018年12期
關鍵詞:專網高鐵聚類

張璐巖,賈磊

(中國移動通信集團陜西有限公司,西安 710077)

截至2017年底,我國高鐵運營總里程接近30 000 km,全年運送旅客約17.13億次,同比增長18.7%。即時通信、網頁瀏覽、流媒體視頻、手機網游等業務是當下高鐵旅途中旅客打發時間消遣的主要方式。為保證用戶網絡體驗感知,高效、準確、低成本的識別高鐵用戶、優化高鐵網絡就顯得至關重要。

1 高鐵網絡優化現狀

用戶在高鐵環境下對移動網絡業務體驗的需求隨時考驗著我們高鐵移動網絡建設和優化成果。以目前的高鐵網絡優化情況來看,仍面臨著以下幾個主要問題。

傳統高鐵網絡優化工作主要依靠人工儀表拉網測試、獲取數據進行分析,測試時間成本、資源成本較高,且網絡分析對優化人員能力要求較高。

識別高鐵用戶的成本較高,當前高鐵用戶識別的主流方法是利用多普勒頻移、切換序列等方法實現,復雜度較高、硬件設施要求嚴格。

用戶群共性問題不易體現,多數體現為測試機及所在位置的網絡問題,不能代表真實用戶感知。

為滿足當下高鐵網絡優化的需求,急需一種全新的優化手段來代替傳統的優化方式。

2 基于用戶群的高鐵專網斷點定位方法

為節省優化成本,需將大量重復性的人工工作轉化為自動優化。本文從識別高鐵用戶群體出發,利用相關網絡數據判別出公專網頻繁切入切出問題,運用聚類算法發現問題高發區域,建立自動優化體系并應用于實踐。

2.1 基于大數據的高鐵用戶識別

高鐵用戶的行為特征是在一定時間內具有相同的運動軌跡。利用該特點及MR采樣數據,可從時間及空間兩個維度聯合判定,識別符合高鐵用戶特點的用戶信息。

其中,上述MR采樣數據來源為UE側物理層上報無線信號的測量結果,用于移動性管理中切換/重選事件的觸發,包含采樣時間、小區ID、MME-UES1AP-ID、RSRP等信息。

下面將從時間、空間維度分別分析,并描述高鐵用戶識別的具體原理。

在高鐵G站的用戶從時間和空間維度可分別表示為:

其中, G為表示高鐵G站時間、空間的二維矩陣,A與B分別為表示時間及空間維度的矩陣。

時間(A):從時間維度,MR數據采集時段需在高鐵停運時間之外,建議冗余為15 min。如當高鐵列車從A站至B站,發車時間為9:00,到站時間為9:35,則考慮到用戶在高鐵站等樞紐滯留時間,數據采集時間建議為8:45~9:50。當用戶占用G1站高鐵小區時間與占用G2站高鐵小區時間差等于列車從G1站至G2站的時間,則認為從時間維度該用戶符合高鐵用戶特點。

空間(B):選取高鐵車站覆蓋小區進行比對,當某用戶占用過不同高鐵站的覆蓋小區時,認為該用戶從空間維度符合高鐵用戶特點。

將時間、空間結合運算,取二維矩陣G1與G2的交集,即當某一用戶同時占用過兩個不同高鐵車站的覆蓋小區,且該用戶占用兩高鐵站專網小區的時間間隔與兩個車站間列車的行駛時間相符,則該用戶為高鐵用戶。

2.2 結合MR+OTT數據與聚類算法實現問題區域鎖定

將高鐵用戶的MR數據通過OTT實現地理位置定位,采用比對算法分析占用小區合理性,甄別公專網切入切出的網絡問題,并記錄問題采樣點,借助K-means聚類算法不斷進行聚合、鎖定出專網問題的高發區域。

其中,運營商為保障用戶能夠獲得良好的業務感知,在重點交通道路沿線建設專網進行覆蓋,用戶在使用專網信號時,因某種原因脫離專網信號進入公網的現象,稱之為出專網問題。高鐵問題區域識別方法流程如圖1所示。

2.2.1 基于信令中OTT關聯實現MR數據定位

OTT定位指依托互聯網向用戶提供的各種應用服務,基于APP軟件獲取用戶的位置信息。通過采集用戶S1-U接口中的HTTP原始碼流來獲取對應用戶此時刻的OTT應用信息,先后經歷數據清洗、數據篩選,獲得有用的位置信息;同時,基于時間和MME-UES1AP-ID信息將MR數據與OTT定位經緯度位置信息進行關聯,實現此時刻的 MR數據定位。MR經緯度關聯算法示意如圖2所示。

2.2.2 基于MR數據判別出專網問題

圖1 高鐵問題區域識別方法流程圖

圖2 MR經緯度關聯算法示意圖

提取MR數據中每個高鐵用戶的占用小區信息,將高鐵專網小區(按行駛方向排列)與用戶占用小區(按時間序列排序)進行匹配,若連續序列中長時間、多次出現占用非專網的小區,則判定為出專網事件。由于每個用戶在乘坐高鐵時可能存在多次出專網事件,故回到專網后需繼續匹配,并記錄出每一次專網的MR采樣點。高鐵專網問題識別流程如圖3所示。

圖3 高鐵專網問題識別流程圖

2.2.3 借助K-means聚類算法鎖定問題高發區域

如圖4所示,基于高鐵場景的K-means算法描述如下。

(1)選取K個出專網MR采樣點作為初始聚類中心??筛鶕哞F小區覆蓋能力,間隔一定距離(如2 km)取K個經緯度作為初始中心點。

(2)將所有出專網MR采樣點按最小距離原則分配到最鄰近聚類。上述最小距離,由每個采樣點與初始中心點經緯度的歐幾里距離計算,即對于第i個出專網的MR采樣點,其與第k個初始中心的距離可表示為dik=,若 min(dik)=,則采樣點i此次歸于k(k∈K,表示迭代過程中的中心點之一)聚類族中。

(3)根據聚類的結果,對于K個分組,取每個分組的經緯度的均值,重新計算K個聚類的中心,并作為新的聚類中心。

2.3 基于結果校正的自動分析優化

圖4 借助k-means聚類算法鎖定問題高發區域示意圖

圖5 高鐵斷點問題自動分析的流程圖

導致高鐵用戶出專網的問題主要原因有基站故障、切換參數不合理、RF優化不合理、小區擁塞等,結合問題原因的優化方案及日常優化工作經驗模擬人工分析問題思維形成一套自動分析優化體系,同時根據實際情況檢驗方案的準確性,針對判決條件有誤的流程及時修改,提高分析問題的精準度。

建議的自動分析優化流程如圖5所示。

3 基于用戶群的高鐵專網斷點定位優化實踐

為說明本文所提基于用戶群的高鐵專網斷點定位方法的有效性,通過仿真和實際工作驗證了所提算法的性能。

(1)隨著用戶數增長,所提算法的準確率增高且逐漸接近于100%。

(2)以月為粒度,所提方法獲取的有效采樣點數高達百萬級,全面體現了用戶群共性問題;而傳統優化方法獲取的有效采樣點數為十萬級,只能體現測試機及所在位置。

(3)本文所提方法依托于現有數據采集平臺進行自動分析,幾乎無成本;而傳統優化方法需消耗大量人力、車輛費用、設備費用和話費,大中級地市每年優化成本近百萬。

由上述可知,本文所提算法能在消耗更少資源的情況下實現與傳統優化方法相近的效果。

為更好說明所提算法在實際工作中的效果,選取某高鐵試點應用。提取MR、信令等相關數據,參照基于大數據的高鐵群用戶優化方法識別高鐵用戶并整理篩查出專網問題,匯聚后自動分析并輸出優化方案?,F場驗證優化方案,智能分析準確率高達95%以上。詳細過程如下。

確定覆蓋某始發客站、某到達客站及沿線的高鐵小區清單。

查詢高鐵客運表該線路運營時段為7:30~23:59,兩車站間的運行時間為1 h。

提取連續3天的信令數據,統計某高鐵用戶約1.5萬人。

(4)提取相應時段高鐵用戶的MR數據,通過關聯信令數據獲得當時刻點的MR經緯度信息。

(5)與某高鐵小區匹配,共篩查出頻繁切入切出專網問題2 700多條。

(6)將切入切出專網問題點經緯度和10個初始聚合中心輸入K-means聚類算法,得到4個切入切出專網頻次較高的密集區域。

(7)把密度較高的4個區域內的小區問題按照自動分析優化體系進行分析,最終將問題定位為集中的6個高鐵小區的故障告警和參數設置不合理所致。

4 總結

基于大數據的優化方法數據來源廣、反映問題全、更貼近用戶真實感受,可有效挖掘網絡共性問題,解決用戶需求。相比傳統優化手段,數據采集自動化、數據分析自動化,大幅降低人力成本和提升工作效率。本文提出的網絡優化方法不僅適用于高鐵場景,也可用于高速、景區等區域特征明顯的場景,后續工作中可進一步推廣至其它場景。

猜你喜歡
專網高鐵聚類
高鐵會飛嗎
無線專網通信在武漢配電自動化中的應用
無線通信技術在電力通信專網中的應用
基于DBSACN聚類算法的XML文檔聚類
基于高斯混合聚類的陣列干涉SAR三維成像
人地百米建高鐵
2015年預測:逐步普及化的私有云
一種層次初始的聚類個數自適應的聚類方法研究
第一次坐高鐵
PTN在京津塘高速公路視頻專網中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合