[古秋錦]
在無線網絡優化中場景中,導致用戶質量感知投訴的原因是多樣的,主要包括覆蓋、容量、干擾、故障等。一般情況下,基站射頻設備、主控板、基帶板等硬件設備出現嚴重告警時,操作維護平臺都會及時發現并處理[1]。然而,對于這些硬件設備出現一些隱性故障時,將很難被發現,直接導致無法及時修復故障問題,從而出現大面積用戶感知異常,一直以來都是一個網絡優化研究的難點。
結合相關問題,現分別從單小區/整站共性問題確認、傳輸問題排查、參數變更/故障原因排查、上/下行網絡鏈路問題確認以及最終問題根因確定等5個步驟,介紹一種4G站點主控板隱性故障的排查方法[2]。
以 “深圳金鑾國際E-HLW”站點為例,根據主覆蓋區域用描述的無法進行數據業務和語音業務情況,用五步法進行排查。對問題小區進行KPI指標統計發現:“深圳金鑾國際E-HLW-1”從4月10日開始,4G無線接通率、上行用戶平均體驗速率以及Volte丟包率明顯劣化,與投訴時間點相匹配[3],如表1所示。
結合相關問題,對“深圳金鑾國際E-HLW”站點開展單小區/整站共性問題確認、傳輸問題排查、參數變更/故障原因排查、上/下行網絡鏈路問題確認等排查,最終問題根因確定、五步法進行排查[4]。
首先,統計“深圳金鑾國際E-HLW”整個站點所有小區4月初的“VoLTE上行丟包率”、“上行用戶平均體驗速率”明顯出現同步劣化。綜上,該投訴非單小區異常,屬于共站小區的共性問題[5],如圖1、圖2所示。
圖1 VoLTE上行丟包率變化
圖2 上行用戶平均體驗速率變化
接著,結合網管相關“E-RAB建立失敗”原因統計中,傳輸資源不足、傳輸層問題導致的次數都是0次,初步排除由于傳輸問題導致整站小區的劣化,如表2所示。
表2 深圳金鑾國際傳輸指標變化
同步在網管確認,“深圳金鑾國際E-HLW”站點小區指標劣化期間,無參數調整記錄、站點無影響業務的歷史告警。
結合問題小區 RRC失敗的原因集中在“UE無應答而導致RRC連接建立失敗次數”、“其它原因導致的RRC連接建立被拒絕的次數”兩個原因值?!吧钲诮痂巼HE-HLW-1”小區RRC失敗和E-RAB失敗原因值統計[6],如表3所示。
表3 深圳金鑾國際接入指標情況
空口“UE無應答”信令跟蹤截圖,如圖3所示。
圖3 UE無應答信令跟蹤
查詢“深圳金鑾國際E-HLW-1”小區“下行MR覆蓋”為98.60%左右,在指標劣化情況時無明顯劣化情況,相關指標如圖4所示。
圖4 深圳金鑾國際下行MR覆蓋
查詢“深圳金鑾國際E-HLW-1”小區“上行干擾平均值和最大值”在指標劣化前后明顯發生變化,干擾變強了8 dB左右。相關指標如圖5所示。
圖5 深圳金鑾國際上行干擾變化
綜上,初步判定空口“UE無應答”信令主要由于終端收到RRC CONN SETUP消息,并發出RRC CONN SETUP CM消息后,由于上行質量異常、基站側無法接收到相關消息,導致RRC連接“UE無應答”超時[7]。
進一步查詢,深圳金鑾國際E-HLW-1小區PUSCH上弱覆蓋占比、平均值、最大值等指標,在投訴出現前后均明顯劣化,如表4所示。
表4 深圳金鑾國際投訴前后指標變化情況
從上/下行PRB利用率差值來看,“深圳金鑾國際E-HLW-1”小區上行質量異常,導致上行數據重傳較多、上行PRB利用率明顯大于下行PRB利用率現象,如圖6所示。
圖6 深圳金鑾國際上/下行PRB差值
將“深圳金鑾國際E-HLW”站點的“時鐘檢測增強開關”設置為ON后,站點同步出現主控板(UMPT)單板硬件故障告警。詳細截圖如圖7所示。
圖7 深圳金鑾國際重要告警查詢結果
綜上,“深圳金鑾國際E-HLW”站點小區語音業務、數據業務使用異常的投訴,主要是由于主控板(UMPT)單板硬件故障,引起上行鏈路質量突發劣化導致[8]。
4月24日,維護同事現場更換“深圳金鑾國際E-HLW”站點主控板后,整個站點小區“上行干擾電平”、“上行PRB與下行PRB差值變化”、“上行RTP丟包”、“無線接通率”和“上行速率指標”等指標均恢復到投訴出現之前的水平,達到預期優化效果,回訪投訴用戶均得到數據業務和語音業務感知均恢復正常的回復[9],詳細優化前/后各項指標對比,如圖8、圖9、圖10、圖11、圖12所示。
圖8 上行平均值、最大值優化對比
圖9 上行PRB與下行PRB差值變化對比
圖10 上行RTP丟包對比
圖11 無線接通率對比
圖12 上行速率變化
同類問題點如深圳南光城市花園,現場測試負1樓、負2樓停車場室內4G小區占用“深圳南光城市花園E-HLW-1”,終端信號RSRP在-78~-92 dBm左右,下載速0.22 Mbit/s,上傳速率0.12 Mbit/s,上傳下載速率慢,無法正常通話,用戶感知差[10]。
按照 “五步排查法”進行隱性故障分析,最終定位亦是由于站點“深圳南光城市花園E-HLW”主控板(UMPT)單板硬件故障,導致用戶上/下行速率感知異常引起投訴。經更換板件后,“深圳南光城市花園E-HLW-1”小區各項感知指標恢復正常,投訴問題得到解決,達到預期效果,如表5所示。
表5 深圳南光城市花園換板前后指標
在無線網絡優化中,若無線基站硬件設備出現一些隱性故障時,將很難被發現,直接導致無法及時修復故障問題、出現大面積用戶感知異常,一直以來都是一個網絡優化研究的難點。結合4G站點主控板存在隱性故障導致周邊用戶感知差投訴問題,針對性的從單小區/整站共性問題確認、傳輸問題排查、參數變更/故障原因排查、上/下行網絡鏈路問題確認以及最終問題根因確定等5個步驟,形成一種4G站點主控板隱性故障的排查方法。同時,同步對全網同類問題進行排查和應用,應用效果明顯。