周 燕 賴彩明 中國聯通江西省分公司云網運營中心 南昌市 330000
主叫呼叫視頻炫鈴用戶時,炫鈴平臺與主叫終端間進行媒體會話更新流程(音頻改視頻),網絡處理200與UPDATE發生亂序,觸發491,亂序主要是消息處理時延、核心網消息轉發機制、終端消息傳送間隔三個因素疊加產生。
通過對現場反饋的信令碼流進行分析,出現異常的呼叫出現在視頻彩鈴流程中。因為視頻彩鈴業務流程的引入,主叫側需要連續發送200OK(UPDATE)消息和UPDATE消息,均攜帶SDP。如圖1所示。
圖1 中31步為資源預留完成后,被叫側視頻彩鈴業務向主叫終端發送了視頻彩鈴的UPDATE消息,終端收到此UPDATE 消息后,向被叫側依次發送36 步200OK(UPDATE)消息和37步UPDATE消息。這兩條消息,進入核心網時的間隔時間非常短,經過多個網元轉發后產生亂序,收到亂序消息的網元會針對亂序的UPDATE回復491 響應。圖2 是從vMax 導出的全網碼流,IBCF(91.200)收到亂序的UPDATE消息回復了491。如圖2所示。
圖2 亂序碼
根據RFC3311協議定義,在發送攜帶SDP Offer請求消息的情況下,再收到對端的請求消息攜帶SDP Offer。此時需要發送491響應,對于收到491的一端,需要定時重發請求來解決沖突。如圖3所示。由于200OK(UPDATE)消息和UPDATE 消息在這一流程中發送間隔較小,經過多個網元轉發后產生亂序,協議也定義了收到亂序的網元發送491,終端收到491后重發UPDATE即可解決此問題。
圖3 RFC3311針對491的定義及處理流程意見
從現場信令分析此場景,大部分終端收到491后能夠重發UPDATE,使呼叫接通,極少部分終端不能正常處理發送CANCEL。
綜合分析,SBC 返回200OK(UPDATE)消息和UPDATE消息間隔較小的原因是SBC到PCRF rx接口流程時延過長,大于同大區的江蘇和浙江;VIMS核心網大區化后,承載網CR設置與大區中心不匹配(山東、河南、江蘇),造成大區內信令消息無法從接入省直接送達大區,需要經過大區外承載網CR中轉,而接入省和大區中心網元信令交互數量巨大,本案例中SBC 轉發UPDATE前與PCRF交換的RX消息就需在江西IMS、江西EPC、江蘇DRA三者之間diameter消息流轉4個,數據包在江西與南京之間經上海CR轉接,共傳遞8次,承載網總耗時約80ms(單次10ms),核心網設備處理開銷約40ms,由此延誤了SBC返回200OK(UPDATE)消息并造成200OK與UPDATE消息傳至核心網亂序產生491。承載網拓撲路由如圖4所示。
圖4 承載網拓撲路由圖
圖5 IMS主叫平均接續時長圖
(1)應急方案
EPC上針對號段修改基于簽約接入融合SMF,使4G用戶通過大區PCF網元進行RX流程,測試結果顯示該方案可以優化30 毫秒左右時延,可以有效規避491問題,省內已部署5地市全號段基于簽約接入融合SMF,已成功解決5地市問題終端掉話問題。
(2)優化方案
省內根據集團要求開通江西-南京承載網直達鏈路,業務路由直達后江西到南京承載網環回時延降低6ms左右,SBC發收AAR/AAA間隔降低約23ms,SBC主叫時延優化60ms左右,省內因491錯誤碼導致的失敗數量下降50%。
(3)長期方案
從以下幾方面協調核心網廠家進行功能優化。
◎SBC版本優化,收到200消息后不等AAA,立即轉發200消息,200與UPDATE間隔加大約80ms。
◎PCRF/PCF 版本優化,收到AAR 消息后不等RAA,立即響應AAA,200 與UPDATE 間隔加大約40ms。
◎研究IMS網絡和視頻炫鈴平臺對收到亂序消息糾錯處理機制,減少網絡側發出491消息。
目前江西聯通已實施了以下幾個措施,成功解決了491流程沖突問題,同時優化VoLTE主叫平均接續時延超過300ms。
(1)承載B 網省內AR 直連江蘇AR 的路由改造工作。
(2)EPC上針對全部省內號段修改基于簽約接入融合SMF,通過大區PCF網元進行RX流程。
(3)SBC開啟主叫RX流程不等位置信息。