?

大數據行程卡精準計算邊界漫游位置的研究與實踐

2022-11-17 01:24
江蘇通信 2022年5期
關鍵詞:話單漫游邊界

馬 聰 柏 勇

中國移動通信集團江蘇有限公司

0 引言

2020年初由中國工業和信息化部指導,中國信息通信研究院聯合中國電信、中國移動、中國聯通三家基礎電信企業共同推出的公益性行程查詢服務,通過大數據中心整合3家運營商提供的用戶手機所處基站位置數據,提供個人查詢前14天以內所到過國家及停留滿4小時的國內地市行程軌跡證明,為全國各地精準制定新冠疫情防控措施提供了技術保障。

通信大數據行程卡提供的位置查詢服務數據,來源于手機話單數據與信令數據,其中信令數據包含了用戶通信使用的基站位置信息。為了保障移動信號覆蓋無死角,當用戶處于行政區交界處時,會出現基站信號交叉覆蓋現象,從而造成行程結果的偏差。當前疫情常態化防控狀態下,行程卡作為全國民眾日常出行的重要憑證,每當部分區域發生疫情時,就會出現行程軌跡與實際不符的投訴工單突增。

本文重點從分析邊界漫游行程不準的投訴入手,因地制宜制定“三合一”行程碼優化方案,實現數據與算法的完美結合,提供更準確的技術支撐。

1 邊界漫游產生的原理

用戶處于行政區劃分交接地區,由于無線信號扇形傳播的特點,基站信號的覆蓋范圍難以與行政區劃的邊界完全吻合,用戶手機被兩地或兩地以上(省級或地市級)基站信號交叉覆蓋,這種現象稱為“邊界漫游”,如圖1所示。如果兩地信號強弱不同,就可能造成用戶實際定位處于A地行政區內,卻使用了B地行政區的基站信號,而產生邊界漫游話單或信令,信號覆蓋范圍受到天氣、地形、建筑等因素影響,會出現不穩定的情況,用戶手機位置將取決于哪一邊的網絡信號強。

圖1 邊界漫游示意圖

隨著各地網絡大規模建設與擴容,無法避免帶來部分邊界漫游地區,造成基站信號越界覆蓋的情況。為解決由于邊界漫游帶來的數據問題,移動計費系統會對處于邊漫區域的基站進行獨立標記,并對這些基站小區內產生的通信數據,根據應用場景重新處理。自取消手機國內長途漫游費與取消流量漫游費后,在邊界使用占用兩邊基站都是一樣計費,用戶不用擔心邊界漫游帶來的計費問題,但是,行政區劃之間有一條界限,在交界處手機能收到來自兩個地區的信號,這個問題一直存在,因此,當通信大數據行程卡使用通信數據作為定位依據,處于交界處的手機則可能出現定位不準的問題,使用戶對行程卡結果產生質疑。

2 通信大數據行程卡技術原理

通信大數據行程卡服務是通過客戶手機號碼通信數據計算,根據使用的基站信息識別,主要應用于個人用戶通過10086、二維碼、互聯網客戶端查詢本人手機號碼截至查詢時的漫游城市,用于輔助識別手機號持有人是否經歷疫區。

支撐系統首先匯總通信數據,進行初步的加工,使其具備統計條件,通信數據類型包括:語音話單、流量話單、手機信令等信息。

話單是指客戶原始通信記錄信息,又可稱之為詳單,以語音話單為例,主要記錄以下信息:流水號、用戶標識、主叫號碼、被叫號碼、起始時間、結束時間、通話時長、通話性質等關鍵信息。除語音話單之外,話單記錄的信息還包括V網、流量等其他類型,記錄格式與語音話單類似。用戶在通話或上網過程中,核心網網元記錄相關計費信息,并發送計費消息到計費系統,再由計費系統生成話單。有些核心網網元可以直接產生話單,并發送到計費系統或計費中心。

信令是指客戶手機與網絡的交互信息,通訊設備之間任何實際應用信息的傳送總是伴隨著一些控制信息的傳遞,它們按照既定的通訊協議工作,將應用信息安全、可靠、高效地傳送到目的地。為檢測客戶手機是否在網,即使客戶不打電話或上網,手機也會與網絡設備之間信息交互。信令包括:MC、MME、N1N2、VOLTE、CSFB等類型。

匯總數據后,進行數據準備工作:(1)選取與用戶行程信息有關聯的字段;(2)獲取省區內用戶T-1賬期的通信數據進行合并;(3)根據跟蹤區域代碼、位置區碼、蜂窩小區號,求取基站歸屬地市以及基站歸屬邊漫地市;(4)按所有話單開始時間、結束時間排序;(5)按相同基站歸屬地以及相同歸屬邊漫地市進行聚合。

通信記錄字段示意如表1所示。該模式下,用戶行為軌跡是根據其通信信息歸屬的行政區地域計算,而在邊界漫游區域中,存在終端信號漂移、通信基站歸屬模糊、位置駐留時間長短等干擾因素,導致最終結果精度不高,隨著疫情防控形勢逐步嚴峻,引發邊漫用戶投訴比例升高。

表1 通信記錄字段示意表

序號 字段名 說明2 USER_ID 用戶編碼3 MSC 移動交換中心4 RA 跟蹤區域代碼5 LAC 位置區碼6 CELL_ID 蜂窩小區號7 VISIT_AREA_CODE 到訪地8 START_TIME 開始時間9 END_TIME 結束時間10 …… ……

3 邊界漫游優化技術與實施

通信大數據行程卡邊界漫游的準確性取決于界定邊漫基站的準確性和計算用戶到訪地算法的科學性。

此部分詳細介紹了計算用戶在邊界漫游地區位置過程中的幾個重要方法。

3.1 邊漫基站參數調優

對于邊漫基站信號處理方面,設備既需兼顧邊界漫游基站的通話質量,又需實現基站位置的相對準確性,可通過合理調整雙邊基站的天線方向角,輸出功率等基站參數,增強B地的覆蓋場強,減弱A地的覆蓋場強,使用戶在B地更多占用B地基站信號。

3.2 邊漫基站打點調優

在邊漫基站科學識別方面,支撐系統可采用一套維護閉環管理流程,如圖2所示。

圖2 邊漫基站維護流程圖

第一步,支撐系統通過數據模型每周自動生成邊界漫游差異小區,模型設定用戶在短時間內基站在邊界地市切換的閾值,輸出邊界漫游疑似基站,再將計算數據與網絡部配置的邊界漫游小區的數據對比,并結合近期用戶投訴過的基站信息,綜合分析得出邊界漫游差異基站;第二步,交由網絡部對系統識別出的邊界漫游差異,進行地圖打點等全面的核查,經過專業的確認后及時修正數據,刪除無邊漫特征的基站。通過固化這套對邊界漫游基站的維護流程,可實現動態、及時地添加符合特征的邊漫基站,從而減少用戶行程爭議的概率,并建立良好的閉環管理機制。

3.3 全邊漫算法優化

對于用戶全天在全邊界漫游地區的情況,可采用以下規則計算:根據邊界漫游基站歸屬排序分別統計A與B地市的駐留集合時長,取A、B兩地駐留時長相對較長的地市作為整個邊界漫游到訪地歸屬。全邊漫用戶行程如圖3所示。

圖3 全邊漫用戶行程示意圖

求取全邊漫駐留集合時長的算法簡單說明如下:

(1)遍歷用戶當天的所有通信數據,當全天記錄均為邊界漫游,則分別計算出每條話單的時長,如果話單數據存在時長重疊的情況,則將后一條話單的開始時間減去前一條話單的開始時間作為前一天話單的時長。

(2)按照基站歸屬地市、基站所在漫游地市集合、時長進行匯總,相同的“基站歸屬地市、基站所在漫游地市集合”數據進行時長的匯總,得到集合結果數據。數據結構為:歸屬地市、漫游地市集合、時長,例如:0511-[025,0511] 2分鐘。根據匯總集合的結果數據,對每條話單的基站歸屬地市和邊漫地市進行時長判斷,采用時長更長的地市作為該條邊漫話單的到訪地。

(3)完成邊界漫游的更新后,再根據用戶詳單數據的開始時間、結束時間進行排序。相鄰為連續地市時,將數據進行合并,開始時間為該地市的最早開始時間,結束時間為該地市的最晚結束時間。地市數據排序后,如果出現前一地市與后一地市的時間產生交叉,則將后一個到訪地數據的開始時間作為前一個到訪地市的結束時間。

(4)得到集合列表,計算出用戶的連續地市時長。根據時長計算判定,完成后續數據加工、排重、翻譯等步驟,最終計算出用戶行程。

3.4 部分邊漫算法優化

對于用戶部分時間在邊界漫游地區內,部分時間在非邊界漫游地區的情況,采用以下規則計算:取有駐留時長絕對優勢的地市,作為邊漫話單的到訪地結果,即用戶駐留所在地域的時長遠比另一邊界地域長,則假設用戶出現在該地區的腹地(中心區),以減少邊漫話單的到訪地求取誤差。部分邊漫用戶行程如圖4所示。

圖4 部分邊漫用戶行程示意圖

求取部分邊界漫游時長的算法簡單說明如下:

(1)遍歷用戶當天的所有通信數據,當部分記錄為邊界漫游時,則分別匯總非邊界漫游基站時長和邊界漫游基站時長。時長按照地市匯總,存儲結構包括:歸屬地市、漫游地市集合、駐留時長。

(2)設定2個閾值:非邊界漫游地市時間差a、邊界漫游地市時間差b。閾值a、b根據30天內無投訴用戶邊界漫游地區駐留時長平均取整得到,在實際生產運營中可根據運營情況靈活調整。

(3)取通信記錄基站中邊界漫游集合,根據地市時長進行判斷并更新歸屬地市:在基站邊界漫游集合中,地市的非邊界漫游時長均為0,則取通信數據中包含基站漫游地市的最長時間地市作為基站歸屬地;在基站邊界漫游集合中,地市的非邊界漫游不為0,則計算最大時長和第二大時長差值,如果大于等于設置閾值a,取最大時長的地市作為邊界漫游基站地市;在基站邊界漫游集合中,地市的非邊界漫游最大時長和第二大時長差值小于閾值a,再判斷邊界漫游基站的地市時長,如果邊界漫游地市的最大和第二大時長大于差值,大于等于閾值b,取邊界漫游地市中最大時長的地市作為邊界漫游基站地市;在基站邊界漫游集合中,地市的非邊界漫游最大時長和第二大時長差值小于閾值a,判斷邊界漫游基站的地市時長,如果邊界漫游地市的最大和第二大時長大于差值,小于閾值b,邊界漫游基站地市取為未知地市(無法判斷)。

(4)完成邊界漫游數據更新后,進行非常駐地市剔除:如果基站的邊界漫游地市包含在常駐地市中,但判定結果地市不包含在常駐地中,則該條基站記錄到訪地判別為未知。

(5)最后進行投訴用戶地市剔除:如果基站判別地為用戶的投訴不認可地市,則該條基站記錄到訪地判別為未知。(6)輸出用戶基站歸屬信息,完成后續行程計算。

4 結束語

本文介紹了通信大數據行程卡的實現原理和邊界漫游投訴的產生原因,結合對邊漫投訴案例進行系統分析研究,分析出邊界漫游基站準確性與位置算法的影響因子,提出了因地制宜的“三合一”解決方案,實現對邊漫易引起的行程卡到訪地數據進行糾偏,從而保障用戶行程卡數據的準確性。通過長期的實際反復驗證與測試,行程碼邊漫投訴量有效減少了95%,萬投比降低至0.34,解決了疫情期間客戶投訴的實際問題。

隨著國內外疫情不斷變化,通信大數據行程卡的使用場景越來越多,傳統簡單基站判斷的方式已經很難解決用戶實際訴求。下一步系統將持續探索調優新思路,引入用戶主動上報的GPS定位數據,用于輔助判定邊界漫游位置,研究邊界漫游算法校準方法。通過科技革新,可實際解決群眾的行程數據邊界漫游投訴,從嚴從細從實做好常態化疫情防控工作,同時也體現了中國移動作為一家央企,用信息化手段助力疫情防控工作的企業社會責任。

猜你喜歡
話單漫游邊界
拓展閱讀的邊界
河北大名話單元音韻母、單字調及雙音節非輕聲詞連調的實驗語音學初探
意大利邊界穿越之家
論中立的幫助行為之可罰邊界
霹靂漫游堂
NASA漫游記
“偽翻譯”:“翻譯”之邊界行走者
GSM-R移動交換機ASN.1話單的解碼
GPRS按時長計費模塊的優化與應用
基于數據挖掘的CDMA2000移動網絡防盜用技術
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合