?

面向大規模校園WiFi 網絡服務質量邊緣監控技術

2023-11-27 08:18沈佳杰沈敏虎向望趙澤宇張凱
關鍵詞:網絡故障探針管控

沈佳杰,沈敏虎,向望,趙澤宇,張凱

(復旦大學校園信息化辦公室,上海 200433)

0 引言

WiFi 網絡被廣泛應用于校園傳輸用戶網絡數據[1].通過分布式部署多個無線接入點,用戶可以在無線信號覆蓋范圍內接入校園網絡.由于WiFi 網絡具有較為復雜的傳輸協議,實時監控網絡運行狀態,在網絡發生故障時及時定位網絡故障的位置,成為保障WiFi 網絡正常運行的關鍵.校園WiFi 監控系統需要獲取在線運行的網絡設備性能,判斷當前的網絡運行狀態[2].然而,隨著WiFi 網絡規模的擴大和其承載應用類型的增加,現有基于網絡設備的監控方案難以滿足網絡運維人員對校園WiFi 網絡的精細化管控需求.

在監控大規模校園WiFi 網絡的過程中,網絡運維人員需要及時了解網絡運行的實時狀態,并根據網絡測試的需求定制測試樣本,高效完成特定的網絡測試任務.當網絡發生故障時,網絡監控方案需要快速定位網絡故障發生的位置,幫助網絡運維人員查明網絡故障發生的原因.構建面向大規模校園WiFi 網絡的邊緣監控方案將會面臨以下挑戰.1) 高效獲取網絡運行狀態信息.為保障用戶端設備能流暢地訪問各項校園網絡服務,網絡監控系統需要實時根據大量網絡探針設備返回的測試結果信息,分析WiFi 網絡用戶邊緣側的網絡服務質量.2) 快速定位網絡故障發生的位置.當網絡發生故障時,網絡監控方案需要及時定位WiFi 網絡發生故障的區域,分析可能導致網絡發生故障的網絡設備,快速排查導致網絡發生故障的原因.

為保障用戶端設備訪問校園WiFi 網絡的服務質量,本研究提出面向大規模校園WiFi 網絡的邊緣監控方案.根據用戶測試需求,使用容器技術將多個測試組件打包生成測試樣本,并將其分發到位于WiFi網絡各處的網絡探針設備,收集這些網絡探針的測試結果數據,監控網絡運行的實時狀態.當WiFi 網絡發生故障時,將本方案與網絡拓撲信息結合,以期高效定位網絡發生故障的位置,確定導致網絡故障的原因.本研究對WiFi 網絡監控領域做出以下貢獻.在此基礎上,實現原型WiFi 網絡邊緣監控系統,在復旦大學WiFi 網絡中分布式部署樹莓派單片機,將其作為無線探針設備,實時監控校園WiFi 網絡運行狀態.

1 WiFi 網絡監控和故障定位

1.1 WiFi 網絡測試與故障定位問題

圖1 為WiFi 網絡監控系統的示意圖.為保障網絡運維人員能準確掌握WiFi 網絡的運行狀態,網絡監控算法被廣泛部署到校園網絡.通過采集WiFi 網絡設備的運行狀態,WiFi 網絡監控系統能向網絡運維人員報告當前網絡的運行狀態.

圖1 WiFi 網絡監控系統示意圖Fig.1 Paradigm of WiFi monitor systems

然而,傳統WiFi 網絡監控系統難以復現用戶端設備出現的網絡間歇性故障.此外,在分析校園各處網絡設備性能的過程中,需要定期采集網絡設備的運行狀態,這將帶來額外的通信開銷,系統的WiFi 網絡性能因此降低.

1.2 WiFi 網絡監控系統的目標

為高效管控WiFi 網絡,網絡運維人員需要實時獲取WiFi 網絡的運行狀況,及時解決網絡故障問題.具體說來,WiFi 網絡監控系統有以下目標.

1) 準確獲取WiFi 網絡實時運行狀態.WiFi 網絡監控系統需要采集分布于WiFi 網絡各處的網絡設備所返回的測試結果數據,幫助網絡運維人員實時監控網絡的運行狀態,了解用戶端設備訪問WiFi 網絡的服務質量.

2) 快速定位WiFi 網絡故障發生位置.當WiFi 網絡發生故障時,結合網絡拓撲結構信息,WiFi 網絡監控系統需要準確定位網絡故障發生的具體位置,快速找到導致WiFi 網絡故障的原因.

1.3 相關工作

WiFi 網絡被廣泛部署到校園網絡,以完成各項智慧校園信息化服務.為實現智能化服務,WiFi 網絡提供多種不同的校園網絡服務,包括網絡接入服務[1]、校園人員定位[3]、室內人員定位[4]、人員流動感知[5]、人員聚集感知[6]、交通客流統計[7]、人流分類管控[8]、智能人員考勤[9]和路段空間平均速度檢測[10]等應用.在此基礎上,位置指紋定位[11]等技術被引入到校園WiFi 網絡中,用于改善在不同WiFi 網絡應用場景下的用戶服務質量.

為監控校園網絡運行狀態,采用多種監控方案來保障網絡服務質量,包括網絡主動感知[11]、流量特征分析[12]、虛擬接入網絡構建[13].為保障WiFi 網絡用戶接入服務質量,基于WiFi 網絡性能測試結果[14],大量研究工作致力于優化密集用戶接入WiFi 網絡環境下的園區網絡服務質量[15].在充分采集校園網絡流量數據的基礎上,研究學者使用WiFi 網絡日志數據來構建各種大數據校園信息化應用[16],包括學情分析、行為軌跡分析和離校預警等應用服務.

為提升WiFi 網絡承載的多種在線應用服務質量,網絡運維人員提出多種性能優化方案來保障網絡傳輸性能,主要研究問題包括信道能量分配優化[17]、蜂窩網聯合優化[18]、頻譜資源調度[19]、網絡服務質量預測[20]、協作頻譜感知和發射功率優化[21]、移動邊緣計算環境下WiFi 網絡計算卸載優化[22]和WiFi 網絡環境下人員定位技術[23].雖然已有大量研究工作優化無線WiFi 網絡性能,在大規模WiFi 網絡中依然存在網絡連接失效[24]等網絡故障問題.

為保障校園網絡系統的穩定運行,本研究提出面向大規模校園WiFi 網絡的邊緣監控方案,從而實現從用戶終端側對網絡運行狀態的實時監控.通過收集部署在WiFi 網絡各處網絡探針返回的測試結果,網絡監控方案能準確地獲取用戶端設備的網絡服務質量信息,快速執行網絡測試任務,定位網絡故障發生的位置,分析網絡故障發生的原因.

2 大規模校園WiFi 網絡的邊緣監控方案

2.1 基于容器的測試樣本分發方案

圖2 為WiFi 網絡測試樣本的生成和分發過程.為兼容不同類型的網絡探針設備,使用容器技術生成測試樣本,并將其分發至網絡探針設備,以滿足WiFi 網絡的測試需求.當用戶將測試需求發送到管控服務器,管控服務器會生成測試樣本,并將其分發到網絡探針執行測試程序.測試樣本分發過程包括以下步驟.1) 根據用戶提交的網絡測試請求,管控服務器從測試組件庫中選擇測試組件生成測試樣本,并將其緩存在本地存儲空間;2) 根據網絡測試需求對網絡探針進行分組,將已生成測試樣本分發到給定分組網絡探針設備,完成WiFi 網絡監控任務.

圖2 WiFi 網絡測試樣本的生成和分發過程Fig.2 Process of generating and dispersing test samples of WiFi networks

2.2 WiFi 網絡故障位置定位方案

當網絡探針設備發現WiFi 網絡故障時,本方案將定位WiFi 網絡出現故障的位置.圖3 為WiFi 網絡故障定位過程.通過采集WiFi 網絡覆蓋范圍內各個樓宇和區域的WiFi 網絡性能,能在以下方面查找網絡故障的原因.

圖3 WiFi 網絡故障定位過程Fig.3 Process of failure localization for the WiFi network

1) 收集部署在不同樓宇區域網絡探針設備返回的測試結果數據,據此監控WiFi 網絡的運行狀態,當校園WiFi 網絡發生故障時,及時定位網絡故障發生的位置.

2) 結合網絡拓撲信息,根據網絡探針返回的故障信息,分析導致網絡故障的原因,并將分析結果發送給網絡運維人員.

2.3 原型WiFi 網絡邊緣監控系統設計

圖4 為原型WiFi 網絡邊緣監控系統的軟件架構.由于復旦大學各個校區WiFi 網絡包括27 000 多個無線接入點,網絡探針設備分別部署于復旦大學邯鄲校區、江灣校區和張江校區,用于檢測校園網絡服務性能,分析WiFi 網絡運行狀態,定位網絡故障原因.WiFi 網絡邊緣監控系統包括以下部分.

圖4 原型WiFi 網絡邊緣監控系統的軟件架構Fig.4 Software architecture of the edge monitor system for the WiFi network

1) 分發測試樣本到網絡探針設備.邊緣監控系統接收來自網絡運維人員發送的監控請求,生成測試樣本,并將其傳輸到網絡探針設備.

2) 實時監控WiFi 網絡運行狀態.收集網絡探針返回的測試結果數據,并將這些結果記錄到本地存儲系統,以備網絡運維人員查詢.

3) 快速定位WiFi 網絡故障.當WiFi 網絡發生故障時,根據網絡探針返回的測試數據,及時向網絡運維人員反饋網絡故障信息.

3 測試實驗

3.1 實驗環境和參數設置

實驗使用1 臺配備雙10 Gbit·s-1網口(2×10 Gbit·s-1)管控服務器來負責測試樣本分發操作,并使用部署在復旦大學各處的20 臺樹莓派3B+作為網絡探針設備來執行網絡測試任務.網絡探針設備均通過千兆網口(1 Gbit·s-1)連接復旦大學各校區本地的校園接入網絡.管控服務器使用Docker 平臺作為容器鏡像的生成工具.在鏡像生成過程中,將特定數據量編制好的網絡測試程序通過Dockerfile 配置文件,復制預先準備的測試樣本鏡像文件,并統計鏡像文件生成所消耗的時間.為防止單次測試導致的誤差,本研究獨立執行10 次測試實驗,以獲取的平均值作為實驗結果.

為驗證本研究提出方案的有效性,將所提出的網絡監控方案部署至復旦大學校園網絡系統,監控WiFi 網絡的運行狀態,分析測試樣本分發操作和網絡故障定位操作的性能.

1) 測試樣本分發過程中包含測試樣本生成和傳輸兩個階段,因此,在測試樣本大小和網絡探針數量不同的情況下,分別測試邊緣監控方案的樣本生成和傳輸性能.

2) 在故障分析過程中,管控服務器需要向網絡探針設備發送測試樣本,接收網絡探針返回的數據,結合網絡拓撲結構,定位校園網絡故障.在網絡測試分析過程中,管控服務器需要向網絡探針寫入配置參數,讀取網絡測試結果數據.實驗將測試網絡探針數量不同的情況下,小數據量控制命令讀寫操作的性能.

實驗專注于測試邊緣網絡系統各項操作所消耗的時間,以檢驗所提出的邊緣測試方案的執行效率.這里設置默認測試樣本大小為100 MB,管控服務器到無線探針設備的讀寫數據量為16 KB.測試實驗主要統計以下兩項性能參數.

1) 消耗時間.將特定操作所消耗的時間記為執行時間.這里主要統計測試分發過程中測試樣本生成和傳輸消耗的時間,及在WiFi 監控過程中讀寫控制命令消耗的時間.

2) 吞吐率.在測試實驗中將單位時間處理的數據量記為吞吐率.由于測試樣本的分發過程涉及到多播操作,實驗將統計數據分發過程和數據傳輸過程中的吞吐率定義為網絡探針設備接收到的數據總量除以完成這些分發和傳輸操作所消耗的時間,將測試樣本生成過程中的吞吐率定義為生成的測試樣本數據量除以測試樣本生成操作所消耗的時間.

3.2 測試性能結果分析

測試邊緣監控系統分發測試樣本的性能,包括生成測試樣本和發送到網絡探針的執行效率,結果如圖5 所示.圖5(a)為測試樣本分發過程消耗的時間.隨著測試樣本數據量的增加,測試樣本分發過程中各部分的時間也將增加.在實際網絡測試過程中,網絡監控系統需要根據網絡測試需求,調整測試樣本所包含測試組件的數據量,從而快速完成網絡測試任務,滿足WiFi 網絡監控需求.圖5(b)為測試樣本分發過程的吞吐率.由于單臺樹莓派的網絡帶寬資源有限,測試樣本分發操作的效率受制于網絡探針設備的帶寬資源.為滿足網絡測試需求,管控服務器可以根據測試需求將必要測試組件打包生成測試樣本,保證網絡監控過程中測試樣本分發操作的執行效率.

圖5 傳輸數據量對測試樣本分發操作性能的影響Fig.5 Performance of dispersal process with different data volumes of test samples

在多個網絡探針設備同時存在的情況下,測試管控服務器分發測試樣本到網絡探針設備的執行效率,結果如圖6 所示.圖6(a)為網絡探針節點數量不同的情況下,測試樣本分發過程消耗的時間.隨著網絡探針數量的增加,管控服務器需要向網絡探針設備發送的數據量增加.因此,測試樣本分發過程和測試樣本傳輸過程需要消耗更多的時間.圖6(b)為網絡探針節點數量不同的情況下,測試樣本分發過程的吞吐率.由于管控服務器通常有足夠的網絡帶寬完成測試樣本的分發操作,隨著網絡探針數量的增加,數據傳輸操作和數據分發操作的吞吐率將增加.通過并行化分發測試樣本到網絡探針設備,本方案可以使用部署在WiFi 網絡邊緣的多個網絡探針設備完成測試工作,快速執行大規模WiFi 網絡測試任務,從而滿足預定的網絡測試需求.

圖6 網絡探針節點數量對測試樣本分發操作性能的影響Fig.6 Performance of dispersal process with different number of probes

3.3 網絡探針設備的讀寫開銷

由于在網絡監控過程中,管控服務器需要修改網絡探針設備的配置參數,并從網絡探針設備接收測試結果數據,用于分析網絡狀態.在此過程中,管控服務器需要向網絡探針設備發送小數據量控制命令讀寫請求.圖7 為網絡探針設備數量不同的情況下,管控服務器向網絡探針設備發送小數據量控制命令讀寫操作的性能.圖7(a)為小數據量控制命令讀寫操作消耗的時間.當前網絡探針設備使用小型存儲卡來保存用戶數據.在數據寫入的過程中,網絡探針的本地存儲系統需要分配存儲空間來保存新的數據,通常會受到磁盤I/O 瓶頸的影響,造成較大的數據寫入延時.圖7(b)為小數據量控制命令讀寫操作的吞吐率.由于控制服務器有充足的網絡帶寬資源,可以滿足多個網絡探針的并行化數據讀寫操作.隨著需要讀寫網絡探針設備數量的增加,小數據量控制命令讀寫操作的吞吐率也隨之增加.因此,本方案能支持多個網絡探針設備并行化執行WiFi 網絡測試操作,快速獲取網絡測試結果.

圖7 網絡探針設備數量對控制命令讀寫操作性能的影響Fig.7 I/O performance of control commands with different number of probes

綜上所述,面向大規模校園WiFi 網絡的邊緣監控方案能快速生成測試樣本,并發送到特定的網絡探針設備,執行特定的網絡測試任務.在此基礎上,本方案能快速寫入網絡探針的運行參數和讀取網絡測試結果,從而定位WiFi 網絡故障發生的位置,分析導致網絡故障的原因.

4 結語

提出一種面向大規模WiFi 網絡的邊緣監控方案.通過在無線網絡邊緣側部署無線探針設備,高效獲取當前網絡的運行狀態.通過使用容器技術,有效兼容不同類型的網絡探針設備.結合WiFi 網絡拓撲結構信息,快速定位網絡故障發生的位置.在復旦大學WiFi 網絡中部署該邊緣監控系統,結果表明,本方案能顯著提高測試樣本的分發效率,幫助網絡運維人員快速找出導致WiFi 網絡發生故障的原因,有效保障無線網絡服務的穩定運行.

為更加全面地分析WiFi 網絡的運行狀態,未來計劃通過管控大量網絡探針,提升WiFi 網絡測試效率,快速定位WiFi 網絡故障.

猜你喜歡
網絡故障探針管控
EyeCGas OGI在泄漏管控工作中的應用
多端聯動、全時管控的高速路產保通管控平臺
信用證洗錢風險識別及管控
VxWorks網絡存儲池分析在網絡故障排查中的應用
基于信息流的RBC系統外部通信網絡故障分析
多通道Taqman-探針熒光定量PCR鑒定MRSA方法的建立
Wireshark協議解析在網絡故障排查中的應用
BOPIM-dma作為BSA Site Ⅰ特異性探針的研究及其應用
失控還是管控?
透射電子顯微鏡中的掃描探針裝置
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合