?

端口聚合失敗引發的網絡故障

2020-11-13 05:10江西劉秋根
網絡安全和信息化 2020年11期
關鍵詞:網絡故障環路交換機

■ 江西 劉秋根

編者按:筆者單位因斷電進行網絡改造,卻引發了網絡故障問題,該問題是因端口聚合配置不當,以致在特定情況下產生的網絡故障。

去年5 月份,筆者單位完成了業務網核心網絡設備的更新以及核心交換機到各樓層交換機主干網絡的光纖改造工作。

更新后,兩臺新核心交換機采用IRF 堆疊技術,代替了原來的VRRP+STP 雙核冗余技術,優化了網絡結構,提高了性能。各樓層交換機均分別與兩臺核心交換機連接,通過采用端口聚合技術,能夠避免網絡環路,增加帶寬提高可靠性。

但在去年11 月中發生的一起由停電引發的網絡故障,暴露了因端口聚合配置不當在特定情況下也可能產生網絡環路的問題,引發其他網絡故障,值得引起關注。

故障產生過程

由于供電設備檢修,去年11 月13 日上午9 點筆者單位市電停電,過幾分鐘后改由單位發電機供電。9 點半左右,筆者陸續接到單位業務網網絡時通時斷,訪問速度很慢的報告。例如,打開單位主頁,有時候都會無法訪問。經檢查,單位業務網確實出現了問題,Ping 單位服務器和業務網網關均出現明顯丟包現象。

故障排查處理

剛開始接到網絡問題報告時,筆者以為是個別現象。在檢查了問題終端的配置、網卡和網線等都工作正常后,筆者排除了終端本身問題。更換連接終端的樓層交換機端口,故障問題依舊。

是否是終端所在樓層交換機的問題呢?比如存在環路等。筆者斷開了該樓層交換機連接核心交換機的一條線路,但問題依舊,丟包甚至更嚴重。進一步檢查該樓層交換機配置參數和日志,都沒發現問題。

隨著接到故障報告數量的增多,我們檢查了數個樓層的終端,顯示網絡故障問題都相同,因此確定是整個局域網的問題。

由于單位樓層到核心交換機主干網光纖改造工作完成不久,而且是在市電停后發電機供電時出現的故障,筆者懷疑是發電機供電不穩定,導致各樓層交換機光收發器工作不穩定。筆者到機房檢查配電柜和UPS,發現UPS 出現報警提示“旁路相序發生錯誤”。

是否真是發電機供電引起的問題呢?經過查找資料和咨詢廠家,排除了供電問題。

接著,筆者登錄核心交換機檢查配置參數和日志,在使用“display logbuffer”命令檢查日志記錄時,發現有如圖1 所示大量的告警信息,基本上是2 s 一條。

這些日志表示核心交換機開啟了STP_DISPUTE 保護功能,聚合鏈路組Bridge-Aggregation17 收到了指定端口發出的低優先級BPDU,且發送端口處于forwarding或learning 狀態,從而觸發STP_DISPUTE 保護,阻塞了端口以防止環路。通過使用“dis stp abnormal-port”命令可以顯示阻塞端口,如圖2 所示。

很明顯,是聚合鏈路組Bridge-Aggregation17 所連接的樓層交換機出了問題,使得網絡出現了環路,以致影響了整個局域網絡。筆者通過斷開聚合鏈路組Bridge-Aggregation17 的其中一條線路,STP_DISPUTE 保護告警信息消失,單位局域網網絡恢復正常訪問。

故障原因分析

經過查找,發現聚合鏈路組Bridge-Aggregation17所連接的樓層交換機為一樓交換機,放置在門衛監控室。為什么該交換機工作好好的,突然就出問題了呢?

通過登錄一樓交換機檢查配置,筆者發現其中的端口聚合配置丟失,還原成了5月份業務網核心網絡設備的更新前的配置。這應該是在更新完成時忘記保存配置導致的,而監控室平時不斷電,直到這次停電才使得新配置丟失。在樓層交換機上增加如圖3 所示端口聚合配置并保存,問題得到解決。

圖1 檢查核心交換機日志記錄發現大量的告警信息

圖2 查看阻塞端口

圖3 在樓層交換機上增加端口聚合配置

核心和樓層交換機都配置了STP,并且核心交換機能夠發現并阻塞環路,為什么還會影響整個局域網呢?

我們分析原因,可能有以下兩點:

一是單位核心交換機為H3C S7506E-X,Comware為Version 7.1.070,樓層交換機大部分為H3C S2626,Comware 為Version 5.20.99。端口聚合大部分配置為推薦的動態聚合,但不知為何核心聚合鏈路組Bridge-Aggregation17 配置的是默認的靜態聚合。而靜態聚合出現故障時不會自動刪除,只能手工刪除,對端樓層交換機沒有了聚合配置,聚合建立失敗,所以網絡出現環路,產生廣播風暴。

二是核心交換機的H3C V7 平臺支持STP 端口的DISPUTE 保護功能,而樓層交換機的H3C V5 平臺不支持STP端口的DISPUTE 保護機制,因而DISPUTE 保護功能沒有正常發揮作用。

猜你喜歡
網絡故障環路交換機
面向未來網絡的白盒交換機體系綜述
高密度城市核心區地下環路功能及出入口設置研究
外差式光鎖相環延時對環路性能影響
局域網交換機管理IP的規劃與配置方案的探討
更換匯聚交換機遇到的問題
基于地鐵交換機電源設計思考
選取環路切換策略的高動態載波跟蹤算法研究*
計算機網絡幾種典型故障的處理及維護方法
A330火警環路故障分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合