?

超融合技術在鋼鐵企業生產過程控制系統中的應用

2024-01-11 10:20肖偲鈺
寶鋼技術 2023年6期
關鍵詞:架構服務器機組

柯 驥,肖偲鈺,程 曦

(武漢鋼鐵有限公司硅鋼部,湖北 武漢 430080)

《“十四五”智能制造發展規劃》指出,要以新一代信息技術與先進制造技術深度融合為主線,深入實施智能制造工程。在此指導思想下,某大型鋼鐵企業硅鋼生產廠在智慧工廠建設項目中,使用超融合系統作為硬件平臺,提高了生產過程控制系統的穩定性、安全性和可維護性,為提高企業生產效益、促進企業高速發展提供了堅實的技術保障。

超融合技術在銀行、教育、金融等行業得到了廣泛的應用,它將計算、網絡、存儲和服務器虛擬化等資源和技術進行整合,在增強計算能力的同時提高了網絡的吞吐量、降低網絡延時,并通過依賴分布式存儲、多重備份和冷熱數據分層技術提高了存儲穩定性和數據容災能力。因其成本、運維優勢,超融合也成為了大型現代企業的ERP、MES、大數據和桌面虛擬化等應用的理想承載平臺,但在生產控制系統中尚未有大規模應用。本文依據某大型鋼鐵企業硅鋼生產線的智慧工廠建設項目,在超融合技術應用于鋼鐵企業生產過程控制系統方面做了一定的探索實踐。

1 項目應用概況

某大型鋼鐵企業硅鋼生產廠于2019年至2022年間對機組的生產過程控制系統(簡稱L2)實施大規模改造,項目經過近3年的建設,建立了廠部L2集中機房,采用5組共25臺超融合服務器承載L2應用系統,優化L2的光纖網絡拓撲,實現基于超融合的物理隔離。目前項目已投用1年以上,整體運行穩定,滿足了廠部對于機組過程控制的需要,同時擴展了L2與無人天車、機器人、智慧工廠集控、大數據域等的接口,滿足智慧工廠建設需要。

下面就項目應用和實施經驗,對過程控制系統在硬件平臺的需求分析、技術選型、實施內容和實施效果等方面進行論述。

2 L2硬件平臺需求分析

生產過程控制L2系統在自動化、信息化、智慧化中具有重要地位,在傳統L1~L5層的企業信息化架構中,L2是控制系統(L1)與生產制造執行系統(L3)之間的橋梁,主要負責生產計劃接收、生產順序調整、模型設定計算、工藝指令下發L1、工藝數據采集、生產實績上拋L3等作業[1]。隨著智慧制造發展,傳統5層架構升級為工業互聯網體系,L2承擔了“云—邊”協同的邊緣執行任務,增加了實時數據上傳數據域、執行云端模型的優化指令、協同智慧制造設備完成智慧生產等實時性、運算量、模型化要求更高的任務。

本項目應用于冷軋硅鋼片生產線,生產線特點是生產時間長,例如酸洗和熱處理等主要生產線的生產頻率一般為1~3卷/h;在生產過程中要求溫度、張力、速度等控制工藝保持穩定,避免頻繁工藝調整;L2系統對硬件平臺及網絡的要求主要體現為高系統穩定性、一般通信實時性、高網絡安全性和智慧制造功能支撐等方面。

(1) 系統穩定性:L2系統要求硬件及網絡平臺7×24 h無間斷運行,故障時間小于2 h/a,檢修時間<2 h/次。系統穩定性是硬件平臺需具備的必要要素。

(2) 通信實時性:L2與L1間的通信頻率為秒級,網絡流量較小。以熱處理生產線為例,L2每秒接收一次L1發送的全產線位置表,每3~5 s接收一次L1發送的爐區工藝數據,單電文信息量最大可至800條/筆(6.4 K/s)。對于通信的穩定性和實時性要求較高,若發生通信斷開或延遲,會造成跟蹤錯誤和應用誤判。

(3) 網絡安全性:工控系統的通信網絡和傳統互聯網或局域網相比,在網絡質量方面的要求更高。一旦網絡攻擊、網絡流量異常增大等事件發生,將會造成生產線急停、產品報廢等嚴重損失。一般情況下不同生產線之間需做到網絡隔離,對于突發的網絡事件能夠預防和提前控制[2]。

(4) 智慧制造需求:L2服務器與機器人、無人天車、智能表檢、視覺識別裝置等均有數據接口,在網絡安全方面有較高要求;L2服務器采用定時或主動發送電文的方式將機組過程事件、秒級實時工藝數據上傳到大數據域,對服務器的CPU和內存消耗有額外增加。

3 超融合技術與傳統技術的選型分析

生產過程控制系統通常采用傳統技術架構,即服務器+存儲架構的模式,如圖1所示。傳統架構由單獨的硬件服務器、外置存儲設備、交換機、安全類設備、數據中心等堆砌而成,存在可靠性低、投入成本高、可擴展性低、運維復雜、上線速度慢等問題。超融合架構在通用硬件上不需要單獨的存儲設備(如NAS、SAN等),如圖2所示。在超融合集群中每個節點不僅僅包括計算、網絡、存儲和服務器虛擬化等資源和技術,而且具備管理監控、備份恢復、數據快照技術、數據除重、數據壓縮等功能,多個節點可以通過網絡聚合起來,實現模塊化的無縫橫向擴展(Scale-out),從而形成統一的資源池。

圖1 傳統服務器硬件系統圖Fig.1 Traditional server hardware system diagram

圖2 超融合服務器硬件系統圖Fig.2 Hyper-converged server hardware system diagram

以6條生產線L2的需求為例,對兩種技術架構的整體投入成本、業務可用性、穩定性、可擴展性及可維護性進行對比分析,結果如表1所示。

根據以上分析,超融合技術在成本可保證的情況下,其各項功能均要優于傳統技術方案。

4 系統架構實施及功能驗證

4.1 硬件及網絡架構

超融合服務器實施的難點之一在于網絡架構的設計,需針對不同的安全管控需求和業務擴展需求,采用合理的網絡架構。傳統單機組過程控制系統多采用物理隔離的方式,以L2服務器雙網卡和防火墻等方式與L1及L3通信;采用超融合服務器后,多個機組服務器在同一個物理網絡中,需要和不同機組的L1通信,且存在L1之間互通或L2之間互通的場景,網絡架構設計需同時考慮網絡互通和網絡安全。

網絡設計可分為三種:①物理隔離:各條產線L1、L2間無通信,物理鏈路完全隔離,見圖3。②邏輯隔離:各條產線L1、L2間有通信,物理鏈路共用,邏輯隔離,見圖3。③業務混用:各條產線L1、L2間有通信,物理鏈路共用,邏輯不隔離,不推薦。

圖3 超融合系統硬件及網絡架構圖Fig.3 Hyper-converged system hardware and network architecture diagram

項目采用物理隔離方式:每臺服務器配備7塊網卡用于與6條機組的HMI和PLC分網段聯通,采用2個網口聚合L3網絡為多機組共用,2個光口連接萬兆光纖交換機用于超融合服務器內部數據和管理網絡,虛擬機服務器使用物理網口聚合對外通信,實現6條生產線L2服務器和終端網絡的物理全冗余,避免因為個別設備的異常導致L2服務中斷。

全冗余模式下,每增加1條生產線,服務器需增加2個網口(L1PLC、L2HMI獨立);在半冗余模式下,L1PLC、L2HMI網口合用,服務器需增加1個網口。因此服務器可承載的機組L2數量,除受CPU、內存、硬盤和I/O資源限制外,還受制于單臺服務器的網口數量。

每組服務器承載的機組數量上限=(網口數量-1個管理口-2個L3口-2備用口)/2,約為10條機組。超融合服務器網卡布局如圖4所示。

圖4 超融合服務器網卡布局圖Fig.4 Network adapter layout of hyper-converged servers

4.2 網絡安全架構

工業控制系統的第一要素是安全,超融合技術由于集成需要,在網絡拓撲中出現了不同層級網絡的物理聯通。為了保障網絡安全,需要進行多種方式的聯合控制:

(1) 物理隔離方式:采用此架構的網絡具有較高的安全性,需配置防火墻點對點控制策略,杜絕不受控流量,重點防護終端和服務器的系統漏洞。

(2) 邏輯隔離方式:采用此架構的網絡具有較高的安全性,但安全策略較為復雜。機房匯聚交換機由于物理聯通了L1/L2/L3網絡,需將交換機按業務不同劃分虛擬網絡(Vlan),匯聚交換機劃分為L1、L2、L3三個業務網段,實現互相邏輯隔離,配備冗余交換機避免單點故障。對特別業務如防毒軟件更新等,將L3網絡的病毒服務器加入交換機Vlan的ACL表實現準入控制。

(3) 防火墻邊界控制:在L1-L2接入層和L2-L3接入層采用防火墻控制IP和端口策略;關閉常用病毒攻擊端口如445、135~139等;開啟IP白名單,僅允許服務器和終端互訪,避免網絡攻擊。

4.3 超融合云臺管理

超融合云端管理平臺全面覆蓋了運維管理的各項業務,具有一定的智能化運維能力,能有效降低運行故障和風險,提供包括物理機運行資源監控、虛擬機資源監控、虛擬網絡鏈路監控、網口通斷實時檢測等功能。云臺具備多種手段保障系統安全穩定運行:軟件定義可靠性避免硬件故障導致的業務風險,采用BPF技術檢測硬件健康狀態,發現問題及時對主機進行隔離;鏈路聚合對于網口離線、光模塊故障等直接導致單鏈路不可用的情況具有保護能力,可自動切換到冗余鏈路;采用多副本同時寫入的方式,實現業務高可用;在主機運維、替換或服務器性能下降時,可自動或手動熱遷移L2應用至其他主機,同時保障業務連續;基于存儲層快照方式,實現秒級在線備份;可掛載災備存儲盤,實現在線遠程災備。

4.4 功能驗證

系統運行一年期間,對各項指標和功能進行監控測試,結論如表2所示。

表2 各項指標測試內容及結論Table 2 Test content and conclusions of each index

5 實現的價值及思考

本項目在超融合技術用于鋼鐵企業過程控制系統中做出了探索。經過一年的觀察,超融合系統運行穩定、性能平穩,故障極少,總體取得了良好效果。超融合技術滿足了企業智慧制造要求,適合對穩定性及安全性有較高需求的場景。

在智慧制造中應用超融合技術應重點關注以下問題:

第一,平衡經濟性。超融合架構設備較少但單體設備價格較高,在超過6條機組的項目中,其經濟性方可體現,同時考慮到故障成本、維護成本和備件成本,超融合技術長期看比傳統架構有價格優勢。但在有大量設備利舊的場景中,超融合技術并未體現優勢。

第二,重視網絡安全。超融合技術帶來的硬件融合,同時也帶來了網絡安全問題,需考慮物理隔離、邏輯隔離和準入控制的綜合應用。

第三,橫向擴展性有限。由于網絡安全需要,服務器所需網卡較多,網線也隨著產線條數增多而幾何式增加,網絡維護復雜。在物理隔離全冗余模式下,每臺服務器至多能搭載10個需要網絡隔離的應用;采用邏輯隔離方式可增加一倍以上應用,但可靠性下降。

第四,超融合技術日前發展迅速,大部分廠家支持信創硬件和軟件,可實現本質化安全,支持AI服務器等超算力,這對于過程控制系統豐富邊緣計算能力,提升模型智能化具有重要支撐作用。

最后,由于超融合架構一般搭配虛擬化技術使用,因此不適合未采用虛擬化技術的IT應用系統,和不適合部署超融合架構的系統,例如使用非通用硬件的工業控制系統。

現代大型制造企業隨著智慧制造的推進,其傳統自動化和信息化的改造需求也逐漸增多,如果在項目建設中使用超融合架構,可實現業務快速部署、資源統一管理、設備故障率降低等目標,能有效降低企業總擁有成本(TCO),快速創造價值。

猜你喜歡
架構服務器機組
基于FPGA的RNN硬件加速架構
660MW亞臨界機組清潔疏水系統節能改造
功能架構在電子電氣架構開發中的應用和實踐
通信控制服務器(CCS)維護終端的設計與實現
LSN DCI EVPN VxLAN組網架構研究及實現
中國服務器市場份額出爐
得形忘意的服務器標準
計算機網絡安全服務器入侵與防御
一種基于FPGA+ARM架構的μPMU實現
350MW機組DEH控制系統的優化
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合