?

云邊端融合的算網架構在智慧園區中的應用研究

2024-03-13 12:19宋今張河翔
信息通信技術與政策 2024年2期
關鍵詞:算力路由架構

宋今 張河翔

(1.中國移動通信集團有限公司,北京 100032;2.中國移動通信集團重慶有限公司,重慶 401121)

0 引言

當前,各地智慧園區建設如火如荼,人工智能(Artificial Intelligence,AI)、云計算、邊緣計算、大數據、物聯網、數字孿生等信息化技術在各類型產業園中持續應用。值得關注的是,智慧園區中信息化系統重復建設、“信息孤島”以及缺乏算力統一調度的情況并不罕見。近年來,隨著AI等技術的快速迭代,園區對各類AI大模型、通用視頻圖像分析、數字孿生等高算力要求的應用需求越來越大。因此,相對低水平的算網調度體系與越來越高的算網需求之間形成了新的矛盾,并已成為制約園區智慧化、數字化水平提升的關鍵所在。

本文認為,云邊端融合的算網調度體系將逐步成為突破智慧園區發展瓶頸的核心數字底座。中國信息通信研究院研究報告顯示,算力由云端加速向邊側、端側擴散,邊端計算能力持續增長。如何將智慧園區已有的云端算力、邊緣算力、前端算力進行聯通,同步實現算力與網絡結合,打造出云邊端融合的算網架構體系,成為事關新型智慧園區數字化轉型成敗的關鍵。

1 智慧園區算網現狀分析

1.1 園區特點分析

本文調研了分布于重慶、四川、浙江、寧夏4地13個不同類型(含工業類、科創類、醫療類、文旅類、港口類、物流類等)且處于建設中的智慧園區,發現在園區管理上普遍有占地面積大、入駐企業多、建設周期長、管理部門多、信息化需求大等特點,在園區信息化則面臨著算力和網絡需求大、數據協同難度大、需求種類多、重復建設多、“信息孤島”等問題。

1.2 園區算力需求分析

經調研發現,13個智慧園區的信息化需求存在共性需求和特色化需求,但最底層的算力需求基本趨同,即對算力的需求愈發旺盛,需要更智慧的算力網絡(見表1)。

1.3 園區算力現狀分析

本文分析13個智慧園區的算力現狀后(見表2),發現以下4個共性問題。一是園區普遍租用了不同云提供商的云服務;二是園區普遍具有可視化指揮展示中心,需要對數字孿生模型等進行渲染;三是園區各類自建小機房遍布,甚至一些弱電設備間也放置了服務器;四是園區終端側算力魚龍混雜,傳統終端和智能終端并存。

1.4 園區網絡現狀分析

網絡是實現智慧園區算力調度的基礎。調研發現,網絡的復雜現狀對實現園區數據協同提出了更高要求(見表3)。各園區網絡涵蓋類型復雜,包含內網、互聯網、電子政務外網、數據專線、固定電話、5G/4G網、無線局域網(Wireless Local Area Networks,WLAN)等。多數園區由于規劃不足,尚未實現“一張網”統領,且各種局域網、外網、專網協同不充分。此外,園區支持軟件定義網絡(Software Defined Network,SDN)及網絡功能虛擬化(Network Functions Virtualization,NFV)的智能化設備占比低,網絡智慧化程度不足,但是也有少數園區正在實現“一張網”統領,使用了支持SDN技術的融合網關類產品,園區網絡的智能調度初見雛形。

表3 園區網絡特點

2 云邊端融合的算網架構

基于園區越來越高的智能算力需求與算力和網絡普遍不足的現狀之間存在的矛盾,本文將進一步提出更適用于智慧園區未來各類智慧化需求的云邊端融合算網調度體系[2],研究以云邊端融合的算網架構助力園區現有算力和網絡,在新增投資有限的基礎上,用較小的升級改造成本提升園區智慧化水平[3]。

2.1 園區云邊端融合的算網融合架構關鍵技術

2.1.1 園區算力網絡基礎設施摸底及感知

對算力和網絡等基礎設施進行摸底、分類、感知,是搭建云邊端算網融合架構的基礎工作。常見的算力摸底及感知,應首先分析園區當前及規劃中的算力及網絡的基本情況(見表4),包括但不限于算力資源分布的位置在云端還是本地,算力適合通用計算還是專用計算,算力當前可用狀態及當前負載情況;網絡的承載形式、時延、帶寬利用率等。

表4 園區算力網絡等基礎設施摸底

2.1.2 園區算力度量及簡易標識

算力摸底后,需進一步對園區算力進行分類度量和標識[4]。通常,可根據處理對象不同,將園區算力分為通用算力和專用算力,同時在硬件層面也存在不同的異構芯片與二者對應,如CPU作為通用算力的代表更擅長進行常規計算,而GPU/DPU/TPU等專用算力代表更擅長AI計算等[5],需要區分對待。

解決異構算力的度量及標識問題是業界一大難題,但對于園區而言,其算力規模和算力需求相較大型云服務商和運營商的數據中心而言更加簡易,在算力的度量和標識上相對簡單。本文主要考慮園區普遍使用的通用算力(不考慮園區存在少量的異構算力),將基于X86架構的CPU算力和園區普遍需要的用于視頻圖像分析的GPU算力作為度量重點;將園區剛需算力的單位統一換算成每秒能完成的浮點運算次數(單位:FLOPS);并將其他諸如服務信息、位置信息、算力需求、帶寬需求等信息同時進行標注,為后續的算網解析以及不同節點間的調度提供依據。為確保這種園區簡易標識的有效性,一般需在園區規劃設計時進行明確。

2.1.3 云邊端算力協同

云計算、邊緣計算以及各類終端前置算力各有其特點和適應場景。如終端功能單一但能耗更低;邊緣側算力時延更低,可做到數據不出園區;云端則擁有強大的計算、存儲資源但位置遠離園區。云邊端協同可通過云上、邊緣、終端在算力上的互補,提升算力效率,但若“各自為戰”,或導致多數復雜應用場景無法實現,以及諸多資源浪費和重復建設問題。

在當前大部分園區都在降本增效的經濟背景下,實現云邊端融合的算力調度顯得迫在眉睫。云邊端協同后,園區的智能終端除可將感知數據傳給邊緣側外,還可根據指令直接進行簡易計算,效率更高;園區邊緣計算更接近應用現場、時延更低,可初步處理執行云端的下沉任務,同時又為云端篩選出更科學和更有價值的數據;園區云端可依托更豐富的算力、存力等,實現更優的業務應用模型構建和全局管理,如在進行AI深度學習模型的訓練時,將訓練好的結果下發到邊緣端,讓邊緣端更快速執行推理等動作,同時在云端進行海量和長周期的數據存儲、大數據的挖掘分析工作等[6-7]。

2.1.4 園區算力融合及簡易算力路由

算網融合是算力和網絡后續發展趨勢。與傳統網絡和傳統算力相比,算網融合后的算力網絡可同時分析算力開銷和網絡路由開銷,并依據網絡和算力兩個維度綜合判斷出最優調度規則,解決了傳統算力調度中“重算力、輕網力”的問題。算力網絡的一個關鍵技術是算力路由。早在2018年,中國移動就牽頭提出了“算力路由”的概念[8],并在標準制定和應用推廣方面取得重大進展。算力路由在以往單一網絡尋址的基礎上,疊加算力信息進行聯合路由,改變了傳統網絡的路由方式。但是,由于改造成本大、標準尚未統一等原因,當前算力路由尚未規?;占?。

然而,聚焦于園區更簡易的組網范圍(相較于運營商的龐大網絡而言),算力路由能以相對簡單的方式落地。實現園區級簡易算力路由主要取決于兩點。一是確保園區算力的協同。如前文所述,當前影響園區算網底座發展的一個核心痛點是園區算力分布復雜且算力協同不足。完成算網情況摸底后,需立即對園區網絡進行統一改造,實現各個算力節點的協同,如通過園區內網協同實現邊緣算力節點之間的協同,云專線實現邊緣節點與云端節點間的協同。二是應用基礎的算力路由技術??赏ㄟ^在園區關鍵節點添加算力路由器或者融合調度網關的方式來搭建園區級簡易算力路由體系(如圖1所示)。

圖1 園區算力協同及簡易算力路由示意圖

2.1.5 園區算力網絡簡易編排器

實現算力網絡的融合調度還需要一個“算網大腦”進行統一編排?!八憔W大腦”多見為運營商級別的核心算網融合編排系統。但對園區而言,其算力網絡相對簡易,沒有足夠資源及需求驅使其建立運營商級別的、完整的算網編排系統,因此,一種適用園區應用的簡易算力網絡編排器應運而生。這種簡易編排器是園區實現算網調度的中樞,可清晰展示出園區算力與網絡的分布、標識、狀態等信息,并通過簡易的算力路由進行調度,進而對整個園區的算力資源(包含租賃的云服務資源)進行統一的標識、解析及調度[9]。

當前,大部分園區尚無能力開發自己的簡易算網編排器,可暫時通過主流設備廠商提供的算網融合調度網關等硬件產品逐步展開簡易的算網編排調度工作,從手動編排的方式開始,逐步向訂單式編排甚至智能化編排的方向持續演進。

2.2 園區基于云邊端融合的算網架構

通過園區云邊端算力基礎資源摸底和感知、算力資源協同、園區級簡易算力路由、云邊端算力協同、簡易的算網融合編排器等系列技術的運用,一套基于云邊端融合架構的算力網絡調度架構基本成型(見圖2)。這個算網架構可獲取園區當前可用的算力、存力、網絡等資源以及其在云邊端分布情況,并可初步實現算力網絡的靈活調度[10]。例如,園區可結合具體應用需求,同時或分階段使用云邊端的算力資源,并根據不同的算力需求特點進行高效調度。同時,這種算網調度體系可根據當前可用算力的情況、網絡負載情況,動態地計算出更優調度策略,如實現先來先計算、最高優先級計算、保密計算、最低時延計算等。

圖2 云邊端融合的算力網絡調度架構

這種園區級云邊端算力網絡融合架構,可以根據園區自身算網基礎,采用手動調度、訂單式調度、智能化調度的方式實現。這些調度不是一成不變的,可根據業務屬性的不同保障等級、不同時延要求、不同頻率要求等進行動態調整。

3 云邊端融合的算網調度架構賦能某智慧園區

3.1 園區算網特點

以重慶某面積近10 km2、當期信息化投資約5 000萬元規模的智慧園區項目為例,本文進行了云邊端融合算網調度體系的應用研究及落地,在多個應用場景取得了較好的效果。該園區擁有1個邊緣數據中心、9個在不同時期配套信息化系統自建的小型數據機房、7種網絡承載形式(含互聯網專線、數據專線、5G專網[11]、物聯網等)。該園區也是國家級車聯網先導區組成部分和西部重要的科技創新示范高地。

3.2 園區改造后的基于云邊端融合的算網架構體系

首先,園區通過網絡改造實現了“一張網”統領,算力資源的全面摸底及統一的標識,并達成了云邊端算力資源全面的協同(見圖3)。

圖3 某智慧園區算力和網絡拓撲圖

同時,該園區充分考慮應用特點、算力實際情況、建設維護成本和未來擴展性等因素,將園區應用和云邊端算力進行精準匹配(見圖4)。根據終端是否具有算力,在終端側分別進行數據采集或簡易計算處理;在邊緣數據中心部署了一些關鍵系統,用于對實時性和保密性要求較高的數據進行處理,如GIS/BIM系統、視頻分析平臺、物聯網平臺等;在云端,則通過強大的算力等資源進行AI模型訓練、大容量數據存儲、海量數據匯集后的挖掘分析等。

圖4 某園區云邊端協同算力應用對應分布圖

3.3 園區基于云邊端融合算網架構的關鍵算網應用

通過算網融合調度,該園區聚焦痛點問題,實現了十幾項關鍵算網應用落地。如通過在本地邊緣數據中心部署輕量化的GIS/BIM系統,園區內可隨時隨地使用基于GIS/BIM系統的智慧規建等應用,低時延快速操作各種大型BIM模型文件(見圖5)。此外,在云端為該園區量身定制了科研政策AI分析器,每天自動抓取全行業政策性網站的公開政策信息,匹配不同科研需求向科研人員推送政策通知日歷,包括各類政策申報條件、起止日期等信息(見圖6),獲得了園區科研人員的一致好評。

圖5 在邊緣數據中心部署的GIS/BIM系統截圖

圖6 使用了云端算力的科研政策AI分析器截圖

同時,為針對性解決園區存在缺少帶算力的場景化智能攝像頭、本地邊緣側算力不足以及園區的視頻分析需求大且變動多的視頻分析痛點(見表5),園區建設了視頻圖像智能分析平臺。通過云端訓練、本地推理、終端感知的方式實現了云邊端協同的算網融合調度,以相對較低的成本實現了對園區圖像、視頻的快速分析處理(見圖7)。

圖7 視頻圖像智能分析平臺云端訓練、邊緣推理示意圖

表5 某園區視頻分析需求情況

當前園區實現了人員聚集、人員是否佩戴安全帽、按樓棟統計到訪人數等26種分析算法。視頻分析平臺算法及分析報警界面在園區應用情況如圖8和圖9所示。

圖8 某園區視頻智能分析平臺算法

圖9 某園區視頻智能分析平臺

未來,該園區將對部分云端AI訓練模型進行科學裁剪,在訓練提速同時,使其卸載至邊緣側時能更高效地實現推理分析等功能,更敏捷響應園區快速迭代的視頻分析訴求。

4 結束語

基于云邊端融合的算網架構充分發揮了算力調度、算網融合、云邊端融合、AI、大數據等技術的優勢,深入解決了園區當前普遍存在的算力分散、終端多樣、網絡復雜、應用眾多、協同不足等痛點,將智慧園區在多年建設中產生的分布在云端、邊緣側、終端側的存量算力資源進行協同,并實現統一管理。同時,結合簡易的算力路由、算網融合編排等技術,讓算力的調度更加靈活和高效。經實踐表明,云邊端融合的算網架構能夠助力智慧園區實現數字化轉型,并成為智慧園區降本增效、持續迭代優化的堅實數字底座。

猜你喜歡
算力路由架構
多方求解智能時代算力挑戰
這個第二不一般
衛星通信在算力網絡中的應用研究
基于FPGA的RNN硬件加速架構
中國電信董事長柯瑞文:算力成為數字經濟的主要生產力
功能架構在電子電氣架構開發中的應用和實踐
探究路由與環路的問題
LSN DCI EVPN VxLAN組網架構研究及實現
一種基于FPGA+ARM架構的μPMU實現
PRIME和G3-PLC路由機制對比
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合