?

內蒙古地區數據中心熱量管理的挑戰和對策

2024-03-26 04:19李丹陽白麗麗姜靜清
關鍵詞:東數內蒙古地區液冷

宋 杰,李丹陽,白麗麗,姜靜清

(1.東北大學軟件學院,遼寧 沈陽 112000;2.內蒙古民族大學計算機科學與技術學院,內蒙 古通遼 028043)

作為“東數西算”工程的重要實踐地區,內蒙古數據中心的綠色經濟運行的相關研究廣受關注。數據中心的相關研究主要分為節能和性能提升兩方面。數據中心的熱量管理一方面可以從減少制冷能耗的角度節省能源,另一方面熱點均衡可以促使數據中心的性能提升,因此內蒙古地區數據中心的熱量管理對于該地區數據中心的可持續發展尤為重要,然而現有研究通常面向理想的數據中心,未能考慮內蒙古地區的實際情況。筆者分析內蒙古地區數據中心產業在熱量管理上所面臨的挑戰與困難,尤其對整體空間布局、建模與控制策略和仿真實驗平臺等進行重點分析,并從區域實際情況出發,提出對策建議。

1 內蒙古地區數據中心熱量管理研究的意義

在2020年9月召開的第75屆聯合國大會上,習近平主席提出了“二氧化碳排放力爭于2030年前達到峰值,努力爭取2060年前實現碳中和”的“雙碳”目標[1],中共中央、國務院印發的《數字中國建設整體布局規劃》更是著眼于數字化產業的穩定性。為了實現“雙碳”目標和數字中國,2022年3月,中華人民共和國第十三屆全國人民代表大會第五次會議提出,實施“東數西算”工程?!皷|數西算”工程是把經濟發達的東部地區(如上海、杭州等地)高度集中的算力需求有計劃地引導到經濟較為落后的西部地區(如內蒙古地區)?!皷|數西算”工程將算力作為資源,把數據作為生產要素,讓算力與數據跨域流動,打通算力資源的地域局限,既緩解了東部能源緊張的問題,也給西部能源豐富、經濟落后的地區開辟一條新的發展之路?!皷|數西算”不僅優化了數據中心的算力和供能結構,還促進了東西部協同聯動。

內蒙古自治區大數據發展管理局數據顯示,作為“東數西算”工程的重要實踐地區,目前內蒙古地區數據中心服務器裝機能力超過100萬臺,居全國首位,具有巨大的研究潛力。盡管全自治區數據中心的總裝機量超過35 萬臺,綜合利用率超過40%,數據中心市場化程度大幅提升,但仍有很大的發展空間。熱量管理可以實現溫度場平均分布、減少熱點、降低制冷能耗[1],為實現“雙碳”目標和數字中國開辟了新的思路。

2 內蒙古地區數據中心熱量管理的相關研究

數據中心溫度分布不均勻是數據中心運行中必然產生的現象[2]。在實現“雙碳”目標和數字中國過程中,內蒙古地區數據中心的熱量管理面臨許多挑戰。內蒙古地區數據中心對“雙碳”目標和數字中國的支持情況見圖1。從靜態環境的角度分析:由于硬件設備的局限性和空間布局等不可變因素,會造成數據中心的熱量在某些節點或某些位置積累[3];從動態環境的角度分析:數據中心所處的外部環境,如溫度、濕度、日照、風力等,會周期性地發生改變。這些會使數據中心的散熱能力并不完全恒定,而數據中心內部的服務器的利用率會隨著用戶任務的變化而變化[4],這也會使數據中心熱點產生的位置難以控制,因此大量研究均聚焦于數據中心的硬件設備、空間布局和數據中心相關環節建模對數據中心熱量的影響。

圖1 內蒙古地區數據中心對“雙碳”目標和數字中國的支持Fig. 1 The support of Inner Mongolia regional data center for the“double carbon”target and digital China

為了消除數據中心的熱分布不均現象,通常會對數據中心的硬件設備進行布局優化并對其調控方法進行優化。數據中心的熱量管理包括對服務器和空調的更新與排布,或對溫度、氣流等物理參數進行管控等[5],為了驗證模型和控制方法的合理性和有效性,研究人員通常會使用一些模擬平臺對所提方法進行測試[6],下面具體分析現階段的相關研究進展。

2.1 內蒙古地區數據中心的硬件設備與空間布局

數據中心最主要的用電設備是提供算力的服務器及其所需的制冷設備[7]。服務器的型號和機架的空間布局直接影響服務器工作時的散熱效果,對數據中心熱量管理有較大的影響。制冷設備根據制冷方法分為空調、風扇和液冷等3種方式[8]。

通常情況下,數據中心在規劃投建之前就已經由專業人員根據現場情況、地理特性和算力需求等確定了服務器型號、機架的位置和制冷設備的種類。根據內蒙古地區獨有的自然環境,多采用空調制冷搭配冷水液冷的機制。事實上,由于內蒙古地區可再生能源較為豐富,空調的用電量和液冷的布局策略較為欠缺。隨著“東數西算”和數字中國的不斷發展,對電力和低碳的需求也將日益增加,內蒙古地區數據中心內部的硬件設備和空間布局策略也將面臨挑戰。

2.2 內蒙古地區數據中心的建模與調度策略

在研究數據中心熱量管理時,制冷模型、熱量模型、功率模型和負載模型是最為關鍵的模型[9]?,F有研究對這些模型已有較為完善的分析和說明,但是由于制冷方式的獨特性和東部數據負載的靈活性,現有的制冷模型、熱量模型和負載模型并不完全適用于內蒙古地區的數據中心??紤]到內蒙古地區的能源特性和制冷機制,其調度策略也將更加靈活和豐富,內蒙古地區數據中心的建模與調度策略同樣面臨挑戰。

2.3 數據中心熱量模擬的方法和平臺

由于真實的數據中心環境難以獲得,研究人員廣泛使用模擬實驗來評估熱量管理方法。許多文獻都使用知名的模擬器來評估他們的工作[10],如CloudSim、Matlab、6SigmaDC 以及廣泛使用的Fluent,具體占比見圖2。

圖2 最新的數據中心研究中包含各種模擬器的比例Fig. 2 The proportion of each inclusive simulator in recent studies on data center

這些現有模擬器在對數據中心熱量進行模擬時,大體分為3類。第1類著重數據中心運行狀態模擬,在其中加入熱模擬工具包,如CloudSim,第2類使用數據中心的運行結果著重熱量模擬,如Fluent。它們都不是針對數據中心熱量模擬而開發的專用模擬平臺。第3類將數據中心的熱量模擬完全轉化為數學問題,使用如Matlab一類數學模擬平臺進行模擬。數據中心熱量模擬平臺,需要根據數據中心的運行狀態的變化對數據中心內部的熱量變化進行模擬。開發一個用于模擬數據中心熱量的模擬平臺,不僅是研究內蒙古地區數據中心的需求,更是未來解決數據中心熱量管理相關難題的途徑。

3 內蒙古地區數據中心熱量管理的應對策略

數據中心的可持續發展,一方面是能源的可持續性,另一方面是數據中心規劃和建設的可持續性。綠色可持續數據中心的建設涉及建筑物主體的規劃和布局、散熱冷卻材料的篩選制備、供配電系統優化降低損耗和安全控制系統更新升級等一系列技術。建設一個綠色可持續的數據中心,需加大科研投入和多領域共同發展,從相關材料的研究與創新,到適配服務器的各項硬件設備和軟件方法的升級,各個關鍵環節都需同步推進。要組建有內蒙古區域特性的核心技術科創產業鏈,有側重地突破技術壁壘,打破各個產業之間的瓶頸,牢牢把握創新發展主動權,促進綠色數據中心設備的研發、生產、建造,實現自主產業化,提升數據中心行業核心競爭力。

3.1 優化數據中心設備布局,合理規劃散熱冷卻機制

內蒙古地區數據中心根據自身的地理位置,分布確定了散熱冷卻設施的類型和方法,并提出了適時技術應用方案。由于內蒙古地區獨有的溫度及能源環境特征,助力了風冷技術與液冷技術協同發展,又由于內蒙古地區可再生能源發電能力充沛,并且地價低廉、空氣清潔,滿足新風制冷環境要求,適合配備新風制冷設備,符合綠色高能效發展趨勢,但由于空氣本身熱導率低,不利于高功率密度的服務器的制冷,從成本角度出發,內蒙古地區數據中心還應盡量多采用液冷設備作為制冷設施。

在我國,服務器的液冷設備研發仍處在起步階段,采購成本偏高、渠道少。其中,液冷服務器冷卻介質成本高是液冷服務器不能大規模推廣的最重要原因。同時,數據中心所需電子元器件的兼容性低等問題也十分嚴峻。對此,一方面要提升液冷相關設備的改進與研發;另一方面,也要針對液冷和空氣制冷結合的研發思路,提出優化調控策略,實現雙管齊下。

3.2 注重清潔能源利用,優化運行調度策略

數據中心內部服務器常進行大規模的數據存儲與運算,因此數據中心屬于高耗能產業。內蒙古自治區具有充沛的風能、光伏,利用這一類可再生能源產生的電能可以充分應用于數據中心之中[11],助力數據中心的可持續建設。由于可再生能源發電具有間歇和不穩定的特點,優化數據中心的能源供應來源和供能比例是實現數據中心節能降碳直至碳中和的關鍵??茖W的調度方法可以優化數據中心的電力結構,逐步提升“綠電”的比重,是數據中心綠色可持續的必經之路。此外,數據中心在計算耗電的同時也會產生大量的余熱,研究人員可以考慮將數據中心產生的余熱進行二次利用,如為冬季供暖提供熱源,或與轉化為其他種類的可用能源進行循環利用。

3.3 開發數據中心熱量模擬仿真平臺,助力數據中心熱量管理產業健康發展

理想的數據中心熱模擬器應該是功能齊全且易于應用的,筆者對未來的模擬器提出了展望。

3.3.1 注重數據中心運行狀態模擬

數據中心熱研究的趨勢,從靜態環境轉向動態運行狀態調整。僅研究靜態數據中心會隱藏數據中心熱設計的一些缺陷,導致中心運行時無法根據動態數據(如工作負載、資源使用情況和功耗)進行優化。如果研究人員改變服務器的資源使用分布,熱分布也會相應改變。數據中心模擬器應該充分突出資源管理功能,以支持這種趨勢。

3.3.2 具備輕量級的熱模擬

在數據中心的熱模擬中,需要反映各個部分的熱環境,它如何隨運行而變化,優化效果如何,這是需要解決的一個問題。熱分布不一定在時間和空間上以非常細的粒度進行建模和模擬,例如不能期望資源調度器能夠立即顯著地影響熱分布,因為運行狀態和熱條件都不穩定。復雜的CFD 計算通常需要強大的計算資源來模擬詳細和實時的熱動力學狀態,這種對靈巧性和硬件需求會大大增加投資成本,但模擬結果可能對研究沒有實際意義。理想的模擬器應該具備輕量級的熱模擬,在時間和空間上粒度都很粗,易于建模和執行,對硬件的要求更少。

3.3.3 具備人工智能集成仿真功能

人工智能已經改變了世界,并在社會、經濟和治理方面取得了重大進展。在許多領域,人工智能可以讓人、社區、機器和計算機協同工作,并做出巨大的改進。綠色數據中心的人工智能熱管理通常利用神經網絡對數據中心內部溫度進行預測,可以提前對溫度進行限制,達到良好的熱平衡。人工智能可以輕松實現其他方法難以實現的目標,因此理想的模擬器應該集成AI,例如它可以支持流行的人工智能平臺,支持深度神經網絡和深度強化學習等人工智能模型的部署和執行環境。人工智能集成模擬器使研究人員能夠在模擬案例中運行基于人工智能的優化。

3.3.4 具備大規模異構跨區域數據中心模擬能力

一方面,異構數據中心可以將各種計算資源聚集在一起;另一方面,將跨區域數據中心連接起來,形成一個聯合體,可以高效地為跨區域提供服務。

4 總結

數據中心的熱量管理是技術問題,更是實現我國東西產業區域平衡和數字經濟發展的重要路徑。筆者從區域特性和科研技術相結合的視角闡述了內蒙古地區數據中心熱量管理的意義,分析了內蒙古地區數據中心的發展現狀及存在問題,具體從硬件設備、空間布局、調度方法以及仿真平臺等方面提出應對策略,為實現“東數西算”提供具體路徑,希望對實現“雙碳”目標和數字中國起到指導作用。

猜你喜歡
東數內蒙古地區液冷
厭氧膠在液冷板缺陷修復中的工藝技術
制動器液冷控制系統模糊控制策略
東數西算
“東數西算”能為我們算出怎樣的未來
“東數西算”,億萬藍海
“東數西算”全面啟動
第十三屆中國音樂金鐘獎內蒙古地區選拔賽
航天服的液冷服有什么用?
航天服的液冷服有什么用?
內蒙古地區蒙古族常用野生植物相關傳統知識研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合