?

訓練ChatGPT需要消耗多少電力

2023-05-14 18:02伊燁然
計算機與網絡 2023年6期
關鍵詞:用電量數據中心芯片

伊燁然

微軟、谷歌和ChatGPT制造商OpenAI都要使用云計算,而云計算依賴于全球海量數據中心服務器內數以千計的芯片來訓練被稱為模型的AI算法,分析數據以幫助這些算法學習如何執行任務。AI已經重新成為科技行業的熱門話題,預計它將徹底改變從零售到醫藥等價值數萬億美元的行業。但每創造一個新的聊天機器人或圖像生成器都需要耗費大量的電力,這意味著這項技術可能釋放大量溫室氣體,進而加劇全球變暖問題。

與其他形式的計算相比,AI需要使用更多的能源,訓練單個模型消耗的電力超過100多個美國家庭1年的用電量。然而,雖然AI行業增長非???,但卻不夠透明,以至于沒有人確切知道AI的總用電量和碳排放量。碳排放量也可能有很大差異,這取決于提供電力的發電廠類型,靠燒煤或天然氣發電供電的數據中心,其碳排放量顯然高于太陽能或風力發電支持的數據中心。

雖然研究人員已經統計了創建單一模型所產生的碳排放量,有些公司也提供了有關他們能源使用的數據,但他們沒有對這項技術的總用電量進行總體估計。AI公司Huging Face研究員薩莎·盧西奧尼寫了一篇論文,量化了她旗下公司Bloom的碳排放情況,Bloom是OpenAI模型GPT-3的競爭對手。盧西奧尼還試圖根據一組有限的公開數據,對OpenAI聊天機器人ChatGPT的碳排放情況進行評估。

提高透明度

盧西奧尼等研究人員表示,在AI模型的電力使用和排放方面,需要提高透明度。有了這些信息,政府和公司可能會衡量使用GPT-3或其他大型模型來研究癌癥治療或保護土著語言是否值得。

更高的透明度也可能帶來更多的審查,加密貨幣行業可能會提供前車之鑒。根據劍橋比特幣電力消耗指數,比特幣因其耗電量過大而受到批評,每年的耗電量與阿根廷一樣多。這種對電力的貪婪需求促使紐約州通過了一項為期2年的禁令,暫停向以化石燃料發電供電的加密貨幣采礦商發放許可證。

GPT-3是功能單一的通用AI程序,可以生成語言,具有多種不同的用途。2021年發表的一篇研究論文顯示,訓練GPT-3耗用了1.287 GWh電量,大約相當于120個美國家庭1年的用電量。同時,這樣的訓練產生了502 t碳,相當于110輛美國汽車1年的排放量。而且,這種訓練只適用于一個程序(或者說是模型)。

雖然訓練AI模型的前期電力成本巨大,但研究人員發現,在某些情況下,這只是模型實際消耗電力的40 %左右。此外,AI模型也在變得越來越大。OpenAI的GPT-3使用1 750億個參數或變量,而其前身僅使用了15億個參數。

OpenAI已經在研究GPT-4,而且必須定期對模型進行再訓練,以保持其對時事的了解??▋然仿〈髮W教授艾瑪·斯特魯貝爾是首批研究AI能源問題的研究人員之一,她說:“如果你不對模型進行再訓練,它甚至可能不知道何為新冠肺炎?!绷硪粋€相對的衡量標準來自谷歌,研究人員發現,AI訓練占該公司總用電量的10 % ~15 %,2021年該公司的總用電量為18.3 TWh。這意味著,谷歌的AI每年耗電量達2.3 TWh,大約相當于亞特蘭大所有家庭的1年用電量。

科技巨頭做出凈零承諾

雖然在許多情況下,AI模型變得越來越大,但AI公司也在不斷改進,使其以更高效的方式運行。微軟、谷歌和亞馬遜等美國最大的云計算公司,都做出了碳減排或凈零承諾。谷歌在一份聲明中表示,到2030年,該公司將在所有業務中實現凈零排放,其目標是完全使用無碳能源運營其辦公室和數據中心。谷歌還在使用AI來提高其數據中心的能效,該技術直接控制設施中的冷卻系統。

OpenAI也列舉了該公司為提高ChatGPT應用程序編程接口的效率所做的工作,幫助客戶降低了用電量和價格。OpenAI發言人表示:“我們非常認真地承擔起阻止和扭轉氣候變化的責任,我們對如何最大限度地利用我們的計算能力進行了很多思考。OpenAI運行在Azure上,我們與微軟團隊密切合作,以提高運行大型語言模型的效率并減少碳排放?!蔽④浿赋?,該公司正在購買可再生能源,并采取其他措施,以實現之前宣布的目標,即到2030年實現凈零排放。微軟在聲明中稱:“作為我們創造更可持續性未來承諾的一部分,微軟正在投資于研究,以衡量AI的能源使用和碳排放影響,同時致力于提高大型系統在培訓和應用方面的效率?!?/p>

耶路撒冷希伯來大學教授羅伊·施瓦茨與微軟的一個團隊合作,測量了一個大型AI模型的碳足跡。他表示:“顯然,這些公司不愿透露他們使用的是什么模型,以及它排放了多少碳?!?/p>

有些方法可以讓AI更高效地運行。能源咨詢公司Wood Mackenzie的本·赫茲·沙格爾表示:“由于AI訓練可以隨時進行,開發者或數據中心可以將訓練安排在電力更便宜或過剩的時候,從而使它們的運營更加環保。AI公司在電力過剩時訓練自己的模型,然后在營銷中將其當成一大賣點,以此表明他們注重環保?!?h3>芯片運行耗電量驚人

大多數數據中心使用圖形處理單元(GPU)來訓練AI模型,這些組件是芯片行業制造的最耗電組件之一。摩根士丹利分析師早些時候發布的一份報告稱,大型模型需要數萬個GPU,培訓周期從幾周到幾個月不等。

AI領域更大的謎團之一是與所使用芯片相關的碳排放總量。最大的GPU制造商英偉達表示,當涉及到AI任務時,他們的芯片可以更快地完成任務,總體上效率更高。

英偉達在聲明中表示:“與使用CPU相比,使用GPU來加速AI速度更快,也更高效。對于某些AI工作負載來說,能效通??梢蕴岣?0倍,對于生成式人工智能必不可少的大型語言模型,能效則可提高300倍?!?/p>

盧西奧尼說:“雖然英偉達已經披露了與能源相關的直接排放和間接排放數據,但該公司并沒有透露更多細節。她認為,當英偉達分享這些信息時,我們可能發現GPU消耗的電量與一個小國用電量差不多,這可能會讓人抓狂。

猜你喜歡
用電量數據中心芯片
02 國家能源局:1~7月全社會用電量同比增長3.4%
01 國家能源局:3月份全社會用電量同比增長3.5%
酒泉云計算大數據中心
民航綠色云數據中心PUE控制
1~10月全社會用電量累計56552億千瓦時同比增長8.7%
芯片測試
多通道采樣芯片ADS8556在光伏并網中的應用
基于云計算的交通運輸數據中心實現與應用
2014年全社會用電量
Overlay Network技術在云計算數據中心中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合