?

2024未來之路:大模型發展“十大機遇”

2024-04-22 06:33田豐
中歐商業評論 2024年1期
關鍵詞:算力開源芯片

田豐

商湯科技董事長兼CEO徐立強調:“在現在這個時間點上能不能用AI來命名時代,取決于它能不能把我們這個時代生產要素的成本規?;陆?,從而才能讓AI走進千家萬戶?!?024年伊始,商湯科技智能產業研究院梳理出“中國大模型高質量發展的十大機遇”,為企業家、創業者們點亮數字化轉型征程。

機遇一:智能基建重資產投入,發展空間巨大

大模型、大計算、大數據都具有重資產投入的發展特征。智能計算基礎設施在長周期建設過程中,具有“資本密度”“算力密度”“數據密度”持續增加的特征,目前投資總額尚具有極大提升空間,將不斷增強我國經濟的比較優勢。例如支撐生成式智能應用的智能計算中心資產規模日趨龐大,新型AIDC(AI Data Center)智能基礎設施通過高效整合能源、算力、訓練數據、大模型等新生產要素資源,為以智能經濟為核心的“數字經濟3.0”構筑護城河,支撐實體經濟生產結構的數字化轉型調整。

正如卡爾·馬克思在《資本論》中所說“基礎設施,即固定資本,是生產過程所必須的持久性條件”。1995年,美國“信息高速公路計劃”總投資額4 000億美元,占年度GDP的5.8%,開啟了全球互聯網“數字經濟2.0”浪潮,近年美國數字經濟年均增速超過6%,占GDP比重已超過10%,年度產值高達20 000億美元,并提供了5%的就業崗位。據國家發展改革委數據顯示,2022年開始,中國“東數西算”工程項目總投資額超過4 000億元,在國家年度GDP中占比不到1%,仍有加大基建投入的空間。IDC預計2022~2027年,中國智能算力規模復合增長率高達33.9%,是通用算力增速的2倍,且用于行業應用的推理算力從2024年出現“拐點”,首次超越訓練算力規模。2024~2027年,推理算力占比從67.7%提升至72.6%,而2025年中國數字經濟規模將首次超過實體經濟(GDP占比超過50%)。

經濟學理論中,新型社會基礎設施的重大意義在于促進技術進步、提高生產率、加速內生經濟增長,具有良好的“正外部性”與“網絡效應”。1955年出版的《經濟增長理論》一書中,經濟學家阿瑟·劉易斯認為“基礎設施投資對于經濟增長至關重要,因為它們為生產要素提供了有效的運作環境”。在2023年2月,國務院印發的《數字中國建設整體布局規劃》中明確:“數字中國建設按照‘2522的整體框架進行布局,即夯實數字基礎設施和數據資源體系‘兩大基礎,推進數字技術與經濟、政治、文化、社會、生態文明建設‘五位一體深度融合,強化數字技術創新體系和數字安全屏障‘兩大能力,優化數字化發展國內國際‘兩個環境?!?p>

數字中國建設,與“數字基礎設施互聯互通”“數據資源規模和質量”緊密相關。在中國“智能計算基建化、傳統基建智能化”的過程中,科技創新是推動經濟增長、社會基礎設施高質量發展的原動力。

機遇二:機器語言逼近人類語言,自然人機交互獲得全民用戶

基于大語言模型的對話式交互,降低全民對AI工具的開發與使用門檻,將極大刺激AI市場需求的爆發?!斑@場未來通信革命帶來的好處與難題將比上次個人計算機革命造成的好處與難題大得多?!北葼枴どw茨在1995年出版的《未來之路》一書中提道。

比爾·蓋茨認為大語言模型是“自圖形用戶界面以來最重要的技術進步”,我們應把大語言模型視為新一代人機通信革命(表1)。人機交互界面意味著人類指揮終端的效率和體驗,早期專業技術人員使用的命令行界面(CLI),是讓人說“機器的語言”;之后Windows和iPhone上受教育大眾使用的圖形界面(GUI),以人類操作圖形來控制機器;再到如今眾多模型、軟件采用對話式交互界面(CUI),讓機器、程序使用“人類的母語”(自然語言、方言)交流,包括多模態交互方式,讓冷冰冰的機器“擬人化”,變身數字人伴侶、生產力助手,走入服務行業,智商與情感的雙軌進步,讓AI突破“圖靈測試”,成為人類社會的“新成員”。

MetaAI在WhatsApp、Messenger、Instagram上有28位AI虛擬角色,與人類用戶社交,包括舞蹈愛好者、高爾夫職業球手、鐵人三項運動員、手工藝專家、健身房閨蜜、烹飪大廚、水手、破案偵探搭檔等虛擬人物。國內微博也上線了熱門電視劇《長月燼明》《狂飆》中的AI虛擬人物,與粉絲微博、私信互動交流。終有一日虛擬角色將從線上走入線下,“具身智能體”帶來的倫理影響頗值得深入研究。

機遇三:“智能云+智能端”協同計算,AI設備嵌入“小模型”

AI云負責訓練,AI終端負責推理,算力格局初顯。目前AI寫作、AI繪畫、AI編程、AI生成視頻、AI數字人、AI辦公助手、AI營銷助手、AI虛擬角色、智能駕駛等層出不窮的AIGC應用,預計將成為未來5年數字經濟的新動能。每一次模型應用都是一次推理計算,雖然單次推理算力成本很低,但數億用戶進行數億次推理時,推理算力的總成本將超過訓練算力總成本。伴隨爆款AIGC應用的出現,龐大的用戶訪問量持續推高推理計算成本,將帶來“AI云-AI端”的算力分工與轉移,英偉達、英特爾、ARM等芯片廠商,都在積極投入終端AI芯片產品研發,預計2024年消費電子市場上將會出現眾多嵌入AI芯片的智能增強型個人電腦、手機、AR眼鏡、家電等,“AI Everywhere”驅動的AI新終端,將會分擔一部分推理算力任務,減輕AI云負載。

小模型正在擁有大模型的效果,以及硬件終端算力的良好適配性與功耗,終端小模型與云端大模型組成混合AI架構,AI PC/平板、AI手機、AI機器人、AR眼鏡、AI可穿戴設備等一系列小型服務設備,也能跑得起壓縮版“大模型”,多端小模型將融合感知、任務協同、共享記憶,形成一體化的“群體智能體”(模型矩陣)。微軟27億參數量的Phi-2,性能與Google Gemini Nano 2 相當或優于后者。這要歸功于模型擴展和訓練數據管理方面的新創新。

機遇四:多模態大模型,成為“生產力遙控器”

多模態大模型降低生產成本,激活指數級市場需求。多模態語言大模型逐步成為智能終端的決策器,將開啟新一輪工業革命。我們把大語言模型視為新一代人機通信革命,當新一代“應用軟件”(AI模型)與新一代“硬件終端”(機器人、AR眼鏡等)加速融合后,下一輪工業革命大幕拉開。在供給側,基于大模型的智能體變成人類的“生產力遙控器”。

伴隨AI芯片嵌入智能車、智能機器人、智能AR眼鏡、智能家電等所有終端,人類個體在“人機協同”模式下能夠同時指揮的生產資料規模大幅上升,例如商湯用50 000條路線、30種天氣照明場景、280小時長的駕駛數據,研發出自動駕駛大模型DriveMLM。將圖像、激光雷達信息、交通規則、乘客需求等多模態數據輸入大模型,DriveMLM就能給出控制車輛的駕駛決策方案,并告訴你為什么要這么開(可解釋性),遇到沒有見過的場景時形成端到端的智能決策,將LLM語言決策輸出轉化為車輛控制信號,比如根據救護車、消防車、警車等特種車輛原因能夠主動變道讓行,也能夠在趕時間時主動靈活超車(表2)。

又如特斯拉正在研發2萬美元的擎天柱機器人,并最終搭載X.ai的大模型Grok,有望成為受工廠主、家庭主婦歡迎的“超級智能體”。斯坦福李飛飛教授團隊的論文、中國智元機器人公司的機器人產品同時展示出,沒有經過特定訓練的工業機器手,能夠通過視覺語言大模型,第一次就能實現復雜任務處理,體現出令人驚嘆的“柔性操作”能力,從大模型到AGI,新一代柔性生產模式正在顯現雛形。

高度自動化的“AI勞動力”在提升GDP的同時,將與各國人口數量脫鉤,與能源、AI研發實力掛鉤,這將徹底改變發達國家與發展中國家的供需模式和生產分工,同時人工智能產業的特點也會從高端人力密集轉向重資產密集。

機遇五:更便宜的AI芯片價格,將加速AIGC應用創新規?;瘮U張

AI芯片已成為AI從業者的沉重“稅負”,讓AI算力成本回歸社會公共服務的平民價格,是數字經濟3.0可持續發展的關鍵。市場上AI算力的稀缺為少數芯片制造商帶來巨大的市場控制權,并享受漲價帶來的高額利潤。據美國金融機構Raymond James透露,頭部AI芯片公司的利潤率可能高達1 000%。在《埃隆·馬斯克傳》中,馬斯克提出“白癡指數”,從第一性原理(物理學)出發,計算成品總成本與基本原材料成本的比值,如果一個產品的白癡指數非常高,則可通過設計更高效的制造技術來大幅降低成本,例如傳統火箭上一個組件的成本是1 000美元,而其鋁材料成本只有100美元,那么可能是因為設計過于復雜或制造工藝過于低效。雖然我們不知道GPU的生產成本,但從經濟學原理來看,在如此高額利潤的刺激下,更多低價格的競爭對手(含國產AI芯片)將會涌現,讓AI芯片回歸公共基礎設施的本質,因為水電基礎服務不會比金子更貴,在AI芯片架構研發與生產工藝創新中,更多價值將逐步從芯片釋放出來,向算力服務、模型服務、AI2.0應用轉移。反之,長期過于昂貴的AI芯片價格,會讓面向大眾市場(to Consumer)的所有AIGC創新應用因昂貴的“芯片稅”而衰敗,無法形成“數字經濟3.0”的創新浪潮。

機遇六:更便宜的能源,更大的模型產能

算力消耗的能源是另一半AIGC創新應用必須分攤的成本,持續降低的能源成本,對AI2.0應用生態健康良性發展至關重要(表3)。以Meta研發的語言大模型LLaMA為例,訓練LLaMA-65B (650億參數量,屬于中等規模)的耗電,以美國電價0.87元/度估算,需要約40萬元人民幣。而OpenAI的GPT-3耗電量高達1287兆瓦時,伴隨大模型參數量、數據量的上漲,能源支出成本將會急劇上升,產業鏈最終將成本分攤到每一個AIGC應用、AI for Science科研項目、智能制造系統上,引發AI2.0應用的“成本門檻”壓抑大眾創新需求。

大模型產業數據分析顯示,大語言模型的訓練成本中,電力費用占比高達65%。當“萬億參數量”的GPT-4,以及更大規模參數量的GPT-5到來時,能源與算力成本將會扭曲商業邏輯,或讓很多應用創業者望而卻步。例證是,微軟基于GPT-4推出的AI編程工具Copilot,每月用戶付費10美元,而微軟還要再“補貼”20美元給每個用戶,全年虧損超過一億美元,這是小型AI應用創業團隊所無法承受的。OpenAI CEO Sam Altman有感而發:“人類的未來,取決于低成本的AI,和它帶來的高效能源生產?!彼?,微軟與OpenAI都投資了Commonwealth Fusion Systems(美國)、ITERA(歐洲)的核聚變創新公司,同時與美國橡樹嶺國家實驗室、歐洲實驗室、大學、研究機構多方共同研發核聚變技術,以求不斷降低能源成本。

機遇七:跨語言、跨時空的全球知識傳播速度,史無前例提高

博古通今的大模型引發“知識生產力變革”,大模型是知識工程的生產力變革,天然具有跨領域知識的連接性。上一次知識革命是11世紀的畢昇發明的泥活字印刷術、15世紀的古登堡發明的鉛活字印刷術,讓人類千年歷史中積累的龐大知識工程通過印刷書籍形式推廣傳承,知識從手工抄寫到活字印刷,速度提升了118倍,自此浩瀚的知識源源不斷地從印刷作坊以令人驚嘆的速度向全球傳播,堪稱中世紀的“知識互聯網”。

在比爾·蓋茨的《未來之路》一書中提到,在古登堡印刷革命之前,整個歐洲大陸大約只有3萬冊書,幾乎都是《圣經》或《圣經》評注性著作,而到了1500年,各類題材的圖書猛增到900多萬冊。各種傳單和其他印刷物影響了政府、宗教、科學以及文學。宗教精英圈子以外的人士第一次有機會接觸到書面信息。據多方研究數據表明,大型語言模型顯著地提高了知識學習速度、知識檢索速度、知識傳播速度、知識推薦準確性,具有跨語言、跨學科領域、跨信源的獨特優勢。在人機協同模式下,大型語言模型將人類科學論文的閱讀時間縮短40%,知識搜索時間縮短20%,而這僅僅是ChatGPT出現一周年的“起點”,鑒于大型語言模型遠超人類的超高速學習能力,預計將在2026年學習完所有人類歷史上的高質量文本數據。人類的知識革命大幕剛剛開啟,高新科研、三大類產業、公共服務的知識型工作范式正在遵循“計算→數據→模型→服務”鏈條重構。

機遇八:每一次軟件革新,都孕育“新一代超級平臺”

大模型引發“軟件變革”,每一次軟件大革新,都會誕生新的超級平臺企業,顛覆原有的數字經濟霸主,從Windows、AppStore到GPTs都不例外,當前智能編程助手改變代碼生產流程,大型語言模型成為新一代AGI服務入口、軟件調度樞紐。20世紀90年代,未來學家雷·庫茲韋爾發現指數級發展的規律:“一旦技術變得數字化,即被編輯為0和1表示的計算機代碼,它就能夠脫離摩爾定律的束縛,開始呈指數級加速發展?!彼詳底纸洕忻恳淮壠脚_企業都是軟件創新型企業。例如商湯科技發布的“代碼小浣熊”Raccoon智能編程助手,覆蓋軟件需求分析、架構設計、代碼編寫、軟件測試等環節,支持中文、英文注釋生成代碼、跨編程語言翻譯、單元測試用例生成、代碼修正、代碼重構、編程技術知識問答,在Python等30多種主流編程語言與主流集成開發環境上,提升開發者編程效率超過50%,并在以71%的一次通過率刷新HumanEval測試集成績(GPT-4一次通過率為67%)。

預計未來人類程序員可以將80%的代碼量交由語言大模型編寫,人類開發專家的時間和精力逐步轉移到更具創新性和高價值的工作中,商湯稱其為軟件2.0時代的“新二八定律”。另外,多篇權威論文顯示,大型語言模型能夠面對復雜任務,靈活自動實現多軟件串行、多模型協同組合,例如AI Agent、MoE架構(Mixture-of-Experts)、綜合型智能客服、GitHub Copilot等,能在日常使用中跨模型共享成果、快速學習迭代、增強安全性與倫理性保障。在龐大AI算力規模、訓練數據集的基礎上,新一代AI原生軟件應用導致“傳統軟件智能化、智能軟件樞紐化”全面普及,尤其是那些能滿足目前還難以預知需求的新工具,作為“AI原生代”,我國青少年通過對新興生成智能軟件、輔助編程的學習,逐漸掌握MaaS模型化創新思維邏輯,并在未來十年將新型生產力軟件帶入每一個辦公室與家庭。

機遇九:新一代AI計算架構革新,即將到來

大模型成為社會型公共服務的前提,是“AI計算變革”。大型語言模型的Scaling Law(規模定律)指出,指數級算力需求與線性增長的區域基建投入之間存在矛盾,AI算力基礎設施將迎來大量技術工程創新,持續降本增效,普惠優勢讓AI真正成為賦能千行百業的通用型基礎設施,同時“百模大戰”變為AI產業專業化分工。

AI Now的《計算能力和人工智能》報告指出,早期AI模型算力需求是每 21.3個月翻一番,而2010年深度學習后(小模型時代),模型對AI算力需求縮短至5.7個月翻一番,而2023年,大模型需要的AI算力需求每1~2個月就翻一番,摩爾定律的增速顯著落后于社會對AI算力的指數級需求增長速度,即“AI超級需求曲線”遙遙領先于傳統架構的AI算力供給,帶來了AI芯片產能瓶頸、漲價等短期市場現象。

CSET(Center for Security and Emerging Technology)在AI and Compute報告中預測:“在計算價格沒有任何變化的情況下,尖端模型成本預計將在2026年6~11月超過美國GDP?!保▓D1)未來學家雷·庫茲韋爾認為,從1890年到現在,人類計算設備(單位時間)的運算能力一直在成倍增強,每當一項指數型技術(例如符合摩爾定律的芯片技術)的實用性達到極限時,就會有另一項技術取而代之。

所以,針對大模型高昂的訓練成本、有限的GPU供應量、芯片間通信瓶頸的核心挑戰,各國均采用大規模智能基建資源投入,并在AI芯片、智能算力集群、大模型架構、專用模型加速等技術棧環節創新突破,相信在未來3年通過一系列AI基礎設施技術革新,持續降低AI計算整體成本(采購、建設與運營),釋放出各行各業的生成智能全民應用創新能力,尤其是推理算力成本下降,對中國AI 2.0的大市場、大用戶量至關重要。同水電煤等平價公共服務一樣,人人用得起AI算力,人人訓得起AI數據,人人做得好AI模型。

機遇十:開源國產大模型,讓千行百業共享“普惠AI紅利”

“自由軟件之父”理查德·馬修·斯托曼認為軟件是知識,任何人都應擁有軟件的自由運行、自由修改、自由發布、自由分享的權利,很多軟件通過開源代碼方式實現部分自由權利。從信息時代開始,重要軟件都是以“閉源商業軟件”和“開源軟件代碼”形式共存的,例如PC領域的Windows與開源Linux、移動手機領域的iOS與開源Android、數據庫領域的Oracle與開源MySQL、云計算領域的AWS與開源OpenStack、大模型領域的GPT4與開源Lamma2。商湯科技智能產業研究院統計數據顯示,截至2024年1月,全球超過30多家AI研發機構已經發布超過120款開源大模型,包括語言大模型、基模型、多模態大模型等。

受企業級市場歡迎的開源大模型,往往比千億參數量的閉源大模型參數規模要小一些,十億級、百億級參數量的垂直領域中模型,適合部署在企業、工廠、高校等產業環境中,又不會消耗巨大的算力和能源(圖2)。例如2024年1月17日,商湯科技與上海AI實驗室聯合香港中文大學和復旦大學正式發布的開源大語言模型書生·浦語2.0(InternLM2),包括70億、200億兩種參數量,在數理、代碼、對話、創作等方面均達到全球開源模型的領先水平。有別于閉源市場的“百模大戰”,書生·浦語大模型向全社會開源,企業和開發者可免費獲得商用、科研授權。

林納斯定律(Linus Law)強調:“足夠多的眼睛,就可讓所有問題浮現?!彼?,既要看到開源大模型對低風險“普惠AI”的貢獻,也應辯證地理解國際復雜競爭態勢下自研國產開源大模型、建設全球開放性開源社區的必要性。

※※※※※

“上海人工智能實驗室在黃浦江畔,希望成為我國人工智能產業的源頭,為產業生態提供基座和支撐?!鳖I軍科學家林達華教授如是說。

猜你喜歡
算力開源芯片
多方求解智能時代算力挑戰
這個第二不一般
衛星通信在算力網絡中的應用研究
中國電信董事長柯瑞文:算力成為數字經濟的主要生產力
五毛錢能買多少頭牛
芯片測試
大家說:開源、人工智能及創新
開源中國開源世界高峰論壇圓桌會議縱論開源與互聯網+創新2.0
多通道采樣芯片ADS8556在光伏并網中的應用
開源計算機輔助翻譯工具研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合