?

“百模大戰”之后,國內AIGC產業“大浪淘沙”

2024-03-05 03:43金姬
新民周刊 2024年8期
關鍵詞:文心算力人工智能

金姬

上海交通大學人工智能研究院副院長馬利莊告訴《新民周刊》,國內的不少AI大模型其實是拿了國外公開的成果做微調和修改,大多以應用層面為主,而不是具有開創性的基礎大模型,這并不是一個好現象。

從ChatGPT到Sora,AIGC(AI-Generated Content,“生成式人工智能”)無疑是這兩年的科技頂流。在國家語言資源監測與研究中心發布的2023年度“十大新詞語”中,“生成式人工智能”赫然居于榜單,可見這一技術對于中國的影響力。

AIGC,是指基于預訓練大模型、生成式對抗網絡(GAN)等人工智能技術,通過已有數據尋找規律,并通過釋放泛化能力生成相關技術的內容。簡而言之,AIGC是基于算法、模型、規則生成文本、圖片、聲音、視頻、代碼等內容的技術。其中,大模型對于AIGC尤為重要。

2023年,中國AI界掀起了一場“百模大戰”——據統計,2023年前11個月,國內發布了238個大模型,幾乎平均每天都有一個大模型問世。但很多大模型只是“看上去很美”。

上海交通大學人工智能研究院副院長馬利莊告訴《新民周刊》,國內的不少AI大模型其實是拿了國外公開的成果做微調和修改,大多以應用層面為主,而不是具有開創性的基礎大模型,這并不是一個好現象?!按蠹s五六年前,其實中國的AI科學家不比美國少,但現在雙方的差距已經拉大了,很可惜?!?/p>

業內普遍認為,算力、算法和數據是一款大模型研發的三大核心要素,缺一不可。

最近,OpenAI被曝出單月收入超20億美元,但仍處在虧損狀態,可見成本之巨大。這是因為大模型要發揮出能力,需要龐大的數據和算力,這些都很燒錢。而據微軟統計,光是GPT-3.5在Azure AI超算基礎設施上消耗的總算力就需七八個耗資30億美元投資規模的數據中心來支持運行。

對于國產AI大模型而言,算力是一個關鍵問題。近年來,隨著“東數西算”、算網融合等發展,全國算力網絡正在加速建設,算力正在成為AI競爭的新焦點,也成為數字經濟發展的新引擎。我國算力產業規模排名全球第二,僅2022年增長率就已經接近30%。

盡管如此,在日趨激烈的競爭中,各家企業對算力的巨大需求仍然難以滿足。更有不少業內人士直言:缺乏強大的芯片等算力支持,是制約我國AI大模型發展的一大瓶頸。

科大訊飛董事長劉慶峰則認為,未來大模型的發展方向將不是一味地增加更大的算力和更大的模型,而是把各個子模型聯動起來,并通過提升算法來優化其能力。

當前AI算力競爭的主戰場之一在云計算。中國工程院院士鄭緯民在2023移動云大會上指出,國內云計算產業存在三方面突出問題:從核心技術的角度來看,云計算的硬件技術自主可控性仍是薄弱環節;從生態構建角度來看,云計算的互操作性成為影響構建統一生態和發展創新的瓶頸;從行業應用的角度來看,公有云上行業應用類型單一是突出問題。

在算力層面,從頭部互聯網企業到人工智能公司都在積極籌備,大模型的算力需求也讓國內云計算市場重新活躍了起來,僅以2023年4月為例——

2023年4月14日,騰訊云正式發布新一代高性能計算集群,算力性能和上一代相比提升3倍,服務器接入帶寬從1.6T提升到3.2T,是目前國內性能最強的大模型計算集群。

2023年4月18日,字節跳動發布大模型訓練云平臺,包括自研DPU等系列云產品,推出新版機器學習平臺,支持萬卡級大模型訓練、微秒級延遲網絡,彈性計算可節省70%算力成本,主要為大模型公司提供算力支撐等服務。

2023年4月19日,云知聲智能科技股份有限公司與優刻得科技股份有限公司達成了戰略合作,聯合打造融合AIGC、算力、存儲等軟硬件功能的私有化智能算力平臺。

另一個讓業內擔憂的問題是AI大模型的污點數據。對于預訓練大模型而言,多模態的數據集至關重要,以此才能讓模型學習到更加完備的表示。AIGC經過反復專業訓練和數據積累,生成答復內容的準確性、個性化將逐步提升,屆時再分辨將難上加難。因此,由AIGC引發的人類數據庫“污染”問題是漸進式的,隱蔽性強,危害性不易被察覺。

除了“污染”人類數據庫,AIGC暗藏的另一個問題就是“自噬”。換言之,知識生成的過程是倒退而非前進的。

根據最新研究,將由人工智能生成的內容反饋給同類模型訓練,可能導致模型質量下降甚至崩潰。這種自我吞噬現象被科學家們稱為模型自噬。研究人員指出,雖然AIGC算法在圖像、文本等領域取得了巨大進展,但持續使用合成數據來訓練模型會導致模型變得封閉,并最終失去多樣性和準確性。

值得一提的是,在算力提升遭遇瓶頸,訓練數據數量、質量有限的情況下,算法在大模型研發中的關鍵作用愈加凸顯。以科大訊飛為例,算法優勢是訊飛星火大模型的核心競爭力,能夠彌補目前國內大模型研究在算力和數據方面的不足。

“沒錢,沒卡,沒人才,差距在拉大?!盇IGC業內人士做了這樣一句概括,在他看來,前兩者的客觀環境也在一定程度上限制著人才的回流,造成中國的AIGC產業很難在短時間內奮起直追。

因此,“百模大戰”之下的中國企業主攻應用層面,也就情有可原了。

根據財華社統計,作為AIGC最佳落地場景,社交、游戲、教育和電商領域的頭部企業均有在積極研發并推出了AIGC產品,借此機遇提升用戶體驗和企業創收能力。

在社交領域,騰訊、知乎、微博和美圖等企業均發布了各自的AIGC/大模型產品。

游戲行業方面,AI游戲成為未來發展的大方向,通過AI可為游戲公司實現降本增效,尤其是美術制作上可大幅提高生產效率。伽馬數據發布的《中國游戲產業AIGC發展前景報告》顯示,超六成頭部國內游戲企業明確布局AIGC領域,海外代表性AI企業中,超八成來自美國。

以騰訊、網易為代表的游戲廠商均自研并發布了自身的大模型,其中,網易利用AIGC技術,發布了“首款AI游戲”《逆水寒》,其表示,該游戲中有大量NPC都被植入了人工智能,這些NPC不再固定地站在某個位置等待玩家觸發任務對白,而是變得有記憶、有性格,像個“真人”一樣,生活在游戲主城中。

電商賽道也是AIGC落地的一大場景,2023年以來,AIGC技術在電商行業的廣告、內容、社媒、用戶增長、創新等各個方面快速滲透。其中的營銷正成為AIGC的第一著陸點,在2023年“雙11”購物節,AIGC技術實現了首次大規模落地。

據悉,京東的言犀大模型打造了業界首個大規模商用的情感機器人京小智,已涵蓋了售前、售中、售后、物流等全鏈路服務。在2024年甲辰龍年春節期間,京東利用言犀大模型的AIGC文生圖能力創作了八張剪紙年畫,言犀虛擬主播、智能客服、智能外呼等也是京東AIGC的典型應用。

教育行業因為其個性化學習訴求強、數據豐富度高、付費意愿強,成為人工智能的優質落地領域。如網易有道的“子曰”、學而思的“MathGPT”可面向公眾開放,標志著我國“AI+教育”發展再獲新進展。

據悉,音頻創作、視覺創作和文本創作是科大訊飛AIGC的三大模塊??拼笥嶏w在AIGC方面產品創新也有一些探索,例如訊飛智作App,可結合音頻、視頻、文本等AIGC能力,打造一個音視頻內容的AI創作基地。第二個是訊飛音樂的詞曲家平臺。通過AI的輔助作詞作曲,可以幫助創作者提高生產力。文本創作方面,依托訊飛星火認知大模型,推出了訊飛寫作及星火內容運營大師等應用。其中,星火內容運營大師可實現文章智能寫作、精準配圖與一鍵發布,通用稿件30分鐘共創生成,深度稿件編輯效率翻番。

與此同時,另一些通用大模型也開始取得了成果。根據東吳證券的報告,百度推出“文心大模型”,是目前國內預訓練大模型應用端生態最好的大模型之一。而基于文心大模型推出的文心一言,自2023 年 8 月 31 日向全社會開放以來,用戶規模已經突破 1 億,基于文心一言的創新應用超過 4000 個。2023 年 12 月,文心一言與上海辭書出版社深化合作,《辭?!返凝嫶髷祿谌胛男幕竽P?。

此外,阿里發布通義千問2.0,專業維度能力較強;vivo發布BlueLM大模型,應用的場景廣泛;月之暗面發布Moonshot大模型,目前位于第一梯隊。

而云從科技2023年5月推出的多模態大模型——從容大模型,宣稱可以解決諸多AI應用的痛點,應用于金融、安防、政務、交通、能源、教育、醫療、文娛等行業領域。

“為企業打通大模型落地最后一公里”是竹間智能科技(上海)有限公司(下稱“竹間智能”)的口號。然而,這家曾估值10億元的AI獨角獸,卻在近期被爆出將停工停產長達六個月。很快,竹間智能辟謠表示,目前正對于部分虧損業務進行優化,其中涉及部分崗位的工作重組計劃,進行了少部分崗位的停工,而非全面停工停產。

作為AIGC最佳落地場景,社交、游戲、教育和電商領域的頭部企業均有在積極研發并推出了AIGC產品,借此機遇提升用戶體驗和企業創收能力。

作為NLP(自然語言處理)賽道的明星企業,竹間智能一度受到投資人的追捧。公開資料顯示,竹間智能由前微軟(亞洲)互聯網工程院副院長簡仁賢于2015年創辦。據報道,簡仁賢在微軟任職期間,曾帶領了“微軟小冰及小娜”的產品技術研發,成功在中國及日本落地。在2017至2023年間,竹間智能連續獲得了7輪融資,融資總額已超過10億元人民幣。

2023年,在ChatGPT掀起生成式AI狂潮之后,竹間智能推出了大模型工廠(LLM Factory)。簡仁賢曾在2023年6月表示,大模型工廠(LLM Factory)可以在短時間內,快速且低成本地幫助企業構建自己的大模型,將其部署到本地并與現有系統融合,從而協助企業進行業務的升級。未承想,這樣的獨角獸企業會在2024年2月被迫宣布“部分停工停產”。

竹間智能的今天,也許就是國內不少AIGC企業的明天。

全聯并購公會信用管理委員會專家安光勇表示,大量企業的涌入導致了行業的過度競爭和資源的過度消耗,加劇了行業的內卷現象。此外,市場需求可能會進一步萎縮,對AI企業的商業模式和盈利能力提出了更高的要求。

薩摩耶云科技集團首席經濟學家鄭磊則表示,目前國內人工智能初創企業既有專攻大模型研發的,也有一些在從事大模型應用方面的研究,但是由于在基礎模型、訓練數據和算力、人才、資金等方面的限制,初創企業很難承擔大模型開發所需的巨額資金和大量資源投入,創業失敗風險很高。

而對于那些互聯網大廠而言,大模型還處于商業化早期階段,很多盈利模式并不清晰。

目前來看,大模型的商業化無非就是在C端和B端兩頭進行。C端商業化一般是通過大模型為用戶提供新產品和工具實現盈利。不過,除非有顛覆性的技術或者產品帶來創新體驗,否則很難吸引C端付費用戶。捫心自問,你原意為一張文生圖片或者一段文生視頻支付多少錢?

大模型在B端的應用場景則更為廣泛。華為任正非曾提到,“人工智能軟件平臺公司對人類社會的直接貢獻可能不到2%,98%都是對工業社會、農業社會的促進,AI服務普及需要5G的連接”。任正非表示,大家要關注應用,尤其是工業、農業社會的應用,模型的應用有時比模型本身還有前途。

百度推出“文心大模型”,是目前國內預訓練大模型應用端生態最好的大模型之一。

2023年7月8日,AIGC大模型應用閃耀2023世界人工智能大會,技術發展讓機器人、數字人虛擬主播不再是擺設而更聰明高效。

遺憾的是,目前國內有名的大模型,大多都在C端賺吆喝……

猜你喜歡
文心算力人工智能
基于網絡5.0的重疊網形態算力網絡
衛星通信在算力網絡中的應用研究
中國電信董事長柯瑞文:算力成為數字經濟的主要生產力
基于SiteAI算力終端的交通態勢感知系統
2019:人工智能
人工智能與就業
冬天來啦
文心雜記
請不斷修煉你的“文心”
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合