?

國內外AI大模型比拼:稟賦各異

2023-06-03 09:18姜紅德
中國信息化 2023年5期
關鍵詞:模態文本語言

姜紅德

數月來,以ChatGPT為首的AI大模型掀起了新一輪技術熱潮,甚至被業內人士稱之為信息革命的新拐點?!芭cAI大模型相比,谷歌、字節跳動等公司現在的業務模式或者正在做的事情可以被概括為搬運信息的工作”。原百度總裁、奇績創始人兼CEO陸奇這樣表示。對躬身入局的企業來說,他們的大模型定位各有差異,也具備不同的稟賦優勢?!吨袊畔⒒冯s志對部分AI大模型進展進行了簡單梳理,以“管窺全豹”。

OpenAI

OpenAI由數位硅谷大佬共同出資10億美元于2015年在舊金山創立。自2018年起,OpenAI相繼發布了大模型GPT-1、 GPT-2、 GPT-3。2022年12月公布的ChatGPT其實是在GPT-3基礎上的3.5版本。

2 0 2 3年3月1 5日凌晨,OpenAI正式推出GPT-4。相比ChatGPT僅能在文字領域施展特長,GPT-4是多模態大模型,即支持圖像和文本輸入以及文本輸出,擁有強大的識圖能力。GPT-4在知識能力測試方面能夠達到人類較高水平,業界普遍認為GPT-4將為AI產業帶來更多機會,同時也引發了對AI倫理方面的一些擔心。最新的消息顯示,OpenAI于5月15日宣布向所有ChatGPT Plus用戶推出聯網和插件功能。位于Alpha和Beta通道的ChatGPT Plus用戶都能使用聯網功能以及70多個已上線的插件。此次更新意味著最后一道“封印”已被徹底解除,ChatGPT將利用最新的信息和資訊為使用者提供服務。

微軟

2月11日,微軟發布語言模型Turing-NLG(簡稱T-NLG)。該模型擁有170億參數量。TuringNLG在各種語言建?;鶞史矫娴谋憩F出眾,并且在回答問題和摘要生成方面表現十分優異。這主要得益于以下突破:一是利用NVIDIA DGX-2硬件設置,使用InfiniBand連接,以便GPU之間實現比以前更快地通信。二是使用四個V100 GPU,在 Megatron-LM框架中應用張量切片分割模型。三是使用Deepspeed和ZeRO降低了模型的并行度(從16降低到4) ,將每個節點的批處理大小增加4倍,并且減少了三倍的訓練時間。除了通過總結文檔和電子郵件來節省用戶時間,T-NLG可以通過向作者提供寫作幫助和回答讀者可能提出的關于文檔的問題,來增強使用Microsoft Office 套件的體驗,打造更強的聊天機器人等等。

Meta

2月24日,Meta宣布推出針對研究社區的“Meta人工智能大型語言模型”系統,簡稱“LLaMA”。在此之前,Meta也曾推出過大型語言模型 OPT-175B,這構成了其聊天機器人blenterbot 新迭代的基礎。

Meta公司CEO扎克伯格在社交媒體上表示,LLaMA在文本生成、問題回答、書面材料總結,以及自動證明數學定理、預測蛋白質結構等更復雜的方面也有很大的發展前景。LLaMA可以在非商業許可下提供給政府、社區和學術界的研究人員和實體工作者,目前正在接受研究人員的申請。

谷歌

當地時間5月10日,谷歌發布最新的人工智能語言模型 PaLM 2,這是谷歌去年推出的大語言模型 PaLM的進階版——2022年4月,谷歌推出了 PaLM,參數規模為5400億。相比之下,PaLM2在語言豐富度、推理能力、代碼能力上比上一個版本有了提升:一是多語言性。 PaLM 2 在多語言文本方面接受了更多的訓練,涵蓋 100多種語言。在理解、生成和翻譯細微差別文本 (包括成語、詩歌和謎語) 的能力上表現更好。PaLM 2 還通過了“精通”級別的高級語言能力考試。二是推理, PaLM 2的廣泛數據集包括科學論文和數學相關信息,在邏輯、常識推理和數學方面表現更好。三是編碼,PaLM 2 在大量公開可用的源代碼數據集上進行了預訓練。它擅長Python 和 Java 等流行的編程語言,也可以生成 Prolog、Fortran和 Verilog 等語言的專用代碼。

華為

從華為云官網查詢的消息得知,華為的盤古系列 AI 大模型即將發布。盤古大模型由 NLP 大模型、CV 大模型、多模態大模型、科學計算大模型等多個大模型構成,通過模型泛化,解決傳統 AI作坊式開發模式下不能解決的 AI規?;?、產業化難題,可以支持多種自然語言處理任務,包括文本生成、文本分類、問答系統等等。其中 NLP 大模型是被認為最接近人類中文理解能力的 AI 大模型,而 CV 大模型首次兼顧了圖像判別與生成能力。媒體評價,如果單純從數據的角度來看,華為盤古的級別已經達到GPT-3.5的水平。

百度

3月16日,百度正式發布了生成式人工智能大模型“文心一言”,并展示了它在文學、商業、數理推理等方面的多模態表現。在實際演示中,該模型能夠根據用戶需求做到數理計算、資料查詢、分析解答。同時,文心一言也能夠根據用戶需求,進行圖片、語音甚至視頻的智能生成。

阿里巴巴

在4月11日召開的阿里云峰會上,阿里巴巴正式宣布推出大語言模型“通義千問”。通義千問具備多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等功能。具體到應用上,通義千問可以跟人類進行多輪的交互,也融入了多模態的知識理解,有著非常強的文案創作能力,能夠續寫小說、編寫郵件等,可以極大提高工作效率。據阿里巴巴集團董事會主席兼CEO張勇透露,釘釘、天貓精靈將于不久后正式接入該模型,未來阿里巴巴全系產品都將用上該模型。

騰訊

據騰訊披露,其旗下“混元”AI大模型覆蓋了NLP(自然語言處理)、CV(計算機視覺)、多模態等基礎模型和眾多行業模型。2023年3月22日,騰訊總裁劉熾平回應稱,公司將投入大量資源構建基礎模型,并在未來將其應用到騰訊的每一個業務線中。同時,基礎模型也會幫助騰訊開展新的業務,將用戶與用戶之間的優勢帶入到人機互動領域。

商湯科技

3月14日,商湯科技發布擁有30億參數的多模態多任務通用大模型“書生2.5”。該模型實現了通過文本來定義任務,從而可以靈活地定義不同場景的任務需求,并根據給定視覺圖像和任務的提示性語句,給出相應的指令或作答,進而具備通用場景下的高級感知和復雜問題處理能力,比如圖像描述、視覺問答、視覺推理和文字識別等。在自動駕駛和居家機器人等通用場景下,“書生2.5”可輔助處理各種復雜任務。

科大訊飛

5月6日,科大訊飛星火認知大模型在安徽合肥發布?,F場圍繞訊飛星火認知大模型的七大核心能力,即多風格多任務長文本生成、多層次跨語種語言理解、泛領域開放式知識問答、情景式思維鏈邏輯推理、多題型步驟級數學能力、多功能多語言代碼能力、多模態輸入和表達能力,展開現場實測。目前首批來自36個行業的3000余家企業開發者將接入星火大模型,聯合各行業合作伙伴共建大模型“星火”生態。

中國科學院

中國科學院自動化研究所5月6日宣布,該所正在和武漢人工智能研究院聯合打造全模態大模型“紫東太初”2.0。有別于以文本為主的大部分語言大模型,中科院自動化所自2019年開始就在語音、文本、圖像等單模態大模型研究和應用基礎上,瞄準多模態大模型領域聯合攻關,2021年7月正式發布全球首個千億參數多模態大模型“紫東太初”。 “紫東太初”大模型已在手語教學、法律咨詢、交通出行、廣電、醫療機器人、醫學影像判讀等數十個行業場景領域,展現出廣闊的落地應用潛力。

猜你喜歡
模態文本語言
語言是刀
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
讓語言描寫搖曳多姿
累積動態分析下的同聲傳譯語言壓縮
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
國內多模態教學研究回顧與展望
我有我語言
基于HHT和Prony算法的電力系統低頻振蕩模態識別
由單個模態構造對稱簡支梁的抗彎剛度
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合