?

新一代人工智能技術(AIGC):發展演進、產業機遇及前景展望

2023-08-17 12:19許雪晨田侃李文軍
產業經濟評論 2023年4期
關鍵詞:數字經濟產業發展

許雪晨 田侃 李文軍

關鍵詞:AIGC;新一代人工智能技術;ChatGPT;產業發展;數字經濟

DOI:10.19313/j.cnki.cn10-1223/f.20230705.001

一、引言

習近平總書記指出,“把新一代人工智能作為推動科技跨越發展、產業優化升級、生產力整體躍升的驅動力量,努力實現高質量發展?!苯涍^60 多年的發展,人工智能發展進入新的階段,相比于傳統人工智能,新一代人工智能呈現出深度學習、跨界融合、人機協同、群智開放、自主操控等新特征。大數據驅動知識學習、跨媒體協同處理等也成為人工智能的發展重點。近年來,通過無監督學習條件下的“大數據+大模型”方式,自然語言處理、語音識別、計算機視覺等任務的性能均顯著提升,新一代人工智能的重要分支——人工智能生成內容(Artificial Intelligence GeneratedContent,AIGC)迎來加速發展,正在催生全新的產業體系。

代表AIGC 最新進展的是OpenAI 開發的聊天機器人——ChatGPT(Long 等,2022),通過大規模預訓練模型,ChatGPT 具備理解自然語言和文本生成的能力,可以執行文本翻譯、摘要生成、情感分析等任務。ChatGPT 以其強大的功能和廣泛的應用場景,在推出僅兩個月后,就迅速發展壯大,月活用戶數量已超過1 億。如果說“阿爾法狗”刷新了普通大眾對人工智能技術的看法,那么ChatGPT 則使人工智能技術“飛入尋常百姓家”。這引起了業界和學界的廣泛關注。

2023 年2 月,微軟宣布在Bing 搜索引擎中引入ChatGPT,自集成ChatGPT 后,Bing 的日活量也首次突破1 億。作為人工智能領域的現象級應用,ChatGPT 也開啟了中國人工智能行業新賽道,引發國內科技巨頭競相涌入。在眾多互聯網公司中,百度最早官宣將在今年3 月上線百度版ChatGPT——“文心一言”。騰訊則表示,專項研究正在有序推進,針對類ChatGPT 對話式產品已成立“混元助手”項目組。此外,京東宣布將推出產業版ChatGPT—ChatJD。網易有道則對AIGC在教育場景的落地進行布局。360 也對外公布,計劃推出類ChatGPT 的demo 版產品。

ChatGPT 是近年來人工智能領域的一項重大突破,但其突然火爆并非橫空出世,非一日之功,而是人工智能大模型從量變到質變的一個華麗蛻變。

在過去幾十年里,由于機器學習算法、計算機處理能力、移動互聯網等方面的進步,計算和人工智能相關的方法取得了長足進展并引發了一系列突破,ChatGPT 的成功基于大模型、大算力、大訓練數據。幾十年間,人工智能已成為包括中國在內的許多國家經濟發展的重要引擎。

2017 年7 月,國務院印發《新一代人工智能發展規劃》(以下簡稱《規劃》)①,這是本世紀以來中國發布的第一個人工智能系統性戰略規劃,這一規劃提出了面向2030 年中國新一代人工智能發展的指導思想、戰略目標、重點任務和保障措施?!兑巹潯分赋?,要重點突破跨媒體統一表征、關聯理解與知識挖掘、知識圖譜構建與學習、知識演化與推理、智能描述與生成等技術,實現跨媒體知識表征、分析、挖掘、推理、演化和利用,構建分析推理引擎。AIGC 技術能力升級將為這一目標的實現提供強力支撐。2023 年2 月13 日,北京市經濟和信息化局發布《2022 年北京人工智能產業發展白皮書》,該白皮書提到,今年北京市將引導企業、高校、科研院所、新型研發機構、開源社區等,圍繞人工智能關鍵核心技術創新協同攻關,持續推動建設具有全球影響力的人工智能創新策源地。同時,支持頭部企業打造對標ChatGPT 的大模型,構建開源框架和通用大模型的應用生態,形成人工智能產業發展新突破;加強人工智能算力基礎設施布局,加速人工智能基礎數據供給②。上海市經信委表示,在全球科技競爭日趨白熱化的情況下,積極發展AIGC,加快構筑活躍的產業生態,將是上海人工智能發展的重要著力點。

目前,隨著政策面利好,疊加科技巨頭陸續入場,AIGC 的應用場景不再單純局限于聊天機器人、文本生成等方面,更將為數字經濟、產業發展甚至社會變革注入強大動力。由于AIGC 興起時間較短,對該領域相關內容的梳理和綜述相對匱乏,因此,本文旨在全面、系統地對AIGC 相關的概念、技術和國內外主要科技公司前瞻布局進行系統梳理分析,并從產業視角深度剖析AIGC 產業本身及其與相關產業的融合。關注新一代人工智能技術AIGC 對產業和社會發展的影響,迫切且關鍵。

本文剩余內容結構是:首先對AIGC 概念和發展歷程進行梳理,全面了解AIGC 發展狀況;然后探討AIGC 帶來的產業機遇,分析其應用場景及其可能帶來的風險;最后在上述分析基礎上,提出中國針對AIGC 發展和治理的政策建議。

二、AIGC 概念梳理與發展歷程

(一)AIGC概念與內涵

1950年,艾倫·圖靈在《計算機器與智能》中提出了著名的“圖靈測試”——判定機器是否“智能”的試驗方法(Turing,2009),即機器是否能夠模仿人類的思維方式來“生成”內容,實現人機交互。因此,人工智能從圖靈開始就被寄予了用于內容創造的期許。經過半個多世紀發展,數據快速積累、算力性能提升和算法效力增強,如今人工智能不僅實現了人機互動,還能夠進行寫作、編曲、繪畫、視頻制作等創意工作。2018 年,由人工智能創作的肖像畫《埃德蒙·貝拉米畫像》拍賣43.25 萬美元,成為人類歷史上首次拍賣的AI 藝術品,引發各界關注。隨著人工智能越來越多地被應用于內容創作,AIGC 概念悄然興起。

目前,對AIGC 的定義尚無統一規范的界定。國內產學研各界對于AIGC 的理解是“繼專業生成內容(Professional Generated Content,PGC)和用戶生成內容(User Generated Content,UGC)之后(Nosita 和Lestari,2019;Lobato 等,2011),利用人工智能技術自動生成內容的新型生產方式”。在國際上對應的術語是“人工智能合成媒體(AI-generated Media 或Synthetic Media)”(Pataranutaporn 等,2023),其定義是“通過人工智能算法對數據或媒體進行生產、操控和修改的統稱”。因此,AIGC 是指從內容生產者的角度對內容進行分類的一種內容類型,同時也是一種自動化生成內容的技術。

(二)AIGC 發展歷程

梳理人工智能的發展演進,AIGC 的發展基本可以劃分為三個時期:醞釀萌芽階段(20 世紀50年代至20 世紀90 年代中期)、穩步推進階段(20 世紀90 年代中期至21 世紀10 年代中期)以及迅猛發展階段(21 世紀10 年代中期至今)(三階段的相關總結見表1)。

1. 醞釀萌芽階段

20 世紀50 年代至20 世紀90 年代中期,受限于技術水平,AIGC 僅局限于小范圍實驗。1950年,圖靈提出“圖靈測試”能夠判定機器是否“智能”;1957 年,計算機首次創作完成弦樂四重奏《依利亞克組曲》;1966 年,世界上第一款可人機對話的機器人“伊莉莎(Eliza)”問世,主要通過關鍵字掃描與重組完成交互任務。20 世紀80 年代中期,國際商業機器公司(International BusinessMachines Corporation,IBM)創造了語音控制打字機“坦戈拉(Tangora)”,約能處理20 000 個單詞。

20 世紀80 年代末至90 年代中期,由于高昂的研發投入沒有實現預期的商業變現,世界各國開始減少人工智能領域的投入,AIGC 沒有實現重大突破。但在此期間,圖靈測試、對話機器人以及語控打字機已經孕育了AIGC 的雛形。

2. 穩步推進階段

20 世紀90 年代中期至21 世紀10 年代中期,AIGC 逐漸進入穩步推進階段。2006 年起,一方面,圖形處理器和張量處理器等算力設備性能大幅提升,深度學習算力增強,深度學習算法取得重大突破;另一方面,互聯網的推廣普及使得數據規模劇增,這為各類人工智能算法提供了海量訓練數據。雖然算力的提升與數據的膨脹使人工智能取得了長足發展,但AIGC 仍受限于算法約束,創作任務依然沒有取得重大突破,應用場景有限,應用效果有待提升。2007 年,紐約大學的人工智能系統撰寫小說《1 The Road》——世界第一部完全由人工智能創作的小說,雖然小說可讀性不強、存在拼寫錯誤、邏輯混亂,但從AIGC 整個發展歷程來看,其突破性意義遠高于文學價值。2012 年,微軟推出全自動同聲傳譯系統,計算機能夠自動完成語音識別、英中機器翻譯,以及中文語音合成,效果非常流暢,這標志著深度神經網絡模型在語音識別和音頻生成領域獲得了巨大的成功,為AIGC 進一步發展帶來希望。

在進入21 世紀后,AIGC 從前期的技術實驗性向商業實用性轉變,但受限于算法瓶頸,其往往只能根據算法提供的模板生成內容,開放性、包容性還有待提升,無法較好地完成創作。

3. 迅猛發展階段

21 世紀10 年代中期至今,AIGC 迎來新發展,生成內容更加多元,生成效果更加逼真。自2014 年起,Goodfellow 等(2020)提出以生成式對抗網絡(Generative Adversarial Network,GAN)為代表的深度學習算法,并不斷迭代更新,為AIGC 提供了強大的技術支撐。此后,2017 年,微軟人工智能少女“小冰”完成了世界首部完全由人工智能創作的詩集——《陽光失了玻璃窗》。2018年,英偉達發布可以實現自動生成圖片的模型——StyleGAN(Karras 等,2020),該模型目前已升級到第四代——StyleGAN-XL(Sauer 等,2022),其生成圖片的分辨率極高,人眼難以分辨真假。2019 年,DeepMind 發布DVD-GAN 模型(Clark 等,2019)可以生成高度逼真且連貫的視頻,該模型能夠通過學習和理解人類的語言,進行對話、聊天互動。2021 年,OpenAI 推出DALL-E(Ramesh等,2021),主要用于文本與圖像的交互生成內容,并于一年后推出升級版本DALL-E-2(Marcus等,2022)。 DALL-E-2 基于對主題、風格、調色板和所需概念意義的“理解”,可以生成相應的圖像,同時該模型還能夠根據原圖像進行二次創作。至此,AIGC 技術基本成熟,有望成為改變商業模式和產業發展范式的重要驅動力。

總的來說,該階段深度學習算法快速發展,AIGC 生成效果逐漸逼真直至人類難以分辨。與此同時,市場受到較高關注,雖然距離大規模證明和體系化發展仍有差距,但從資本的加碼到應用場景的探索,距離的縫隙有望逐步填補。

三、國內外主要科技公司AIGC 布局現狀

2022 年下半年起,“AIGC”接棒“元宇宙”成為全球矚目的焦點和熱議話題,各個行業都在積極探尋AIGC 助力下的新方向,搶占新賽道。國內外各大科技企業紛紛在AIGC 領域搶先布局,新興科技創業公司悄然興起。本節將對國內外主要科技公司AIGC 布局進行梳理,并以中美兩國為例,分析比較兩國AIGC 發展異同,明確中國AIGC 發展難點痛點與瓶頸環節。

(一)國外AIGC 發展現狀

國外AIGC 領域的相關企業既有谷歌、META、微軟等科技巨頭,也不乏Stability AI、Jasper、OpenAI 等新晉獨角獸企業。上述科技公司的項目不僅可以生成圖片,還能夠進行視頻生成。例如,META 推出Make-A-Video 系統(Singer 等,2022),實現了由文本到視頻的飛躍;谷歌推出ImagenVideo(Saharia 等,2022)和Phenaki(Villegas 等,2022),可以從簡單的文本提示中生成高清視頻。AIGC 在海外市場發展迅速,目前具有參照意義的國外公司主要有:

1. 微軟

2019 年,微軟向OpenAI 投資10 億美元,試圖實現AI 的彎道超車。在關注技術研發的同時,微軟積極籌備OpenAI 的商業化落地,將OpenAI 的技術與自有產品進行集成。2020 年,微軟將GPT-3 模型(Brown 等,2020)用于Office、Bing 和Microsoft design 等產品中;2021 年,在Azure中集中部署OpenAI 開發的GPT、DALLE、Codex 等各類工具,這也成為OpenAI 最早的收入來源。2023 年1 月,微軟向OpenAI 追加數十億美元的投資。2 月2 日,微軟宣布旗下所有產品均將整合ChatGPT,包括搜索引擎Bing、辦公全家桶Office。目前,微軟已發布4 款基于ChatGPT 的融合應用,包括視頻會議Teams 智能概述功能,銷售應用Viva Sales 生成郵件回復,搜索引擎Bing 通過聊天獲取答案,瀏覽器Edge 聊天和編寫功能。微軟CEO 納德拉宣布將在云計算平臺Azure 中整合ChatGPT,宣告Azure OpenAI 服務全面上市,通過該服務可以訪問OpenAI 開發的AI 模型,屆時微軟的每個產品都將具備相同的AI 能力。

2. 谷歌

2021 年,谷歌推出大語言模型LaMDA(Thoppilan 等,2022),并在此基礎上開發了Bard,可以將信息知識和大語言模型的智能相結合,提供新鮮高質量的回復。這意味著與ChatGPT 不同,Bard 可以基于實時網絡數據,而ChatGPT 的信息獲取來源只局限于2021 年以前的數據。谷歌目前在文本、源代碼、音頻、圖像和視頻四個領域均開展了生成式模型研究。Wordcraft Writers Workshop可以幫助作家從大型語言模型中獲得寫作上的幫助。AudioLM(Borsos 等,2022)是音頻生成模型,該模型將音頻樣本輸入并繼續進行創作,用以生成音樂和語音。此外,谷歌研究院還發布了AIGC工具Stable Diffusion(Rombach 等,2022)和Dreambooth(Ruiz 等,2022),借助上述工具,只需輸入幾張指定物體的照片和相應的類名,即可通過文字描述讓被指定物體出現在用戶想要生成的場景中。

3. META

Meta 在AIGC 領域也有戰略安排。2022 年11 月,Meta 的人工智能實驗室Meta AI 發布了AI系統“Make-A-Video”,能夠根據輸入的自然語言文本生成一段5 秒鐘左右的短視頻。并且在語言生成視頻的基礎上,拓展到從圖像生成視頻以及從視頻生成視頻。此外,Meta 在AIGC 的其他方向也有布局。Meta A 提出了一個全新的文本到四維生成系統MAV3D(MakeA-Video3D),將自然語言描述作為輸入,并輸出一個動態的三維場景表示,可以從任意的視角進行渲染。

4. 獨角獸企業

除了上述這三家企業之外,還包括Zyro、NVIDIA、OpenAI、Gliacloud 等人工智能企業與獨角獸企業同樣具備對標AIGC 的技術能力(見表2 所示)。

(1)Zyro:一方面圍繞垂直業務場景,結合業務knowhow 組織相關 AIGC 能力;另一方面,圍繞電商場景,通過AIGC 生成網站搭建過程中所需的各類素材,具體業務包括針對性生成公司介紹、企業價值、Slogan、自動提升圖片清晰度、自動生成logo 等。

(2)NVIDIA:通過構建技術矩陣,使其最終服務于創作型工具平臺在視覺生成研究領域始終處于前沿,代表作品包括CycleGAN(Zhu 等,2017)、GauGAN(Park 等,2019)、EditGAN(Ling等,2021 等)、GANverse3D(Zhang 等,2020)、Instant NeRF(Müller 等,2022)等。

(3)OpenAI:通過客戶端付費訂閱模式,對外提供GPT 和ChatGPT 等模型能力,實現商業化盈利。

(二)國內AIGC發展現狀

相比于國際先進科技公司,雖然中國AIGC 產業尚處于起步階段,底層技術和商業化落地較國外仍有一定距離,但眾多國內知名企業如百度、阿里巴巴、京東在AIGC 領域也進行了布局,并嘗試將相關技術應用于自身業務。代表性公司包括:

1. 百度

2022 年8 月,基于自主研發的產業級大模型ERNIE(Sun 等,2019),百度推出AI 藝術創意輔助平臺——文心一格。通過文心大模型準確的語義理解和圖片生成能力,文心一格可以為用戶提供豐富多樣的創意,幫助創作者打破創作瓶頸。同年9 月,百度發布多款AIGC 應用內容生產領域的技術和產品,包括“創作者AI 助理”和“百度APP 數字人”等。值得一提的是,由百度推出的AI 數字人度曉曉,作答2022 年高考語文作文得分達到48 分,得分超過了75%的考生,這表明AIGC 創造的內容具有較高的可讀性和創造性。

2. 阿里巴巴

2019 年初,阿里巴巴達摩院啟動通用性人工智能大模型M6 項目(Lin 等,2021),并于2021年3 月首次發布,參數量達到千億級,成為世界上最大的中文多模態模型。同年11 月,M6 成為全球首個突破10 萬億參數的AI 模型。M6 主打多模態、多任務能力,擅長寫作、對話等任務,已在超40 個場景中實現商業化落地。目前,M6 模型已經成為阿里重要的科技基礎設施,在電商領域的服裝設計和工業級文案生成以及支付寶的搜索推薦等業務中實現了產業化應用。此外,阿里巴巴計劃在釘釘APP 中引入類ChatGPT 的對話機器人。

3. 京東

京東在AIGC賽道上的布局更加聚焦文本、數字人生成和通用型Chat AI 等技術。在文本生成領域,京東發布了商品文案生成模型K-PLUG(Xu 等,2021),幫助商家自動生成商品標題、商品賣點文案、商品直播文案,人工審核通過率超過95%。在數字人生成領域,京東利用AI 虛擬數字人代替人工客服,數字人主播在6.18 場景中試播,改變了傳統的營銷模式。在2023 年2 月,京東宣布將推出ChatGPT 產業版——ChatJD,旨在打造高頻、剛需的產業版通用ChatGPT 類產品。

4. 創業公司

如表3 所示,國內也涌現了一批成長迅速的創業公司,代表企業如下:

(1)小冰科技:最早提出AI Being(人工智能數字員工)定義,并開發了小冰框架,用于快速生成符合條件的虛擬人。目前,由小冰框架提供的數字人已活躍于眾多場景中,這其中包括萬科集團年度優秀員工“崔筱盼”、紅杉中國首位虛擬分析師“Hóng”等。作為賦予AI Being 創造力的重要部分,小冰布局AIGC 多年,并已形成穩定商業落地與文本、聲音、圖像的產品化陣列。在文本方面,小冰金融文本生成產品覆蓋約90%的機構投資人。在繪畫方面,“夏語冰”創作的水墨畫是唯一入選去年迪拜世博會中國館的人工智能繪畫作品。據不完全統計,由小冰創建并承載的人工智能交互主體,擁有全球范圍人工智能交互總流量約60%,超過主要同行業者亞馬遜、谷歌及蘋果同類產品的流量總和。

(2)聆心智能:基于生成式模型的情感對話系統,為用戶打造不同類型的AI 心理陪伴人,并提供更科學、高效的精神健康服務。此外,聆心智能正致力于打造超擬人大模型,增加場景化、擬人化的風格設定,讓AI 成為通用人工智能時代的智能體,具備個性、情感和成長能力。

(3)影譜科技:憑借數字孿生等關鍵技術優勢以及3D 數字化場景、沉浸式體驗的營造能力,發布了國內首個依托AIGC 技術的元宇宙活動平臺——影宙,將元宇宙和AIGC 相結合,探索元宇宙與各垂直行業的融合應用。

(三)中美兩國

大模型及AIGC 發展對比大模型作為一種變革性技術,已經成為AIGC 及整個人工智能技術的制高點和基礎設施,中國和美國作為這個領域的主要玩家,正在圍繞AIGC 展開角逐。在本小節,本文旨在對中美兩國大模型數量及參數量、論文及研究機構和AIGC 創業公司及產業環境等方面進行對比,深度解析中國和美國AIGC 賽道。

1. 預訓練模型參數量

如表4 所示,在預訓練語言模型的參數量排名前10 的機構中,美國有6 個,中國擁有4 個。在部分評測基準中,中國的大模型成績甚至更加優異,特別表現在中文語言理解、閱讀理解等榜單中。但這一類大模型底層創新均來自于美國的研究機構。國內推出的大模型如百度文心、阿里M6、華為盤古(Zeng 等,2021)、智源研究院悟道(Yuan 等,2022)和浪潮源1.0(Wu 等,2021)等,均基于BERT(Devlin 等,2018)大模型架構優化而來,缺乏根技術上的創新。此外,現階段上述模型在問題回答的完整性和邏輯性等方面,仍無法與ChatGPT 抗衡。

2. AIGC 模型相關論文、研發機構

過去五年,美國總共發表了98 篇與預訓練模型相關的論文,中國則發表了240 篇。不難發現,中國論文發表數量遙遙領先,但在論文引用情況方面,引用量排名前十的論文大都來自美國的研究者,可見美國的高質量論文仍然處于領先地位。此外,如圖1 所示,在全球AIGC 模型研發機構排名中,前十名中美國占據六席,中國機構則占據四席。因此,中國研發機構雖然起步較晚,但不遜色于美國。

3. AIGC 獨角獸數量和產業環境對比

由于技術發展不足,以及產業環境的影響,在中國,AIGC 大多被作為公司的部分業務乃至相對邊緣化的功能進行研發,獨立運行的創業公司數量明顯少于美國,大部分細分賽道的初創玩家也都少于5 家。截至2022 年底,美國的AIGC 獨角獸數量是292 家,估值4.6 萬億美元,中國則有69 家,估值1.4 萬億美元。與美國相比,中國人工智能獨角獸的數量和估值差距仍然很大。此外,中國AIGC 布局最多的賽道是AI 寫作和語音合成領域,虛擬人賽道剛剛開始興起,基本均停留在內容領域。而在美國,延展領域得到了更為充分的挖掘,例如個性化文本生成、合成數據等賽道均是重點布局領域。

通過上述對比分析可以發現,中國AIGC 發展水平仍與美國存在一定差距,究其原因,可以歸結為以下三個方面:

(1)從算力層面來看,我國的數據中心多面向軟件應用環境,真正面向AI 的算力非常少,又或者需求不高,而算力本身非常昂貴,模型越大,數據越多,數據訓練AI 所要消耗的費用就越大。以ChatGPT 為例,訓練一次的成本約140 萬美元,這是國內大多公司不能負擔的。此外,高端GPU和AI 芯片缺乏也成為國內AIGC 領域卡脖子問題。

(2)從數據層面來看,國內數據的質量普遍不高,一是數據積累量不夠,再者數據管理較為嚴格,部分數據文本需要審批才可以被人工智能企業使用,減慢了數據價值的釋放。而美國擁有龐大的、高質量的數據資源,這使得美國企業可以在大數據的支持下,快速開發AIGC 技術,并提供更加準確、多樣化的服務。

(3)從人才層面來看,美國擁有全球先進的高等教育體系和吸引科技人才的激勵措施,這使得美國企業可以從世界范圍內吸引最優秀的人才來開發AIGC 技術。盡管中國擁有大量的科技人才,但在AIGC 領域的高端人才匱乏;我國AI 開發者有思維慣性,過度依賴開源內容,對大模型缺乏探索創新。

綜上所述,大模型和AIGC 是新一代人工智能技術最主要的競爭領域,中美都將其作為戰略高地,傾注了大量的資源??傮w上呈現出美國領先、中國追趕的局面。中國大模型發展迅速,但生態構建和商業應用還有很大發展空間。在保持總量、規模和速度的同時,需要提升質量,實現大模型的高質量發展。

四、AIGC產業發展機遇

隨著預訓練大模型走向成熟并成為AIGC 應用的技術底座,AIGC 相關產業有望迎來爆發期。本節將從AIGC 相關產業鏈和重點行業應用領域角度分析AIGC 可能帶來的發展機遇。具體來說,AIGC 以大模型、大數據和大算力為基礎(鄭世林等,2023),AIGC 熱度持續提升,將帶動算力、芯片等相關產業鏈加速發展。此外,各行業對于數字內容的需求正在爆發性增長,數字世界中內容的消費和供給之間存在巨大差距,迫切需要加以彌合。AIGC 以其真實性、多樣性、組合性的特征,有望幫助企業提高內容生產效率,解放生產力,提高相關數字化產品的智能度,從而更好地服務于傳媒、影視和電商等內容需求豐富的行業。

(一)AIGC 相關產業鏈和數字經濟或將迎來發展良機

AIGC算法復雜,模型訓練需要海量數據,對算力要求呈指數級提升,同時也需要快速高效的方式來處理數據集。在內容生產過程中,AIGC 相關模型需要對海量的標注數據進行不斷的學習,從而更好地學習人類的說話方式和想法,最終實現高質量創作。以ChatGPT 為例,目前提供能力基于GPT-3.5 和RLHF(人類反饋強化學習)訓練獲得,與GPT 家族的其他模型(GPT-1、GPT-2)相比,模型結構并沒有太大改變,但模型訓練的參數量從1.7 億增加到1 750 億,預訓練數據量從5GB 增加到45TB。隨著模型的迭代升級,預計數據量和算力需求都會繼續成幾何倍數增長。因此,AIGC 和相關產業互相促進,互相支撐。首先,隨著AIGC 在更多領域得到應用,海量數據和流量將源源不斷地產生,以算力為代表的云計算等基礎設施或將持續釋放。通信硬件設施將是AIGC 發展最先受益的環節,包括運營商為主的技術設施底座、承載算力的 IDC、服務器“東數西算”帶來的骨干網建設需求等各個產業鏈環節;其次,從云計算、大數據、人工智能、邊緣計算等技術角度來講,未來應用的高算力運算需求,對基礎設施提出更高要求的基礎上也進一步帶動對相關技術及算法的需求;最后,從應用端角度來講,以工業互聯網、車聯網、云游戲以及AR/VR 等應用漸行漸近,應用場景的不斷落地,進一步倒逼基礎設施建設的不斷加快升級。同時,隨著應用場景的不斷豐富,也將進一步拉動相關產業鏈環節需求進一步提升。另一方面,隨著云計算等基礎設施的完善、數字經濟應用的落地和發展,數據等計算資源得以不斷增加,這為AIGC 的迭代優化提供了寶貴的訓練數據,其算法得以更加精進,從而生成更符合人類語言和行為的內容。

(二)AIGC 有望塑造數字內容生產與交互新范式

數字內容邁入強需求、視頻化、拼創意的螺旋式升級周期,AIGC 的發展恰好迎合了這一需要。AIGC 正在越來越頻繁地被應用到數字內容的創作工作中,成為未來互聯網的內容生產基礎設施。

近年來,AI 技術正被廣泛應用于傳媒業的內容生產、分發和管理等環節。AIGC 作為當前新型的內容生產方式,有助于進一步降低相關企業的邊際成本,并賦能自動采編、作品自動生成、游戲建模及虛擬人輔助創造等環節。具體來說,在采編環節,基于AI 算法可以快速自動化地批量生成文章,幫助新聞編輯人員更快、更準、更智能化地生產內容。比如中國地震臺網的寫稿機器人僅用25 秒便完成了《四川阿壩州九寨溝縣發生7.0 級地震》這一消息的準確編發,這則消息不僅包括速報參數、震中地形等8 項內容,還配了4 張現場圖片。此外,AIGC 可以幫助從業者借助字幕生成和視頻錦集等工具,實現視頻智能剪輯,提升視頻內容價值。如2022 年北京冬奧會期間,央視借助AI 智能內容生產剪輯系統,自動制作比賽項目的視頻集錦,高效節省了人力和時間成本,提高多類型內容編發能力。

隨著影視行業的快速發展,高質量劇本相對缺乏、制作成本高昂以及部分作品質量等過程性問題逐漸顯現,亟待進行產業結構升級,向信息化、數字化的方向發展。借助AIGC 技術,可以激發影視劇本創作的思路,擴展影視角色和場景的創作空間,從而在后期制作過程中大幅提升影視產品的質量。這不僅有助于實現影視作品的文化價值與經濟價值的最大化,同時也能夠有效應對影視行業在創作和制作過程中所面臨的諸多挑戰。比如通過AI 合成人臉、聲音等相關內容,實現“數字復活”已故演員、高難度動作合成等,擴展角色和場景創作空間。此外,借助AIGC 合成虛擬物理場景,能夠創造無法實拍或成本過高的場景,極大拓展影視作品想象力的邊界,給觀眾帶來更優質的視聽體驗。長期來看,隨著模型參數和數據訓練量的提升,AIGC 有望大幅提升影視內容供給量及創作效率。

(三)AIGC 促進電商發展模式的轉變

隨著數字技術的不斷創新和應用,消費者的需求不斷升級和加速,沉浸式購物體驗已成為電商領域不可或缺的發展趨勢。AIGC 正加快商品3D 模型、虛擬主播乃至虛擬貨場的構建,通過結合元宇宙技術,實現視聽等多感官交互的沉浸式購物體驗。具體而言,在商品展示和試用環節,借助AIGC 可以自動生成商品的3D 幾何模型和紋理,幫助消費者實現虛擬試用,提高商品銷售轉化率。積木易搭推出的3D 數字化解決方案,支持在分鐘級的時間內完成商品的3D 拍攝和生成,精度可達到毫米級。相較于傳統電商商品展示采用圖文、短視頻的展現形式,3D 動態互動形式的商品對于消費者更有吸引力。同時生成出的3D 商品模型還可用于在線試穿,高度還原商品或服務試用的體驗感,從而更好地體驗其質量和性能,有助于提高消費者的購買意愿。數據顯示,3D 購物的轉化率平均值為70%,較行業平均水平提升了9 倍,同比正常引導成交客單價提升超200%,同時商品退換貨率顯著降低。此外,AIGC 可以幫助打造虛擬主播,賦能直播帶貨?;谟嬎銠C視覺、CG渲染和動作捕捉等技術,打造虛擬主播為觀眾提供24 小時不間斷的貨品推薦介紹以及在線服務能力,降低商家直播門檻。相比真人直播間帶貨,虛擬主播具備三大優勢:一是虛擬主播能夠填補真人主播的空白時間,使直播間能不停輪播,既為用戶提供更靈活的觀看時間和更方便的購物體驗,也為合作商家創造更大的生意增量。二是虛擬品牌能加快店鋪或品牌年輕化進程,拉近與新消費人群的距離。通過在元宇宙中建立虛擬形象,品牌主播可以更好地塑造品牌形象,吸引更多的消費者(鄭世林等,2022)。未來,虛擬品牌主播還可以延伸到元宇宙中的更多場景中,實現圈層傳播。AIGC 同樣能夠賦能線上商城和線下秀場加速演變,為消費者提供全新的購物場景。通過從二維圖像中重建場景的三維幾何結構,實現虛擬貨場快速、低成本、大批量的構建,將有效降低商家搭建3D 購物空間的門檻及成本,為一些原本高度倚重線下門店的行業打開了線上線下融合的想象空間,同時為消費者提供線上線下融合的新消費體驗。

(四)AIGC 推進數實融合,加快產業升級

AIGC 在工業、金融、教育、醫療等行業同樣也將快速滲透,助力產業升級。在工業領域,AIGC有助于提升產業效率和水平。主要體現在:一是融入計算機輔助設計,AIGC 將工業流程中低級重復、多耗時以及低層次的任務自動化,將數千小時的時間耗費縮短至幾分鐘,可最大程度縮短工程設計周期,提高效率;二是AIGC 支持生成衍生設計,為工程師提供更多靈感刺激;三是AIGC 能夠在設計中引入變化,實現動態模擬,提高產業適應性和生動性;四是AIGC 推動加速構建數字孿生系統。AIGC 將物理環境中的數字幾何圖形,參數化為3D 建模數據,創建物理世界中的數字孿生系統。在金融領域,AIGC 助力實現降本增效。一方面AIGC 可實現金融資訊、產品介紹視頻的自動化生產,提升金融機構運營的效率;另一方面,AIGC 可以塑造視、聽雙通道的虛擬數字人客服,讓金融服務內容更加生動,方式更加多元。在教育領域,AIGC 賦予教育新活力。一方面,AIGC為教育工作者提供了新的工具,使平面抽象的課本立體化、具象化,以更加生動的方式向受教者傳遞知識;另一方面,相比于閱讀和講座等傳統方式,AIGC 可以合成虛擬人物,增強互動性與趣味性,給一場枯燥乏味的演講注入新的活力。在醫療領域,AIGC 賦能診療全過程。主要體現在:一是在輔助診斷方面,AIGC 可改善醫學圖像質量、輔助錄入電子病歷等,最大限度解放醫生的智力與精力,使專業醫生專注到核心業務中,既能提高效率,又能實現專業醫生業務能力的提升;二是在康復治療方面,AIGC 可以為失聲者合成語言音頻,為殘疾者合成肢體投影,為心理疾病患者合成無攻擊感的醫護陪伴等,提供人性化康復治療,舒緩其情緒,加速患者康復??傊?,AIGC 正在發展成與其他各類產業深度融合的橫向結合體,其相關應用正加速滲透到經濟社會的方方面面。

五、AIGC 發展面臨的問題與挑戰

隨著人工智能技術發展步入快車道,AIGC 因為其迅速的反應能力、生動的信息輸出、廣泛的應用場景,加速滲透到社會生產和生活的方方面面。在滲透過程中,AIGC 的關鍵技術攻關水平有待提升,相關法律法規有待完善,圍繞公平正義、社會責任、國家安全的爭議日益增多,引發一系列亟待解決的經濟與社會問題。

(一)AIGC 核心技術有待攻關

目前,國內外AIGC 迭代升級,能夠進一步釋放生產力,但核心技術方面尚有局限,阻礙產業發展進程。一是AIGC 技術所依賴的人工智能算法存在固有缺陷。例如其透明度方面仍然存在尚未攻克的技術難題,由于算法模型的黑箱運作機制,其運行機制和因果邏輯無法清晰呈現出來,這一模型特點導致人們無法理解和解釋其傳導機制,若算法出現錯誤,將不利于糾偏除誤(李安,2021)。因此,算法的應用存在問題。又如,算法運行容易受到模型、數據、學習方法的影響,呈現出非穩健的性質。當數據量不足時,其算法模型被隨機噪聲影響的可能性較大,容易得出錯誤結論;在算法投入應用之后,在線數據內容不斷更新,算法極有可能引致系統性能方面的偏差,進而引發系統失靈;算法以數據為基礎,若使用的初始數據有偏,這些有偏數據不會隨時間流逝而消失,反而會永久影響模型的運行結果,最終導致人工智能算法生成內容錯誤,引發用戶對于算法的公平性爭議(劉璇和朝樂門,2022)。二是AIGC 內容創作技術仍不完善。例如,在文本生成方面,部分企業在自然語言理解技術方面沒有取得實質性突破,往往只是簡單地機械化套用模板,導致生成的文本缺乏邏輯性,文本結構雷同、千篇一律,可讀性不高。在語音合成方面,當前基于AIGC 技術的語音表達不夠流暢、斷句存在錯誤、聲音具有較強的機械感。若進一步提高生成語音的情感嵌入,不僅需要更高水平的模型,還需要大規模的數據量支持訓練,對模型和數據的高要求使得難以控制成本,導致AIGC 技術使用復雜度提升,最終制約技術落地與推廣。

(二)行業發展規范有待完善

近年來,隨著人工智能技術的快速發展,人工智能產業規范也逐漸完善,治理體系初步形成,但由于科技進步的加速,制度建設也未必能夠及時跟進,這導致了技術創新發展與政策支持、法律規制之間的不匹配問題(劉維,2021)。具體來說,AIGC 大量進入市場對著作權法理論構成巨大挑戰。當前,中國《著作權法》中規定,著作權的指向對象為“作品”。僅從法律文本來看,我國現行知識產權法律體系均規定法律主體為享有權利、負有義務和承擔責任的人。因此,非人生產的智能化內容難以通過“作品—創作—作者”的邏輯獲得著作權的保護,這一觀點獲得了2019 年北京互聯網法院的判決支持。而在2020 年騰訊公司訴網貸之家網站轉載機器人自動撰寫的文章作品一案中,深圳南山區法院認為在滿足獨創性要求的情況下,人工智能撰寫的文章屬于著作權保護的作品。法律概念的模糊引發司法裁判的翻轉,導致AIGC 作品存在著作權歸屬不清的現實困境。這一問題不僅可能導致使用AIGC 技術創作的作品無法獲得著作權保護,阻礙人工智能技術發揮其創作價值,還有可能因人工智能的海量摹寫行為稀釋既有作品權利人的獨創性,威脅他人的合法權益。

(三)良好行業生態構建面臨挑戰

良好行業生態的構建有賴于每個企業主體的努力。目前,健康行業生態面臨一系列挑戰:一方面,當前我國AIGC 技術仍處于發展初期,具有未知性和不穩定性,大多企業尚沒有做好應對與防范風險的準備,應急處置能力有待提高,風險治理理念尚未真正落實到技術研發與應用中。這可能導致企業錯失把風險攔截在萌芽狀態的機會,為行業生態埋下隱患,一旦遭受內部威脅或外部攻擊,極易引發網絡信息內容生態安全風險。另一方面,近年來,各科技企業通過建立內容審核機制,落實互聯網內容治理主體責任,形成了“機審+人審”的基本審核方式。但在機審方面,受到審核類型、內容違規變化繁雜、網絡黑灰產對抗手段加劇等因素影響,出現審核錯誤率偏高的情況;在人審方面,因不同人審團隊在人員管理、業務流程、審核能力等方面表現各異,沒有形成統一的行業標準,缺乏專業審核人員,導致包含虛假、錯誤、違法違規信息內容流出,嚴重影響行業甚至整個網絡生態環境。

(四)企業技術管理能力建設不足

隨著數字技術的開源開放,AIGC 技術研發門檻、制作成本等不斷降低,致使市場上的企業魚龍混雜,多數企業核心能力不足,主要體現在企業技術管理能力不足。由于AIGC 技術具有動態性,且愈發復雜,這要求企業作為技術研發主體具備相應的技術研發與管理能力。但是企業的商業屬性決定了其逐利性,當資源有限時,企業會首先滿足自身盈利,而降低對技術研發和制度保障機制的投入。不同企業的核心能力差距巨大,表現為:投資積累“家底”厚實、發展時間長的企業可能有更高的技術研發和管理水平,反之水平較低。在廣闊的應用場景吸引下,眾多初入市場的小型企業在技術管理能力不達標的情況下,將AIGC 投入應用,滋生了抄襲侵權、內容造假、惡意營銷等灰黑產業鏈的溫床,阻礙了行業的健康和可持續發展。

六、發展建議與展望

AIGC 相關技術發展將為云計算、傳媒、影視、電商和醫療等行業帶來前所未有的發展機遇。與此同時,AIGC 發展也面臨商業化落地、版權確權、隱私保護等一系列挑戰。為此,本文從產學研用、法律法規、行業生態和政策引導等維度,對AIGC 的發展提出建議,并對未來發展方向進行展望。

(一)發展建議

1. 鼓勵產學研用協同,推動科技攻關

鼓勵產學研用各主體基于開源共享平臺促成協同合作、加快技術創新與應用創新。圍繞AIGC產業發展與治理需求,一是推動行業層面在算力能力、算法技術、技術落地等方面的聯合攻關,聚焦算法透明度、穩健性、偏見與歧視等技術攻關,突破行業發展瓶頸;二是鼓勵超大規模神經網絡模型的聯合研發與代碼開源,支持產學研各界通過合作構建訓練與標準測試數據集、搭建面向重點行業應用的開發者協同平臺等方式,加快共性技術和基礎產品研發、降低AIGC 應用門檻,促進產業化繁榮發展;三是探索構建行業級AIGC 參考實施框架,以生態協議、行業標準的互聯互通支撐內容生態的共建共享;四是嘗試通過推廣制度模板、制定多邊議程、發揮市場工具等手段,積極參與AIGC 應用與治理等領域的國際規則制定和全球發展合作,通過制度性輸出和影響力的擴大,支持相關產業和重點企業增強海外競爭力、爭取更大國際市場與產業話語權。

2. 完善法律法規,推進監管治理

統籌推進“技術”監管與“內容”治理,逐步完善保障AIGC 良性發展的治理體系。近年來,我國相繼頒布《網絡信息內容生態治理規定》①《網絡數據安全管理條例(征求意見稿)》②《互聯網信息服務算法推薦管理規定》③和《互聯網信息服務深度合成管理規定(征求意見稿)》④等法規??傮w而言,劃清了AIGC 相關技術發展的紅線,但就細節而言,責任認定與歸結、知識產權保護等問題尚處于起步階段。因此,仍然需要政府和相關研究機構盡早前瞻布局,完善監管與治理體系。針對AIGC 作品權屬認定等方面的法律法規缺位問題,可以從法律法規層面進一步明確AIGC 的應用范圍,明晰AIGC 技術研發與孵化、內容傳播等相關方面的主體責任;針對基于深度偽造技術的虛假內容制作和散布問題,需要監管部門對披露和標注生成內容、傳播媒介提高鑒別能力,并制定規范細化主體責任;針對模仿、抄襲或合理使用的認定標準模糊的問題,探索侵權主體及侵權責任的認定路徑,對AIGC 作品及其智力與經濟投入、技術工具及作品所依賴的數據基礎等提供平衡的保護,確保相關數字內容的合規有序流通;針對AIGC 技術及應用快速迭代的特點,探索形成法律法規動態評估、修改和廢止機制,確保法律法規和監管治理的科學化、精細化、敏捷化。同時,謹遵包容審慎理念,鼓勵立法研究的多方參與、監管手段的分級分類、行業治理的公私合作。

3. 鼓勵行業自治,共建發展生態

倡導在行業層面強化“倫理先行、自律自治”意識,共同打造AIGC 良性發展生態。鼓勵相關行業聯盟、龍頭企業、研究機構以及標準組織等發揮資源整合優勢,加強內容識別、事實核查、問題感知、違法打擊、輿情治理、版權保護等治理技術能力研究,圍繞AIGC 的合法合規應用和健康有序發展聯合制定公約、標準、指南、準則等行業制度規范,建立完善爭議解決、行業黑名單、危機應對聯動等行業自治機制,并積極開展制度宣傳、標準推廣、測試評估、標桿塑造等活動;特別是針對“算法偏見”“算法黑箱”帶來的數字內容不公正、責任主體難界定等問題,牽頭支持可解釋、可信賴的AIGC 技術框架、標準體系、評測機制等的研究和推廣。

4. 加強正向引導,賦能數實融合

市場經濟的逐利性推動了AIGC 的迅猛發展,然而,行業的健康、可持續發展卻需要主管部門的正確引導,通過政策引導充分釋放AIGC 的正面應用價值,賦能數字經濟與實體經濟深度融合。具體來說,一方面,地方政府和主管部門可以依托本地資源稟賦,結合發展需求,通過規劃指引、財政補貼、試點示范、揭榜掛帥等方式,引導數字內容產業發展,支持AIGC 技術賦能影視傳媒、社交娛樂以及電商零售等領域,推動數字內容產業跨界衍生,刺激信息消費;培育與AIGC 產業發展相匹配的內容審核技術產品和服務體系。另一方面,加強引導數據整理、算力統籌、算法開源等平臺和企業基礎能力的合規建設,堅持“以虛促實、以虛強實”基本導向,推動AIGC 技術參與生產和生活方式重構。例如,基于AIGC 技術提供逼真在線服務體驗,在商貿服務、社會服務、醫療教育服務等領域催生新業態。又如,探索以AIGC 技術為基礎,對現實世界進行人機交互更為自然、環境細節更為逼真的虛擬空間模擬仿真,推動AIGC 賦能工業制造、城市規劃、科學研究、生產辦公等領域的效力提升和價值再造,從虛擬維度優化物理世界發展。

(二)未來展望

1. 核心技術持續演進

(1)從真實可控向多樣組合發展

當前,AIGC 算法已經可以產生高質量的內容,其模型在簡單場景表現出能與人類媲美的能力,然而,針對復雜場景生成的內容依然不夠深入、缺少細節。例如,目前AIGC 生成的人臉圖像或數字人頭像已經可以做到真假難辨。相比之下,由于視頻數據的復雜性和特征的多樣性,AIGC 尚無法較好地完成視頻創作任務。同時,單一模態的內容生成無法滿足數字世界或元宇宙的需求??梢灶A見,AIGC 技術未來的發展方向將是通過不同個體間的交互進行內容生產。通過對整體的、多模態的復雜場景創作,AIGC 有望實現更多數智內容,進而反哺核心及關聯領域,促進共同發展。

(2)從本地化集中式向大規模分布式發展

作為數字經濟和實體經濟深度融合的新模式,AIGC 通過人工智能技術產生可交互的創新型、高質量數字內容,當前與未來一段時間,新一代人工智能技術的研究重點將轉向大規模分布式AIGC 交互算法。主要有以下兩方面的原因:一方面,AIGC 離不開大規模分布式深度學習技術和多智能體強化學習技術。大規模分布式AIGC 能夠高效地管理和利用計算資源,將流程拆解,通過多設備分布式計算的方式,加快內容生產流程,提高內容生成效率和質量。目前谷歌和微軟等人工智能頭部公司,已經開始布局下一代超大規模人工智能模型的分布式計算平臺,以解決大模型訓練面臨的算力緊缺、資源利用率低、模型制作效率低等難題。另一方面,大規模多智能體網絡在分布式計算的框架通過個體間的合作和競爭可以完成單體無法完成的任務。AIGC 作為促進數實深度融合乃至元宇宙的重要生產工具,需要模擬物理世界各類復雜網絡系統,包括動物群體、社交網絡、城市復雜體等。因此,深入探究大規模分布式多智能體算法,增強其拓展性、安全性、穩定性、遷移性等,將是未來重點探索的方向之一。

2. 產品類型逐漸豐富

近年來,隨著第四次科技革命的興起,AIGC 應用成為數字經濟的一個重要細分賽道。其中,數字人作為鏈接物理世界與虛擬世界的主要媒介,通過其特有的接近人類的思維以及其可交互的能力,能夠打破物理及時空的邊界。例如,用戶通過XR 技術和新一代智能終端設備,可以獲得豐富的沉浸式體驗。而可以自主生成內容的數字人或許可以成為構建人機交融、數實深度融合的未來世界的最佳載體,同時也是未來人類構建“自生成、自更新”的元宇宙新世界的必經之路。隨著新一代人工智能技術的不斷發展、數字人開發難度和成本的降低,具有自主內容生成能力的“智慧化”數字人可以進行無限的內容創作,元宇宙將為人類提供自由創造的空間。同時,基于AIGC 的元宇宙世界也無需依賴于自然宇宙的映射,而將脫離于現實世界自我生成、自我發展、自我更新。隨著通用生成式AI 技術的不斷演進,AIGC 模型不再僅僅生成文本、音頻、視頻等基本形態的作品,甚至可以創造具有情感感知和認知能力的內容。

3. 生態產業日益完善

隨著AIGC 的不斷迭代,以標準規范、技術研發、內容創作、行業應用、資產服務為核心的生態體系將日趨完善,賦能相關產業升級。標準規范為AIGC 生態構建了從技術、內容、應用、服務到監管的全過程一體化標準體系,促進AIGC 在合理合規合法的框架下良性發展。同時,在核心技術持續演進和關鍵能力顯著增強的背景下,性能更強大、邏輯更智能的AI 算法將被應用于AIGC,技術研發的不斷創新將強有力地推動內容創作,提高生成內容質量,使內容更接近人類智力水平和審美標準,同時應用于各類行業各種場景。AIGC 的繁榮發展將促進資產服務快速跟進,通過對生成內容的合規評估、資產管理、產權保護、交易服務等構成AIGC 的完整生態鏈,并進行價值重塑,充分釋放其商業潛力。隨著5G、云計算、VR、AR 等前沿技術的快速發展和新一代智能終端設備的研發創新,完整的AIGC 生態鏈是未來釋放數據要素紅利、推動傳統產業升級、促進數字經濟發展、構建數實融合一體最重要的推動力之一。

ChatGPT 自發布以來,在許多實際應用場景中發揮重要作用,將AIGC浪潮推到新的高度。本文對AIGC 進行了廣泛的概述,首先介紹了其發展演進,并梳理了每個階段的關鍵痛點堵點;隨后,本文分析了AIGC的產業機遇;最后,本文討論了AIGC及其應用的未來挑戰,并對其未來發展方向進行展望。

猜你喜歡
數字經濟產業發展
一起來認識“數字經濟”
OECD國家數字經濟戰略的經驗和啟示
從數字經濟視角解讀歐亞經濟聯盟與絲綢之路經濟帶對接
海南黑山羊研究進展與產業發展思路
景德鎮陶瓷文化創意產業發展策略探析
數字經濟對CFC規則的沖擊探究
紅色旅游產業現狀分析及發展中管理問題研究
應對數字經濟下的BEPS現象
大數據時代我國信用評級業重構研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合