周文婷?劉瑩
【摘要】結合學業界已有研究和實踐,對生成式出版的開放性內容生產、低成本高效率、一站式出版流程、個性化用戶服務等內涵特征進行深入分析,并從生產可供性、行動者網絡對生成式出版的實踐進路進行客觀總結,同時從技術層面和行業層面作出必要反思,以期為新時期出版業布局新賽道、新領域,以科技賦能出版新興業態,加速轉型升級和實現高質量發展提供有益啟示。
【關? 鍵? 詞】AIGC;生成式人工智能;生成式出版;科技賦能;新興業態
【作者單位】周文婷,東北大學出版社;劉瑩,東北大學出版社。
【基金項目】上海出版傳媒研究院招標課題“生成式AI時代圖書編輯繼續教育模式的創新性探究”(SAYB2306)階段性研究成果;教育部人文社會科學基金青年項目“中小型高校出版社策劃編輯入門培養機制研究”(19YJC860056)階段性研究成果。
【中圖分類號】G230.7【文獻標識碼】A【DOI】10.16491/j.cnki.cn45-1216/g2.2024.03.010
2023年被稱為AIGC“元年”。這一年,以出版業為代表的內容行業積極進軍生成式人工智能技術領域,不斷加大AI研發及應用力度,以期將高新技術嵌入行業生產全流程,開啟生成式出版新征程。2023年12月,中國音像與數字出版協會發布《出版業生成式人工智能技術應用指南》團體標準并宣布自2024年1月20日起正式實施,為AIGC時代的行業轉型和產業升級指明了方向。未來,在新一代人工智能技術的強勢賦能下,生成式出版必將成為行業發展新興業態。在此背景下,積極了解和把握生成式出版的內涵特征,不斷摸索和進一步完善其實踐進路,并作出科學、及時、有效的技術反思,是出版業高質量發展和轉型升級的關鍵。
一、生成式出版的內涵特征
生成式出版作為AIGC時代的新興業態,是科技賦能出版的有力體現,也是數字出版向智能出版甚至智慧出版過渡的必然階段,其本質是利用新一代生成式人工智能技術驅動出版業的內容、流程和服務創新,從電子出版、互聯網出版、數據出版等發展階段邁入更高級的智能出版發展階段。在這一過程中,基于新一代人工智能技術優勢,我們可分析和總結生成式出版的四大發展特征。
1.開放性內容生產
從內容生產角度來看,開放性是生成式出版的核心特征,主要表現在兩個方面。一是內容規模和生產方式層面。生成式出版借助AIGC強大的技術優勢和爬取能力,能夠開放獲取海量數據資源(包括無標注文本數據和人工標注數據),經由專業大模型的反復訓練后,可根據用戶指令生成或創造新的出版內容。二是內容模態和呈現形態層面。生成式出版利用AIGC同時支持生成文字、圖片、音頻、視頻等多模態內容的機制,可為不同用戶群體定制多元出版產品,并實現不同模態內容的同時輸出和相互關聯,真正實現“一種內容,多次開發”的理想目標。未來,隨著AIGC開放獲取和生成能力的進一步增強,生成式出版的內容生產必將涵蓋文字、音視頻等多個領域,甚至“可以面向增強現實出版物提供3D模型、面向虛擬現實出版物提供數字化虛擬環境”,實現跨越式發展。
2.低成本高效率
低成本高效率是生成式出版的另一大重要特征。得益于AIGC強大的技術優勢,在內容生產過程中,生成式出版的實際成本和產出效率得到顯著優化,切實達到降本增效的目的。
從生產成本層面來看,生成式出版的成本大大降低,以有聲出版最具代表性。有聲書以往主要采用真人錄制方式,錄制環節冗長,對軌和審聽過多依賴人工,導致出版成本高昂。利用AIGC賦能,生成式有聲出版的投入成本將大幅降低,如在Reflect Audio打造的有聲讀物制作平臺,AI有聲書的生產速度超過500萬字/天,錄制成本可降低90%以上。在傳統圖書出版領域,生成式出版依托AIGC技術賦能可實現AI選題、AI生成、AI編輯、AI校對等目標,這同樣可以降低出版機構的人力、時間等成本支出。
從生產效率層面來看,生成式出版利用AIGC技術可大幅縮短整個生產周期,進一步提高出版效率?!俄n國經濟日報》報道,韓國出版商Snowfox Books在新書《找到人生目標的45種方法》(45 Ways to Find the Purpose of Life)內容創作與生產過程中利用ChatGPT撰文、Papago翻譯(韓國科技巨頭Naver研發的翻譯軟件)以及AI韓語檢查工具(釜山大學AI實驗室和韓國新創Nara Info Tech共同開發)校對,用時不到10小時。未來,隨著AIGC技術不斷迭代升級,生成式出版的內容生產周期和質量穩定性還將進一步優化。
3.一站式出版流程
從運行流程來看,一站式是生成式出版的重要特征。所謂一站式出版流程,主要是指在AIGC賦能作用下,生成式出版可實現從前期內容選題、創作、編輯、校對,到后期產品推廣、運營等的自主運作。2023年6月,電子工業出版社與京東圖書聯合舉辦“大模型時代——AIGC內容創作產業論壇暨《大模型時代》與《人人都能玩賺AI繪畫》新書發布會”,其中《大模型時代:ChatGPT拉開硅基文明序幕》一書便是由司馬華鵬和團隊先勾勒內容框架和文稿脈絡,再通過ChatGPT完成撰稿工作的。此外,該書的推廣和銷售也有AI參與,真正實現“一本AI寫的書,且由AI去銷售”的目標。
不僅如此,在有聲出版領域,利用“AIGC+TTS”技術組合,還能將傳統文本無縫轉換為音頻資源,從而實現從傳統紙質書到AI有聲書的一站式輸出。由此可見,依托AIGC技術優勢,生成式出版在某種程度上已經具備了流程再造和自主運行能力,其較傳統出版業態不僅能達到降本增效的目的,還能在大幅釋放出版生產力和內容價值的同時,將從業人員從煩瑣、機械的工作流程中解放出來,去從事更具挑戰性和創造意義的工作,以此開啟行業的“第二增長曲線”。
4.個性化用戶服務
從用戶服務來看,個性化是生成式出版的又一重要特征。以往的出版業態多是出版機構單向進行內容輸出或知識傳播,雖有不同的用戶群體定位,但仍較難實現“千人千面”的個性化服務目標。在AIGC賦能作用下,生成式出版憑借多模態內容輸出和及時交互優勢,打造的產品不再是單純的圖書、數字閱讀物,而是多元內容平臺,可供讀者用戶自行檢索并精準生成其所需的內容,從而實現“千人千面”的個性化服務目標。2023年10月,喜馬拉雅珠峰實驗室與西北工業大學aslp lab合作研發的珠峰語音生成式技術正式亮相2023云棲大會,并成功應用于喜馬拉雅APP的“爸媽講故事”功能板塊。該技術具備快速實現語音音色和風格定制功能,同時支持豐富場景下的實時轉換,用戶僅需簡單錄制5段文本交由系統進行AI模型訓練并定制聲音,便可在海量中外名著、偵探故事、詩詞國學、童話寓言等有聲出版資源的閱讀過程中充分享受親子共讀的個性化服務體驗。隨著AIGC技術進一步強化和完善,生成式出版在按需定制、個性化服務等方面發展前景非??捎^,將給讀者帶來前所未有的體驗。
二、生成式出版的實踐進路
生成式出版雖未大規模落地應用,但已成為國內外眾多機構、平臺新的競爭賽道和布局重點。根據國內外部分出版機構、內容平臺、網絡企業等已有實踐來看,生成式出版正邁向垂直細分領域,是新時代內容行業轉型升級和高質量發展的新驅動。因此,本文總結已有成功經驗,為更多出版機構進入新技術領域和新發展階段提供路徑選擇和實踐參考,以實現“科技賦能出版”的目標。
1.基于生產可供性的生成式出版實踐進路
生產可供性包括專業出版商信息生產的主體性和大眾讀者群體信息生產的能動性兩方面。截至2023年底,AIGC賦能的生成式出版已經成為行業布局重點,盡管這一新興業態具有開放性內容生產、低成本高效率、一站式出版流程以及個性化用戶服務等優勢,但也有觀點表明,技術可能造成“恐怖谷效應”“數字極簡主義心理”等問題。因此,從生產可供性角度推動生成式出版落地發展,成為不少出版機構、內容平臺、傳媒企業的首要選擇。
從專業出版商信息生產維度來看,生成式出版具有傳統出版難以匹敵的生產能力和規模效應,能最大限度地實現降本增效的目的。但是,規?;a也容易導致讀者群體對生成式出版產品的質疑,如質量能否得到保證、隱私安全問題如何解決等。為打破用戶市場的刻板印象,一些專業出版商付出巨大努力,基于專業大模型建設、內容資源專業性與權威性保障、個性化服務成效等考量,啟動生成式出版業務布局。例如,在2023年9月舉辦的第十三屆中國數字出版博覽會上,中國新聞出版研究院、北京版上閱動科技公司聯合推出“版閱AI內容服務平臺”,該平臺以大語言模型在新聞出版行業垂直領域的深度應用為目標,以智譜AI自主研發的GLM-130B大模型為支撐,以中國新聞出版研究院權威的基礎研究數據為保障,為行業提供智能、安全、可靠的審校服務、對話式AI應用以及綜合解決方案,這可視作生成式出版落地應用的基礎性嘗試。
從讀者群體信息生產維度來看,生成式出版具有個性化服務優勢和即時交互特性,能給讀者帶來前所未有的閱讀服務體驗。因此,以“受眾即市場”為核心追求,將讀者群體的主觀能動性納入生成式出版的內容生產維度,也是行業布局與實踐的重點,這在一些內容平臺上表現得尤為明顯。例如,喜馬拉雅APP“爸媽講故事”功能板塊創造性地運用珠峰語音生成式技術,利用聽眾讀者提供的語音數據樣本,為他們量身定制個性化閱讀方案。為進一步增強生成式出版的內容互動性和用戶體驗感,有聲閱讀平臺“云聽”利用AIGC技術賦能,在聲音出版領域開創諸多新玩法,如聯合農業農村節目中心成功打造集線上聲音采集、用戶互動、數據可視于一體的科文融合產品——“鄉音博物館”,推出粵、湘、吳等7大語言館,為AIGC時代的有聲出版發展提供諸多經驗啟示。不可忽視的是,無論是AIGC技術的發展程度,還是生成式出版的實踐應用,仍處于初步探索階段,包括專業出版社、內容平臺等在內的行業機構獲得的實踐經驗較有限,面向讀者群體所提供的內容服務和閱讀體驗還不足以完全釋放其主觀能動性,未來仍需不斷優化和調整。
2.基于行動者網絡的生成式出版實踐進路
生成式出版從理論到實踐需要資源、技術等要素配合,僅靠行業內部驅動難以達到理想目的,唯有集聚多元行動主體的有效力量,才能實現預期目標。
首先,行業內部合作實踐,包括出版社與出版社、出版社與內容平臺之間的協同發展,聯合布局生成式出版業務領域。例如,入選2023年度出版融合發展工程名單的“好好嘮科——少兒科普知識服務平臺”項目便由數傳集團與吉林科學技術出版社攜手打造。該平臺主要以數智技術為依托,依托專業出版機構海量的內容資源優勢,為新時代的青少年群體提供多元科普百科知識。以猿輔導為代表的在線教育公司自成立圖書業務線后,與新華出版社、華東理工大學出版社等多家教育出版機構達成了戰略合作協議,目前已推出新一代智能教輔產品《我們的語文》等。華東理工大學出版社副社長王雪表示,未來出版社將在內容研究和市場拓展方面繼續發揮自身優勢,同時結合猿輔導在內容研發和技術賦能教育方面的強大能力,加快教育出版數字化乃至智能化的發展速度[1]。
在生成式出版業務布局的當下,傳統出版社與新興內容企業攜手合作的案例不斷增多,這在教育出版領域尤為明顯:日新月異的技術發展和線上教育的旺盛需求,使得智慧教育出版不斷提速,傳統出版社尤其是中小型出版社由于自身技術短板和成本限制,必然要積極尋求外力援助,而內容企業尤其是在線教育企業本就具有技術優勢,加上與出版社合作歷史悠久,自然成為生成式出版業務落地的主要實踐進路。
其次,行業外部合作實踐,具體是指出版機構、高校以及技術企業之間就生成式出版業務建立跨界合作和協同發展關系。2023年2月,人民交通出版社宣布將接入百度“文心一言”,成為其首批生態合作伙伴,旨在通過與頭部科技公司開展戰略合作,將AIGC及智能對話技術成果創造性應用于專業出版領域,為生成式出版的實踐落地和快速發展提供助力。目前,百度“文心一言”已經與人民交通出版社、上海辭書出版社、四川人民出版社、中文在線等出版和文化機構形成合作關系,是生成式出版從理論走向實踐的重要助力。
為進一步強化技術適配性,加快生成式出版的實踐應用速度,一些出版機構與技術公司、高校達成合作關系,旨在以“資源+技術+人才”的多主體協同模式助力生成式出版落地發展。2023年8月,高等教育出版社發布與浙江大學、阿里云和華院計算等單位共同研制,面向教育出版領域的垂直大模型“智?!と龢贰?,該模型以阿里云通義千問70億參數通用模型為基座,利用出版社與高校的核心教材、學術資源等高質量語料和專業指令數據集,建成專注于“人工智能+教育出版”領域的專業系統,從而為教育出版領域的現實需求提供優質而高效的技術解決方案。此外,中華書局古聯公司與南京農業大學信息管理學院于2023年內聯合研發“荀子”古籍大語言模型;中信集團自2023年5月成立平行出版實驗室后,開始嘗試與作者和大模型技術公司合作進行語言訓練,開發智能閱讀應用產品;中國知網于2023年9月發布出版傳媒行業大模型和文化遺產大模型,同時推出AIGC檢測服務系統,為出版傳媒行業提供AI選題策劃、AI增強檢索等各類應用工具。上述行業實踐表明,隨著多主體行動網絡的形成,生成式出版不僅進入實踐應用階段,還向古籍出版、數據服務等行業細分領域滲透??梢?,跨界合作不僅是生成式出版落地實踐的重要進路,也是出版業深度融合的有效手段。
三、生成式出版的發展反思
在生成式出版落地實踐的發展背景下,我們既要看到高新技術賦能出版轉型升級的利好機遇,也要警惕這些技術可能造成的現實危機。作為一種新興出版業態,生成式出版極可能助力行業邁入轉型升級的新階段,但同時也可能引發諸多新問題,帶來諸多新挑戰,為此我們必須作出反思。
1.技術層面——警惕技術濫用
AIGC雖能強勢賦能生成式出版落地應用,但也極易導致技術濫用現象。其一,過度依賴技術賦能和算法賦值,導致生成式出版內容的真實性、權威性較難得到保障。自2023年初以來,《紐約時報》等多家外媒多次報道,AI生成的書籍正大量充斥于亞馬遜等電商平臺,這些書籍涉及范圍較廣,且部分內容存在“某些錯誤信息”。其二,技術濫用極易導致敏感信息泄露,由此引發隱私安全問題。當生成式出版投入使用并與讀者用戶交互,出于獲取精準用戶畫像的目的,其往往會收集、存儲并分析用戶數據,這可能危及用戶隱私安全,甚至成為生成式出版大規模普及應用的威脅。
對此,一方面,國家及行業相關部門應制定技術應用標準和法律規范,在鼓勵行業技術創新應用的同時,合理預防和及時治理生成式出版領域的技術濫用現象。例如,相關立法部門可在《中華人民共和國民法典》《中華人民共和國個人信息保護法》的現行條款里合理納入《生成式人工智能服務管理暫行辦法》等內容,就AIGC技術應用場景、范圍、服務內容等作出細化規定,為行業提供實踐準則,避免技術濫用導致虛假出版等問題。出版機構、內容平臺、傳媒企業等部門需要在《出版業生成式人工智能技術應用指南》的基礎上進一步完善行業技術應用細則,確保生成式出版商及相關服務商在資源爬取與訓練、內容生成與公開、信息存儲與分析等實踐過程中不濫用算法技術并做到全程可控。
另一方面,相關技術商和出版方應遵循“技術規制技術”的發展原則,研發更高級、更敏感的技術解決方案,為生成式出版的實踐應用和長效發展保駕護航。正如人民教育出版社編輯楊凡所言,通過模型優化訓練的方式防止再次生成虛假不實的內容雖然通過一般技術難以實現,但利用價值對齊的算法、采取內容過濾等措施或可實現[2]。未來在生成式出版發展過程中,出版機構和技術商應針對技術濫用可能導致的出版內容不實和隱私安全問題聯合開發更先進、高效的智能應用工具,制定更科學的解決方案。
2.行業層面——規避侵權危機
生成式出版可能造成的內容侵權問題亟須重視和解決。生成式人工智能技術強大的數據爬取能力和內容生成能力,加之TOC模式帶來的巨大傳播效應,極易造成內容侵權危機。2023年7月,8500多名海外文學作家聯合發表《致生成式人工智能領導者的公開信》,并呼吁OpenAI、Meta、Microsoft等技術研發商的首席執行官在AI內容生成領域就版權保護問題征得所有權人同意并給予補償。生成式出版主要通過大量已出版作品訓練和生成“新內容”,極易出現版權侵權問題,而當存在侵權問題的生成式出版物大量流入市場,不僅會侵害原作者和著作權人的合法權益,也會侵害讀者用戶的知情權,同時還可能因為同質化內容競爭導致“劣幣驅逐良幣”的現象頻繁發生。據《紐約時報》和彭博社的一項媒體采訪結果,不少新聞出版機構的高管表示,以生成式人工智能技術為代表的AIGC機制會顛覆行業已有運行模式,讀者受眾的注意力將被不斷稀釋和轉移,而這也容易導致出版機構的市場體量和用戶規模大幅減少,甚至引發生存危機。
針對上述問題,可從以下幾個方面著手解決。
一是建立行業聯盟并制定監管原則。目前,以《紐約時報》為代表的全球2000多家媒體、出版機構已經組成發展聯盟并發布相關草案,加大版權保護力度。據已披露的草案內容,該聯盟強烈呼吁科技公司為高質量、值得信賴的專業內容付費。2023年6月,中國工人出版社、同方知網、中文在線等26家業界單位共同發布國內首個有關AIGC訓練數據版權的倡議書,旨在通過行業聯盟喚醒國內AI企業關于大模型訓練數據的版權意識,并為AIGC研發者規避版權爭議提供方向性指引。不僅如此,行業聯盟還有利于攜手共建專注于出版業的資源庫和大模型,在強化版權保護力度的同時,以互利共贏為基礎進一步釋放版權價值效益,利用高質量出版資源的共建共享,有效避免生成式出版可能出現的內容不實、非法傳播等問題。值得一提的是,在生成式出版模型建立過程中,無論出版機構、內容平臺,還是技術商、服務商,都應明確標注內容來源,以此保護版權方和讀者用戶權益。
二是深化與第三方技術供應商的合作力度,通過引入智能審核工具和智慧解決方案,及時發現、認定和處理內容侵權問題,保障版權所有者的合法權益。例如,清華大學人工智能研究院發起成立的瑞萊智慧(RealAI)便是全球為數不多、專為生成式內容檢測以及給大模型安全系統“挑刺”的人工智能產品。出版機構、內容平臺等在嘗試建立生成式出版業務線的同時,可與此類企業合作,針對行業現實需要聯合開發先進、高效的AI出版技術應用工具,為預防和解決生成內容侵權問題提供有效支撐,確保行業及市場的長效發展和良好運行。
|參考文獻|
[1]繆晨霞,賈寧. 繼續探索圖書領域,猿輔導與多家出版社簽訂戰略協議[N]. 新京報,2023-09-03.
[2]楊凡. AI時代的教育出版研究:以生成式AI為技術驅動力[J]. 出版廣角,2023(16):27-31.