?

出版業人工智能大語言模型應用管窺

2024-03-09 10:32秦艷華李一凡閆玲玲符家寧侯玉麗
中國傳媒科技 2024年1期
關鍵詞:出版業人工智能語言

秦艷華 李一凡 閆玲玲 符家寧 侯玉麗

摘要:【目的】探討人工智能大語言模型在出版業的應用現狀和未來發展趨勢?!痉椒ā客ㄟ^搜集整理現有數據和資料,歸納分析大語言模型在出版業的具體應用案例,分析應用中隱藏的問題,并提出針對性解決策略?!窘Y果】研究發現,大語言模型在出版業的應用,既為出版業發展帶來了重大機遇,也可能導致“技術異化”的諸多問題?!窘Y論】大語言模型在出版業的應用,從通用型轉向專用化、場景化,從高門檻轉向簡易化、輕量化,從數據分散轉向數據協同,將成為趨勢,出版業需要以更加開放包容的心態積極擁抱新技術。

關鍵詞:出版;人工智能;大語言模型;ChatGPT? ? ? ? ? ? ? 中圖分類號:G220? ? ? ? ? ? 文獻標識碼:A

文章編號:1671-0134(2024)01-034-07? ? ? ? ?DOI:10.19483/j.cnki.11-4653/n.2024.01.005

本文著錄格式:秦艷華,李一凡,閆玲玲,符家寧,侯玉麗.出版業人工智能大語言模型應用管窺[J].中國傳媒科技,2024,31(1):34-40.

2022年11月30日,美國人工智能研究實驗室Open AI向全世界公開發布了ChatGPT。這是一款由人工智能技術驅動的自然語言處理工具,它實現了機器學習算法發展中自然語言處理領域的歷史性跨越。這一人工智能大語言模型可分析海量的數據,基于特定輸入參數生成原創內容且極其類似于人類創作的文本。大語言模型作為當今人工智能技術的最新成果,給出版這一內容產業帶來了深遠影響和巨大沖擊。對大語言模型在出版業的應用現狀進行分析,探討這一技術為出版業發展帶來的重大機遇與挑戰,提出積極應對之策,并展望其未來前景,對于推動出版業數字化轉型升級、實現出版深度融合發展,具有重要的現實意義,也具有長遠的戰略意義。

1.出版業大語言模型的應用

2023年4月底,世界報業和新聞出版協會(WAN-IFRA)與施??死眨⊿chickler)咨詢公司聯手,針對全球100多位新聞媒體人進行調研,評估新聞媒體使用大語言模型的情況。[1]調查顯示,截至2023年5月,約有一半的出版企業正在積極使用ChatGPT或類似工具,70%的人預計這些工具將對記者有極大幫助。目前,國內外出版企業及與出版企業相關的科技公司正在積極探索使用大語言模型為出版業務賦能。

1.1? ?國外出版業大語言模型的應用

1.1.1? ?科企研發

國外已開發的大語言模型不在少數,目前在出版業使用較為廣泛的大語言模型如表1所示。

國外的一些大型出版企業紛紛加入到大語言模型開發、應用行列,如美國霍頓·米夫林出版公司(Houghton Mifflin Harcourt)在其寫作練習和評估解決方案Writable中,集成OpenAI公司的生成式人工智能能力,為用戶提供了更個性化的寫作指導和評估;英國麥克米倫教育出版公司(Macmillan Learning)宣布與Packback公司達成合作,把人工智能能力與課程材料相結合;德國斯普林格自然出版公司(Springer Nature)在2023年夏收購了美國的人工智能平臺protocols.io,此后,又收購了荷蘭的人工智能創新公司Slimmer AI等。

1.1.2? ?行業應用

在國外,ChatGPT參與圖書生產,可以嵌入到內容生成、選題策劃、創作編輯、插圖設計、有聲制作、圖書營銷等環節中。

內容生成:截至2023年12月21日,在亞馬遜官網以“高級檢索”方式,檢索署名作者為“ChatGPT”的書籍,已有1051本,以“AI”為作者的書籍則更多。以ChatGPT為作者的書籍,主要有自我描摹類工具書,如《ChatGPT入門教程》等、故事小說、基礎教材等?!皻W洲刑警組織(Europol)”的一份報告預測,到2026年,互聯網上多達90%的內容可能是由AI創建或編輯的。[2]這意味著AI將深刻影響出版的內容生產。

選題策劃:大語言模型在選題策劃中的參與,是通過持續性對話,激發作者靈感,進而協助圖書創作。以ChatGPT為代表的大語言模型為作者提供全面細致的選題素材,使作者節省大量案頭工作時間。亞馬遜kindle平臺上架了大量ChatGPT參與編著的書籍,其中不少書籍的選題策劃是由ChatGPT單獨完成的。選題策劃—文本創作—全文校對—編輯出版的全過程,傳統書籍或要歷時一年以上,但是ChatGPT將這一過程簡化,壓縮了生產時間,實現了快速上線。不過,需要指出的是,這樣的快速生產,是以犧牲倫理與美學為代價的。大語言模型的技術邏輯不可避免地對圖書版權和藝術倫理造成威脅,對話式的交流也容易造成對人類思想與文化創造的隱形竊取。

編輯加工:Google團隊在2023年2月發布的大語言模型LaMDA驅動的Bard,可以使用較少的計算能力,使其擴展到更多的人并提供反饋。Google首席執行官Sundar Pichai在接受《紐約時報》播客采訪時表示,升級版的Bard基于更為強大的模型,在編程能力與邏輯推理能力上有進一步的提升,并在數學運算上有一定突破。緊隨其后,Anthropic在3月發布類似ChatGPT的產品Claude,7月升級后的Claude 2的處理能力已經提升到了100K個Token,這意味著它可以處理數百頁的技術文檔,甚至是整本書。

插圖設計:根據內容進行形象創作,設計圖書封面與插圖,常用的大語言模型有Midjourney AI、Adobe Firefly等。大語言模型對于插圖的創作,可以是具象的也可以是抽象的。Alice and Sparkle是作者阿瑪爾·雷希(Ammaar Reshi)使用ChatGPT、MidJourney等人工智能工具創作的一本兒童繪本。該書以AI工具繪圖被世界各地的媒體廣泛報道,但同時也引發了大量負面評論,一些讀者指出書中圖文不符的情況并不少見。

多語種有聲讀物制作:微軟公司在2023年3月18日發布了一款人工智能工具——VALL.E,它經過了60 000小時英語語音數據的訓練,只需3秒的音頻樣本,就可以模仿人的語音輸出。2023年6月,Meta公司聲稱研制出“迄今功能最強大的語音生成式人工智能Voicebox”,該工具使用了“流匹配”方法,其表現優于當前最先進生成式語音系統使用的擴散模型。據悉,Voicebox能說6種語言:英語、法語、西班牙語、德語、波蘭語和葡萄牙語。[3]

營銷服務:在圖書營銷方面,大語言模型可以更好地為讀者提供精準服務。如英國的shimmr公司推出的Shimmr.AI突破了傳統的推薦算法,利用Trajectory推薦系統來使圖書內容與讀者閱讀偏好雙向匹配,通過自動化流程將內容和最合適的讀者之間聯系起來,強調“書發現讀者”的反向可發現性。[4]

1.2? ?國內出版業大語言模型的應用

1.2.1? ?科企研發

目前國內眾多單位和企業都研發了符合自身發展目標的大語言模型,包括通用、工業、科研、商業等多個類型。截至2023年12月21日,據不完全統計,我國共有189個單位研發出202個大語言模型,針對出版業應用的、具有代表性的大語言模型主要有如下幾種(表2)。

就出版企業來看,有的引入了科技企業研發的通用大語言模型,有的則自主研發適用于出版業的專業大語言模型。前者如上海報業集團旗下澎湃新聞成為百度“文心一言”的首批體驗官,力圖打造內容生態人工智能全系產品及服務;蘇州新聞出版集團旗下新聞客戶端“引力播”也接入“文心一言”大語言模型,期望以此賦能出版流程、模式、內容等眾多方面的創新;后者如蜜度公司發布的“蜜度文修”智能校對模型、中文在線集團推出的“中文逍遙”內容創作大語言模型等,在出版的不同環節促進了業務創新。

1.2.2? ?學界探磧

近年來,學術領域對出版業和大語言模型的耦合展開了豐富研究,通過在中國知網中輸入“人工智能”“出版”兩個關鍵詞,在2023年11月22日抓取2004~2023年間的相關文獻,并將關鍵詞進行聚類分析后,整理出結果如圖1所示。以“人工智能”“數字出版”“智能出版”為主題的文獻大量出現,表明出版界、學術界對于人工智能技術在出版業應用的重視。

隨著人工智能技術的不斷成熟以及出版業發展戰略、發展模式的持續更新,“智能出版”這個概念應運而生。有學者認為智能出版是以智能化的數字技術將作品編輯加工后,經過復制進行傳播的新型出版[5]。智能出版是強調數字智能技術并以此為依托作用于出版的整個流程,為內部生產與外部使用提供定制化、自動化、智能化服務的出版新方向,是一個隨著技術的革新不斷擴充和發展的概念。

1.2.3? ?行業應用

目前國內出版業對人工智能大語言模型的應用持慎重而樂觀的態度,雖然還未將大語言模型完全應用于圖書出版全流程,但在部分圖書出版環節,比如輔助內容生產、編輯校對、發行營銷等方面已有大語言模型應用的探索和實踐。

內容生成:大語言模型通過大量語言樣本加上人工標注的數據來訓練,具有極強的文本生成創作能力,目前主要包括視覺產品創作和聽覺產品創作。2023年3月,華齡出版社出版了由人工智能大語言模型生成的圖書《ChatGPT:AI革命》。

專攻于聽覺方面的大語言模型,也是近年來一個創新性較強的領域,SALMONN就是大語言模型中一個典型的聽覺模型,它是清華大學聯合字節跳動解鎖通用聽覺人工智能的大語言模型,具有強大的技術功能和廣泛的應用范圍,在輸入層面,能夠感知和理解各種類型的音頻內容輸入,包括多語言語音識別和翻譯以及語音推理等功能;在輸出層面,能夠勝任英語語音識別、英語到中文的語音翻譯、情感識別、音頻字幕生成、音樂描述等重要的語音和音頻任務,同時可以進行基于音頻的故事生成、音頻問答、語音和音頻聯合推理等任務。

在喜馬拉雅的TTS(語音合成)技術支持下,2023年第一季度,喜馬拉雅AIGC專輯數同比增長354%,是2021年前總量的近3倍。全年,AIGC內容用戶播放時長同比增長207%。

編輯校對:當前,大語言模型在一定程度上可以替代人類編輯的部分功能,比如可以檢查語法、提供內容摘要、創建通知、為新聞通訊或社交媒體平臺量身定制,并將書面內容轉換為播客或視頻的腳本。尤其是在校對方面,大語言模型得到了較為完善的發展。例如2023年星圖比特與果麥文化聯合推出AI校審產品,提供對文章錯字、語法錯誤、敏感詞錯誤、網絡熱詞等進行審校排查和分析的相關場景和服務,結合“多審多?!惫δ苋轿惶嵘谋举|量,降低差錯率。

營銷服務:除了內容生成、編輯校對環節外,大語言模型在直達用戶的營銷服務方面也取得了一些成就。通過大語言模型原理可全面認識和深入學習圖書,向讀者進行既權威全面、又有差異性和針對性的個性化推薦。讀者既可以快速得到一本書的簡介,也可以通過輸入特定要求獲取推薦的書目,從而縮短讀者觸達圖書的路徑,具有極大的應用前景。AI大語言模型允許媒體組織為特定讀者群體定制內容,可以顯著降低出版商的運營成本,簡化重復性手動任務,減輕員工工作量。

雙向賦能:目前雖然大語言模型對出版行業發揮了較強的創新變革功能,但出版行業也反過來完善了大語言模型訓練本身。出版行業有大量權威的文本信息和語料,可以為通用大語言模型訓練提供高質量的數據集。出版文本庫已經成為眾多大語言模型自研單位訓練“養料”的可靠來源之一,數量、質量都有較高的保障。

2.新機遇:出版業大語言模型應用引發產業變革

當前,在我國,隨著大數據、人工智能等技術的不斷發展,出版業將更加深入地應用這些技術以提高出版效率和質量,同時拓展出版物的傳播渠道和消費群體。大語言模型引發出版產業變革,對于促進出版深度融合發展具有引領和推動作用。

2.1? ?政策環境優化

在“十二五”到“十四五”規劃期間,國家從宏觀層面對人工智能新技術和新產業給予了巨大支持。頂層設計從方向性引導轉變為強調實際應用和場景創新,并進一步細化和深化。2016年起,人工智能作為熱門領域吸引了眾多企業布局。2017年國務院印發《新一代人工智能發展規劃》,將人工智能提升至國家戰略層面的高度,指出到2025年人工智能基礎理論實現重大突破,到2030年我國人工智能理論、技術與應用總體達到世界領先水平,成為世界主要人工智能創新中心。此后,在2021年《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》、2022年《關于支持建設新一代人工智能示范應用場景的通知》等系列文件中,進一步強調并支持人工智能在多行業、多領域的應用發展。國家高度重視人工智能產業的安全可信和倫理秩序,強調規范科技倫理,趨利避害。2023年4月,面對ChatGPT類大語言模型的火熱出圈,國家互聯網信息辦公室及時出臺《大語言模型服務管理辦法(征求意見稿)》,進一步促進大語言模型的規范應用和產業整體的高質量發展。

新時代、新技術催生了新的出版生態。在出版業,技術已經滲透到出版全環節、全流程并且越來越發揮著重要作用,政策和規范條例紛紛出臺為出版產業善用技術提供了制度保障和方向指引。2022年4月,中宣部印發《關于推動出版深度融合發展的實施意見》中明確提出“加強前沿技術的探索應用”“強化大數據、云計算、人工智能、區塊鏈等技術應用,創新驅動出版深度融合發展”。從對新型出版傳播體系的要求可以看出,我國融合出版要形成深度化、體系化、整體化的規模發展,就必須嵌入新媒介技術環境,以適應國家發展需要和時代變革需求。無論是宏觀層面的規劃指導還是出版細分領域的實施意見,我國在社會層面營造了良好的政策環境,助力人工智能市場及在出版業應用的健康發展。

2.2? ?催生出版新需求

在圖書編輯活動中運用AI技術已不鮮見,AI能夠高效完成圖書內容的加工整理、圖片識別、輸出格式轉換、智能翻譯、內容查重和語音交互等任務。[6]目前,大語言模型已經嘗試運用于出版各流程中,大語言模型的突出能力與編輯日常工作緊密貼合,可以有效幫助編輯提高工作效率,提升編輯生產力,不僅能夠成為選題策劃的輔助手段,為編輯把握用戶需求、發掘適宜作者等提供更為準確的參考,而且可以成為書稿審校的得力助手,還可以成為提升翻譯質效的寶貴工具,產生比傳統機器翻譯更自然、準確的回應和比譯者更高的效率,有效幫助圖書編輯將外語圖書迅速轉換為本土語言出版。

大語言模型為出版業跨模態生產提供了進一步的可能,有望提升出版產品創新力。在日常生活中,視覺和語言是最常見且重要的兩種模態。然而,大語言模型若只能生成單一模態的內容,將使應用場景極為有限,不足以推動內容生成方式的革新。大語言模型產業生態當前已經在文本、音頻、視頻等多模態交互功能上持續演化升級,奠定了多場景的商用基礎。多款大語言模型具備了跨模態、跨語言的深度語義理解與生成能力,為出版業提供了更多的可能性。在大語言模型生成文本的基礎上,跨模態生成技術有望進一步幫助出版方迅速打造以紙質圖書為主、融合一種乃至多種媒體形式和技術形成的融媒圖書,增強圖書的趣味性和讀者沉浸感,真正實現出版的深度數字化轉型。

2.3? ?賦能營銷推廣

首先,大語言模型可充當引流工具。大語言模型在國內外已經收割了相當規模的流量,收獲了一定的關注熱度。其問答和多輪對話形式激發了大眾的熱情和創造力,許多網友嘗試使用ChatGPT并發文分享使用體驗,刷屏社交平臺。出版商可以將大語言模型技術整合融入自身產品中,提升用戶滿意度,還能夠將其作為引流工具,為用戶開辟大語言模型新的使用入口,增加自身品牌、產品的吸引力和曝光度。

其次,大語言模型可優化營銷方案。大語言模型能夠利用其海量級的數據訓練成果,預測出版商擬定的營銷方式將產生的實際效果,幫助出版商以低成本獲得營銷方案的最優解,實現精準有效的營銷。此外,出版商還可以通過輸入聚焦特定用戶的營銷與推廣的需求,借助大語言模型生成個性推廣文案,提高自身關注度。

最后,大語言模型可提升出版物的可發現性。大語言模型具備強大的問答服務與文本分析能力,通過分析提取出圖書文本的內容關鍵詞等“DNA”,可以幫助出版商實現搜索引擎優化(SEO),提升圖書搜索與讀者需求之間的適配度,從而增加讀者在網絡上發現該出版物的可能。這大大減輕了圖書營銷人員的推廣壓力,使他們能夠為長尾效應中的作者與作品負責,而非只專注于那些頭部熱門書籍,從而保持良好的出版發展生態。

2.4? ?提高媒介人性化

補償性媒介(Remedial Medium)是由保羅·萊文森提出的,認為每一種媒介都是對前一種媒介的革新,這種革新都補償了其原先的不足。[7]媒介演化的歷史就是媒介補償的歷史。人工智能大語言模型以高精度、高流暢的文本響應模擬了從“人—機”到“人—人”的對話情景,體現出媒介發展“以人為本”的底層邏輯,充當了補償媒介的角色,主要體現在兩方面:一方面,提供情感需求補償。[8]例如,將大語言模型應用于出版社的客服溝通環節,可對讀者提問輸出內容的語氣、情感進行檢測,并以與人類高度相似的知識理解水平與語言表達反饋,增加交流感與信任感,可以給予讀者情感和心理層面的補償;另一方面,提供精細化信息分發補償。傳統的算法分發機制通過機器抓取用戶數據后描繪用戶畫像,進而提供個性化內容,但這種機制更多是針對某一類用戶進行內容分發,而大語言模型則是以單個用戶為核心,在與特定讀者的交流過程中不斷學習,提供更智能化的語義識別使其能夠提供精準且流暢的回答,滿足讀者的使用需求與期望,增加讀者黏性。通過分析讀者閱讀習慣、閱讀要求等對圖書內容進行個性化解析,大語言模型可以幫助讀者理解龐大、復雜的文本結構,提高閱讀效率。

3.新挑戰:出版業應用大語言模型面臨的問題與對策

出版業大語言模型應用展現出機遇與挑戰并存的態勢。大語言模型在圖書出版業的應用已經呈現出一些亟須解決的問題,需引起警惕與深思。

3.1? ?出版業應用大語言模型存在的問題

在創作層面,創作者過分依賴技術可能帶來“異化”?!爱惢钡谋疽鉃槭柽h、脫離、轉讓、向他者轉化等,在一般意義上,異化是指人的活動及其產物對人的目的的背離。[9]大語言模型為出版業帶來深刻變革的同時,也有可能在一定程度上將創作者異化為“單向度的人”。這種異化主要體現在兩方面:自主性的剝奪和創新性的喪失。大語言模型幫助創作者在短時間內獲取大量自己所需要的信息,這是其優勢之處,但其提供的信息也具有它固有的思考邏輯,從而影響創作者的思維方式。同時,信息內容甚至是寫作思路的“伸手即來”,容易在一定程度上加深創作者對機器人的依賴,久而久之將會使其懶于深度思考和創造新內容,極大地限制了創作者的想象力。當技術成為創作者實踐活動的主宰時,會潛移默化地操縱其行為與意識,使創作者不再自主自由,甚至甘愿成為技術的奴隸。異化是新技術發展過程中必須審慎看待的哲學問題和文化問題,創作者的異化將對以“內容為王”的出版業產生巨大的負面影響。

在內容生成層面,質量參差不齊,藝術性存在隱憂。AI幻覺在學界并無明確的定義,其概念可理解為:人們過度信任與依賴人工智能所生產的信息,并未考慮其信息的正確性,AI產出的錯誤性信息流入大眾信息網絡造成的虛假信息與幻覺現象。提高AI模型的輸出真實性,避免AI“異想天開”,成為重要且緊迫的問題。同時人工智能是基于技術邏輯的內容生成,生成的某些抽象派的作品只是色塊的拼接,不具有原創作品的一體化的風格,也幾乎不可能具備很高的藝術意義和教養價值。該類“作品”在根源上背離了藝術創作的初衷。當一個社會的藝術創作大多數是由冷冰冰的機器生成時,藝術市場將會迎來一場破壞性的變革,整個社會的文化發展亦存在隱憂。

在社會保障層面,相關法律亟待完善,應用失衡將引發新的數字不平等。大語言模型產出的作品進入市場后,版權問題突出。國外法律依據判例法,此前相關條文無法作為判定大語言模型創作產品版權糾紛的依據。而在我國,即使關于人工智能創作的作品依照相關文件精神判定,但是依舊缺乏體系成文的法律效力對人工智能創作的作品進行標準化的保護與規范。此外,大語言模型的應用失衡也帶來新的社會問題。以出版社為例,頭部出版社聚集著大量的優質資源,具備雄厚的資金支持,有助于促進出版社工作人員的數字素養進修和大語言模型的應用。在技術參與的助力下,無論是出版內容上的多樣性,還是出版過程的審核校對均具有層級性的提高,進一步加大了出版社之間因技術而造成的生產力差距。

3.2? ?解決對策

和諧人機關系、加強審核監管、完善法治建設等,是應對新挑戰的有效對策。

3.2.1? ?明確人機主次,實現協同發展

大語言模型為創新出版業態、傳播方式和運營模式提供了良好契機。在知識生產方式的重大變革中,面對人機協同的模式,需要進一步明確人與技術的主次關系。無論技術的更新還是社會的變遷,始終都是“以人為中心”的,人的各方面素養都亟須提升。面對人可能被大語言模型異化的困境,應該回歸人的主體性,提高人在數智時代的媒介使用素養,以平衡好人和機器之間的關系。

在政府層面,應注重對全社會的人工智能普及教育,縮小大語言模型使用層面的數字鴻溝。近年來有學者提出了數智鴻溝的概念,比之前的“信息溝”和“數字鴻溝”更進一步,認為在當前智能化背景下,存在著很多被邊緣化而不自知的隱形“數智難民”,他們無法享受大語言模型帶來的時代紅利。政府應肩負起引領的責任,采取各種措施幫助弱勢群體縮小數字鴻溝,如頒布前瞻性政策法規,加強出版行業從業者的職業培訓,完善數字基礎設施,加強對大語言模型知識的宣傳普及教育等。

3.2.2? ?加強審核監管,提升編輯素養

智能技術應用于出版,使得出版生態、出版產品形態等都發生了重大變化。大語言模型傳播錯誤信息,有可能使出版失去其基本功能。因此,ChatGPT類大語言模型不斷進行技術發展與迭代更新的同時,也亟須監管技術的研發。對大語言模型的產出進行內容審核與糾正把關,對其可能涉及的個人隱私信息以及侵權內容進行攔截輸出,這在提升大語言模型產出質量的同時,還能進一步保護人的權利。以不侵犯他人權利為前提,在輸出內容正確的基礎上,大語言模型的創作才更具有創造產出的價值意義。

大語言模型所產生的幻覺需要人來糾偏,出版業編輯的把關人位置顯得尤為重要,對編輯職業素養也提出了更高要求。智能時代的編輯職業素養既表現為對編輯基本素養如職業道德修養、文化知識水平、社會交往能力等的繼承和發揚光大,又表現為在面對和應用智能技術時的科學精神、技術素養等。

大語言模型的高效輸出源于對數據庫中信息的人工標記與智能標記。在圖書出版業、有聲閱讀市場、影視制作行業,加速研發大語言模型信息識別的標記技術,提升信息識別的準確性,并進行細致化的識別—分類—管理—應用,為大語言模型提供信息明確的數據庫,也能進一步提升創造產出質量,避免不相關的信息元素混入以及虛假信息、垃圾信息、過時信息等不良信息的干擾。

3.2.3? ?完善法律保護,增強權利意識

大語言模型由人類研發,目的是便捷人類的生活,因此人始終是技術發展的核心。當人的權利受到技術的侵犯時,必要的法律保護與相關完善完備的法制體系建設迫在眉睫。針對大語言模型的創作管理辦法,以及處理大語言模型產出作品的版權糾紛的法律依據等,都需要引起相關部門重視,并加速推進立法。

大語言模型的問世在刺激人們的責任意識的同時,也刺激了人們的權利意識與專業意識的進一步提升。一方面,重視人類主觀創造的權利意識。在大語言模型的智能威脅下,人類靈活應用工具的同時,也更加注重人類思想的創新表達與傳播。另一方面,對自身專業領域的深入研究意識得到進一步加強。大語言模型數據庫的繁雜和高密度的預訓練,帶來的是廣泛的知識基礎而不是“專精深”的知識體系。因此,人類在使用ChatGPT類大語言模型時,更應注重自身對細分領域專業素質的培養。[10]

4.新方向:出版業應用大語言模型的未來趨勢

從通用型轉向專用化、場景化。通用型是指適用于多領域和任務的大語言模型,專用型則是大語言模型被設計專用于特定領域或特定任務場景。未來,大語言模型將有望與出版業深度融合,增強專業性,實現通用型和出版專業型大語言模型并行發展,滿足出版多種場景需求。傳統模型往往只能針對性地支持單一類模態,而在通用型大語言模型從“單模態”轉向“多模態”發展的基礎上,出版專用大語言模型通過預訓練和專用預訓練實現業務場景應用,將能夠更好地滿足多樣化的出版形態,促進垂直領域進一步發展。

從高門檻轉向簡易化、輕量化。大語言模型的簡易化發展將實現以最簡單便捷的操作實現數據的隨時提取與生成,滿足用戶需求。這意味著出版專用大語言模型將為作者提供更加直觀友好的創作工具,為編輯提供更多自動化功能,為用戶提供更多個性化定制服務。另一方面,成本壓力促使大語言模型朝輕量化發展。大語言模型的特點為大數據、大任務和大參數,因此訓練大語言模型需要較高計算資源和計算成本。大語言模型應用于專業領域必須實現其輕量化,降低成本開銷。

從數據分散轉向數據協同。大語言模型已經在技術上實現內容的有效產出,但這一產出行為依賴龐大的數據資源。目前專門針對出版業的數據庫規模較小[11],這會使出版業在圖書推薦、精準營銷等方面面臨“冷啟動”問題——因缺乏預訓練所需的規模數據資源,無法讓出版專用大語言模型成功搭建并良好運轉。專用型大語言模型的發展是大勢所趨,這意味著在未來各個出版企業需要從數據分散轉向數據協同。通過集中數據,可以獲得更多的數據樣本,從而提高模型的準確性和可靠性。出版企業之間的合作和信息共享,會提高整個行業的效率和競爭力?;跀祿f同、數據隱私和安全問題、數據格式和標準的統一性等問題也將得到重視與解決。

結語

大語言模型的出現為出版業帶來了重大發展機遇,其在出版實踐中的應用,包括文本生成、自動翻譯、校對排版、營銷推廣等,已初顯成效,節省了大量的人力和物力成本。但不可否認,它也給傳統出版業帶來生成內容過剩、加劇數字鴻溝等的負面沖擊。

出版業需要以更加開放包容的心態積極擁抱新技術,將大語言模型與出版業務相結合,發揮各自的優勢形成新的發展優勢。此外,出版專用型大語言模型的搭建也為聚合開發者、高校、實驗室、出版企業等多方資源提供了契機,在促進學術研究和技術應用普及的同時,重塑新的出版生態。

參考文獻:

[1] Dean Roper.Gauging Generative AIs Impact in Newsrooms[EB/OL].(2023-5-24)[2023-11-22].https://wan-ifra.org/insight/gauging-generative-ais-impact-in-newsrooms.

[2] 3年內90%網絡內容或由AI編制,科技大公司如何阻止虛假信息?[EB/OL].(2023-6-6)[2023-12-26].https://m.thepaper.cn/newsDetail_forward_23374311.

[3] 趙秋玥.迄今最復雜人工智能語音模型創建[EB/OL]. (2023-6-26)/[2023-12-26]. http://www.news.cn/tech/20230626/9e1a7807acc54f2c868a71b776d986b3/c.html.

[4] Artificial Intelligence:Threat,Opportunity,and Shimmr[EB/OL].(2023-7-31)[2023-11-22].https://publishingperspectives.com/2023/07/ai-building-shimmr-on-the-threat-opportunity-continuum.

[5] 張新新,齊江蕾.智能出版述評:概念、邏輯與形態[J].出版廣角,2021(13):21-25.

[6] 武菲菲.人工智能技術與出版行業的融合應用[J].出版廣角,2018(1):26-28.

[7]? [美]保羅·萊文森.軟利器:信息革命的自然歷史與未來[M].何道寬,譯.上海:復旦大學出版社,2011:91.

[8] 秦艷華,閆玲玲,李一凡.媒介可供性視角下大語言模型ChatGPT應用于出版業的對策研究[J].出版與印刷,2023(3):20-30.

[9] 何士清,徐勛.科技異化及其法律治理:基于以人為本的視角[M].北京:中國社會科學出版社,2010:45.

[10] 段佳宇,鄭汝可,李倩.人機協作背景下AI對新聞業人才培養帶來的改變與挑戰[J].中國傳媒科技,2023(8):14-19.

[11] 謝澤杭,李武.從賦能到融合:生成式AI出版的價值、困境與發展圖景[J]. 編輯學刊,2023(6):13-19.

作者簡介:秦艷華(1965-),女,山東煙臺,教授,博士生導師,國家新聞出版署重點實驗室“出版業用戶行為大數據分析與應用重點實驗室”主任,北京師范大學新聞傳播學院,研究方向為新媒體研究、編輯出版;李一凡(1995-),女,山西陽泉,博士研究生,北京師范大學新聞傳播學院,研究方向為新媒體研究、編輯出版;閆玲玲(1995-),女,河北邯鄲,博士研究生,北京師范大學新聞傳播學院,研究方向為新媒體研究、編輯出版;符家寧(1997-),女,河南信陽,博士研究生,北京師范大學新聞傳播學院,研究方向為新媒體研究、編輯出版;侯玉麗(2001-),女,河南焦作,碩士研究生,北京師范大學新聞傳播學院,研究方向為新媒體研究、編輯出版。

(責任編輯:李凈)

猜你喜歡
出版業人工智能語言
以按需出版為抓手,推動出版業數字化轉型
語言是刀
2019:人工智能
人工智能與就業
讓語言描寫搖曳多姿
數讀人工智能
累積動態分析下的同聲傳譯語言壓縮
AR與VR技術在兒童出版業中的應用
下一幕,人工智能!
對出版業供給側改革的思考
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合