?

大型語言模型之于新聞采編:機遇·挑戰·進路

2023-12-17 00:20張路正梁愷俊張晨
新聞論壇 2023年5期
關鍵詞:機遇挑戰新聞采編應對策略

張路正 梁愷俊 張晨

【內容提要】由人工智能實驗室Open AI發布的對話式大型語言模型ChatGPT具有基礎數據海量化、邏輯分析智能化、語言生成高效化等特征,對新聞采編工作具有重要影響。通過與ChatGPT對話發現,它可以輔助開展新聞策劃采訪、挖掘新聞背景信息、校驗編輯新聞,助力提升新聞報道的價值性、精準性、時效性。同時,ChatGPT也帶來了信息失真、產權糾紛、技術依賴等風險挑戰。針對機遇與挑戰,新聞工作者應注重融合性應用、創造性思考、人文性關懷。

【關鍵詞】ChatGPT? 新聞采編? 機遇挑戰? 應對策略

科學技術發展日新月異,人工智能影響愈發深遠。大型語言模型(Large Language Modeling)技術ChatGPT(Generative Pre-trained Transformer)可對用戶輸入的提問進行快速有效地回答。ChatGPT“火出圈”之際,中國各大互聯網巨頭和研究團隊也不甘示弱,積極跟進布局,百度已發布并測試“文心一言”。以ChatGPT為代表的大型語言模型技術將對諸多行業產生影響,影響最大的莫過于語言文字領域,對新聞采編工作的影響尤為明顯。ChatGPT可參與新聞的策劃、采訪、寫作、編輯、審核等工作,實現“全過程滲透”。據報道,英國《每日鏡報》和《每日快報》正在探索運用ChatGPT協作撰寫新聞報道。ChatGPT的出現,既給新聞采編工作帶來了機遇,也形成了一定的挑戰,如何取長補短,值得新聞工作者深思。

一、ChatGPT的優勢特征

ChatGPT擁有堅實的計算機硬件基礎,OpenAI公司技術人員在訓練ChatGPT模型時,使用了大規模的計算資源和高效的分布式計算技術,以便快速處理海量的文本數據,并及時優化模型參數以提高模型的準確性和性能。在高性能軟硬件的加持下,ChatGPT具備了基礎數據海量化、邏輯分析智能化、語言生成高效化等特征優勢。

(一)基礎數據海量化

ChatGPT是一款自然語言處理模型,它采用深度學習算法,在大量真實世界的語料庫上進行了長時訓練。據微軟官方微博發布的信息,ChatGPT是一個基于3000億個詞匯訓練擁有1750億參數的自然語言處理模型,它使用在大量數據上訓練的深度學習算法來生成對用戶提示的類似人類的響應。ChatGPT的訓練數據集主要分為六類:維基百科(11.4GB)、書籍(21GB)、期刊(101GB)、Reddit鏈接(50GB)、Common Crawl(570GB)和其他數據集,Total標記總量則為753GB。根據ChatGPT的答復,它的訓練數據包括1970年至2021年各種文本語料,涵蓋了全球大部分國家和地區。ChatGPT數據庫不僅基數大,且具有“滾雪球效應”,這意味著通過不斷地學習、調教和修正,ChatGPT數據庫將如雪球一樣“越滾越大”。2021年3月,OpenAI宣布其GPT-3語言模型被“超過300個應用程序使用,平均每天能夠生成45億個詞”,單個模型每分鐘能生成310萬詞語的新內容。[1]2023年2月,麻省理工學院湯普森博士在一項報告中指出,“ChatGPT在頭兩個月獲得了超過 1 億用戶,現在估計每14天產生的文本量相當于人類所有的印刷作品?!庇纱丝梢?,ChatGPT的訓練數據基礎非常扎實,且使用了深度學習算法和各種創新技術進行訓練,從而使其具有海量化的數據特征。

(二)邏輯分析智能化

最新發布的ChatGPT 建立在 OpenAI的 GPT-4語言模型之上,增加了監督學習和強化學習技術,它最主要的突破在于背后架構GPT-4中使用的Few-Shots(小樣本)和用戶反饋技術,且能對圖片進行解析回應。[2] ChatGPT經過訓練后可以根據人類提交給OpenAI應用程序編程接口(API) Playground的提示進行訓練,并對問題提供智能化響應。ChatGPT被稱為繼移動互聯網“時空革命”之后的“思維革命”,其千億級的參數規模,加上不斷學習與改進,能夠日益接近人類大腦神經的思維水平。ChatGPT在美國的大學申請者標準化考試(SAT)中處于中上游 ,在美國醫學考試的性能測試中,它與三年級醫學生的智慧大致相同。研究人員從“中國編輯記者從業資格證考試題庫”中抽取了10道單項選擇題,ChatGPT憑借其思維判斷能力答對6道,處于“及格水平”。ChatGPT可以用來處理較為復雜的問題,包括多因素分析、聯想聯系、邏輯歸納以及抽象思維等,它可以在獲得足夠的信息后自行理解問題,而且能從中提出有意義的結論??傊?,ChatGPT不僅能幫用戶解決具體問題,還能有理有據地解釋背后的邏輯,既能授人以魚,又能授人以漁。

(三)語言生成高效化

ChatGPT的語言生成高效化得益于其主要使用的GPU芯片,在AI芯片領域,GPU具有超高算力和深度學習能力,可以同時處理大量并行運算。根據瑞銀分析,ChatGPT使用了約1萬顆英偉達GPU來訓練AI模型,這些GPU具有數百上千內核,可以處理大量并行運算,比普通CPU運算速度快10至100倍。通過硬件設施的加持和不斷地訓練,ChatGPT學習了人類語言的語法、詞匯和語義,并通過特定的算法生成文本。在此基礎上,ChatGPT能夠以快速的速度提供流暢、準確和讀起來自然的響應。除了利用GPU的計算能力,ChatGPT在訓練中還應用了一些創新性的技術,例如自回歸式生成技術、分布式計算技術、批處理技術、數據緩存技術等,這些優化手段使模型的輸出更加精確和自然,進一步提高了ChatGPT的性能和效率。研究測試發現,ChatGPT在回答簡單問題時表現得宛若真人對面回答一般自然,而在處理較為復雜問題時,則需要略微耗費十幾秒的時間來響應。ChatGPT具備高效的語言生成能力,這對于大規模文本處理和合成有著重要意義。特別是在新聞寫作方面,使用ChatGPT技術能夠極大地提高高效性,甚至是一鍵生成文章。近期的一項技術測試顯示,ChatGPT生成的文章信息準確度超過98%,所耗費時間遠低于傳統寫作,這表明ChatGPT在新聞寫作編輯方面已經走在了前端。

二、ChatGPT給新聞采編工作帶來的新機遇

ChatGPT作為一項語言模型技術,與新聞工作具有廣泛的交叉融合點。ChatGPT不僅可以輔助新聞工作者進行策劃、采訪和編輯,還能協助挖掘新聞背景信息,并進行校驗審核,為新聞工作帶來了全新的機遇。

(一)輔助開展新聞采訪策劃

ChatGPT可以在新聞策劃和采訪方面提供有力地支持。作為一種基于深度學習的大型語言模型,ChatGPT可以調取龐大的在線和離線資源,幫助編輯發現新的故事線索和資料來源,并快速分析數據來揭示趨勢和新聞價值。ChatGPT技術可以幫助新聞編輯制定采訪大綱,并快速分析采訪對象的發言,挖掘重要信息,加速新聞稿件的撰寫和編輯過程。新聞工作者可以借助ChatGPT的技術元素,更快地實現制作“好新聞”的目標。此外,ChatGPT可以根據輸入的關鍵詞和背景信息生成新聞報道的初稿,節省了部分內容創作的時間和勞動力成本。

為了評估 ChatGPT 在新聞采訪寫作方面的能力,研究人員對其進行了實例測試,向ChatGPT輸入指令:

某大城市車友會發出倡議,號召私家車主“每周少開一天車”。請你以此為新聞線索準備一份采訪提綱(至少包括確定采訪對象,擬定各自的提問內容)。

在ChatGPT交流框輸入上述題干后, ChatGPT很快列出了采訪提綱(見圖1),采訪提綱包含了對交通官員、社會學家、環保團體、政府官員、交通專家的提問,覆蓋較為全面,問題具有針對性,不失為一份合格的采訪大綱。

為進一步測試其寫作能力,研究人員繼續向ChatGPT輸入指令:

請圍繞上述采訪大綱,寫一篇新聞報道。

ChatGPT很快也進行了回復(見圖2),通過將ChatGPT的答復與參考答案比較,契合度達到80%以上。邀請學界、業界專家對ChatGPT所列采訪提綱進行分析,專家評語為“考慮周全、邏輯縝密”,專家背靠背打分結果為9分(滿分10分)。由此可見,ChatGPT的邏輯分析能力較強,且能根據上下文的信息進行推理,最終提供切實可行的解決方案。

(二)輔助挖掘新聞背景信息

新聞背景信息是對新聞前景作出解釋和補充的事實,對于新聞的寫作和報道具有很大的支撐作用。記者在撰寫新聞前,需要深入挖掘新聞背景,并搜集到盡可能多的細節信息。ChatGPT具備高質量的自然語言理解和語義理解能力,能對海量新聞背景進行搜索、分析、調用,為新聞工作者提供新聞線索和創作靈感。作為一個強大的語言模型,ChatGPT可以提供多語言支持,幫助新聞工作者跨越語言障礙,進行多語言報道和翻譯工作,拓寬了新聞報道的背景范圍。ChatGPT還可以準確判斷新聞所述內容的真實性和正確性,并從多個角度細分新聞背景,識別其中的觀點、事件、人物、地點等,為報道提供深入而全面的分析(見圖3)。

(三)輔助進行新聞校驗編輯

ChatGPT在新聞校驗和編輯方面具有強大的優勢,它采用海量數據集技術,分析新聞稿件的文字句式和語義構造,進行智能化編輯,輸出文本符合新聞格式要求,實現了邏輯縝密、結構清晰、語言規范、表述準確、行文流暢等目標。此外,ChatGPT還可以對新聞稿件進行糾錯,及時發現并標識疑似錯誤的部分,并給出相應的修改方案。以“‘祝融號”火星車著陸成功”這則新聞為例,將新聞內容輸入ChatGPT語言交流框后,它能發現新聞信息中的錯誤并予以更正(見圖4)。ChatGPT將錯誤的時間“5月16日”改成了正確的“5月15日”;ChatGPT對語句進行了梳理,將“近十個月左右”改成了“近十個月”;ChatGPT對標點符號進行了校正,將句號改成了逗號。在進一步輸入完善潤色的指令后,ChatGPT對新聞的背景、意義等進行了完善,使新聞更加流暢,從而提高了新聞稿件的質量和可讀性。

三、ChatGPT給新聞采編工作帶來的挑戰

新的科技是一把雙刃劍。正如英國《衛報》記者Samantha Lock所言,ChatGPT能夠生成令人印象深刻和類似人類的文本,但帶來好處的同時也會帶來許多弊端。ChatGPT技術在傳媒領域的應用,可以成為新聞工作者的得力助手,但也存在信息失真、產權糾紛、技術依賴等風險挑戰。

(一)信息真實的風險

需要注意的是,盡管ChatGPT可以生成大量的文本,但畢竟信息來源不是絕對可靠,并且ChatGPT輸出的文字有時可能不準確或不完整,對真實度要求很高的新聞只能將它作為參考。在現代社會中,人類很難避免虛假信息的傳播,而ChatGPT作為一個回復文章的工具,其回復的準確性與真實性尤為重要,因為錯誤或虛假的信息可能會給社會帶來極大的誤導,并產生潛在的法律風險。由于ChatGPT是基于已有數據訓練而成的,可能在生成文本時受到數據偏見的影響,導致輸出內容存在失真和偏見的問題。因此,在涉及到需要辨別真假的新聞時,ChatGPT提供的信息不具有權威性,新聞工作者需小心處理這種情況,避免傳播虛假或有偏見的信息。

近日,杭州市政府據稱取消了限行措施的新聞被廣泛傳播,但浙江之聲記者調查發現該消息是不實的。[3]該事件顯示出錯誤信息的擴散速度很快,而ChatGPT的回答也有可能被惡意利用。因此,必須提高對信息真實性的警覺性,以避免錯誤信息地流傳。為了更好地了解ChatGPT的準確度,研究人員曾對其進行提問,ChatGPT也作出了坦誠地回答,表示其提供的信息不可避免地存在不準確的情況,建議使用者酌情參考并自行判斷。此外,ChatGPT所調用的大量數據資源也存在一定問題,可能存在質量低劣、信息過時等情況,這也會影響最終生成的輸出結果??傊?,在使用ChatGPT提供的答案時,需要保持謹慎并注意驗證。即使看似合理的答案內容,也需要找到源頭信息進行核實,以確保所獲信息真實可靠。[4]

(二)知識產權的糾紛

ChatGPT的訓練數據由大量人工生成的文本組成,包括在線論壇、社交媒體、新聞文章、書籍等。在用戶引導問答的過程中,ChatGPT的回答缺乏對于來源的引用,這可能會對用戶在未注明來源的情況下使用生成的內容而造成剽竊等知識產權侵犯問題。[5]ChatGPT的訓練過程中難免復制使用他人享有著作權的作品,從而存在一定著作權侵權的風險。據報道,已有國外新聞媒體指責OpenAI在不支付任何費用的情況下,使用他們的文章來訓練ChatGPT,繼而引起了相關的知識產權糾紛?!度A爾街日報》記者Francesco Marconi在網上向ChatGPT索要了一份用來訓練它的新聞來源清單,結果回復中列出了包括路透社、《紐約時報》等20家媒體,但并不清楚OpenAI是否已經與所列出的版權方達成了合作協議。使用已刊登的新聞作品對ChatGPT進行訓練,需要先從相關媒體申請授權,并達成合作協議之后才能使用相關資源,否則會被視為濫用記者作品的行為。ChatGPT將語料庫中的內容復制到自己的數據庫中,這種文本數據挖掘行為在當前仍存在著有關是否侵犯“復制權”的爭議。由于ChatGPT不具備法律人格,如果它侵犯了他人的著作權或泄露了他人的隱私,相應的法律責任將由其權利人或使用者來承擔。ChatGPT等人工智能主要通過挖掘人類日常交流和文本,進行分析和統計,對于一些受著作權保護的文本、視頻、代碼等,如果沒有獲得權利主體的授權,而直接將其復制到自己的數據庫中,并在此基礎上進行修改、組合等操作,就有可能侵犯他人的著作權。[6]

(三)技術依賴的挑戰

使用人工智能技術帶來了便利,也帶來了技術依賴的挑戰。正如馬克思關于“機器代替人”的批判中指出,“勞動用機器代替了手工勞動”“但是給工人生產了愚鈍和癡呆”。[7]隨著ChatGPT的智能化水平不斷提高,新聞工作者對于人工智能技術的依賴度也隨之增加。ChatGPT可為其提供搜集資料、數據分析、文章寫作、編輯翻譯、信息監測、人物采訪等輔助支持(見圖5)。新聞工作者可能會形成“日用而不覺”的慣性,產生技術依賴。然而,ChatGPT目前也只能在部分領域、部分方面替代人類的工作,這也帶來了一定的弊端,容易使一些人陷入思維惰性,一定程度上可能會抑制創新。新聞工作者需要明白,人工智能技術只是人類的輔助工具,不能替代人類進行智力創作,掌握應用ChatGPT的目的是提高工作效率,而不是變得懶惰和被動。

四、ChatGPT時代新聞工作者的發展進路

在以ChatGPT為代表的生成式人工智能浪潮之下,全球新聞傳播業態也將迎來技術變革與傳媒革命。作為時代脈搏的記錄者與前沿瞭望員,新聞工作者對ChatGPT等新技術應保持開放但審慎的科學態度。換言之,既不能置若罔聞,也不能過度依賴,而要主動融合應用,注重創新思考,用心用情做好新聞工作。

(一)主動融合應用

ChatGPT和新聞工作者都有獨特的優勢和局限性,而且兩者之間存在著相互補充和互動的關系。ChatGPT需要人類的監督和控制,確保它的工作是安全的。人類的監督和控制也是保障ChatGPT持續發展和協調發展的關鍵。新聞工作者和ChatGPT應該是一種協作關系,以更好地服務人類社會。首先,新聞工作者要學習掌握ChatGPT機器人與AI技術,以便有效利用自然語言處理、知識圖譜、深度學習等方面的技術手段,跟上時代的步伐。其次,新聞采編工作者應該結合媒體運作的專業精神,利用ChatGPT技術,實現自動化的新聞采編,以便提高工作效率。此外,新聞工作者可以運用ChatGPT技術創新工作,比如采用ChatGPT機器人搜索信息、統計數據、分析預測,探究事實背后的本質特點,以便把握社會、政治、經濟等方面的發展趨勢。為了更好地運用人工智能技術,記者應當加強自己的專業技能,不斷學習有關ChatGPT機器人和AI技術的最新發展,了解ChatGPT等人工智能技術的原理和應用邊界,提高自己技術水平,以便更好地解讀信息、把握趨勢,讓技術能力與技術管理協同發展。

(二)注重創造思考

ChatGPT的優勢在于邏輯推理,但缺乏真正的思考能力。因此,ChatGPT應該被視為人類的輔助工具,主要擔任技術性工作,缺乏創新能力。換句話說,ChatGPT無法完全代替人類從事新聞策劃、編輯審核等重要職能,人類才是智慧、創造力和情感等方面的最終歸宿。首先,新聞工作者應該了解最新的市場發展趨勢,并把握市場變化。同時,重視媒體文化創意,樹立獨特的媒體視角,借助ChatGPT機器人和網絡營銷手段推動自身發展。其次,新聞工作者應該加強自己的新聞思維,學習掌握新聞趨勢,并善于發現真正有價值的信息,而不僅僅追蹤人工智能技術所關注的內容。新聞工作者不應當因人工智能的優越性與便利產生技術和思想依賴,而是要堅持自身的主導者地位,確保人文情懷和專業素養在新聞報道中得到體現。[8]再次,新聞工作者需要不斷激發想象力和創造力。新聞工作者可以多參與藝術、文化等領域的活動,擴大自己的視野和思維方式。在寫作和報道過程中,可以嘗試運用隱喻、比喻等修辭手法,通過詩意的語言和富有表現力的文字來提升報道的藝術性和創造力??傊?,新聞工作者應該保持開放和靈活的思維,善于與人工智能技術進行交互和合作,將ChatGPT作為輔助工具,重視創造性思考,不斷提高自己的專業技能,以滿足現代新聞市場的需求。

(三)傾注人文情懷

新聞工作并非僅僅追求事實的本身,還需要注重人情味、深入洞悉社會現狀,輸出自己的觀點和見解。這需要在“智性”的基礎上,更多地融入“人性”關懷,傾聽被采訪對象的心聲,與受眾進行積極互動,引發共情共鳴。新聞工作者在新聞策劃、采訪、寫作以及編輯等各個環節中,必須注重體現人文情懷,傳遞信息的同時也要表達情感,提升受眾的參與感,真正讓他們感知新聞的溫度和人性。新聞工作者應始終堅持價值導向,注重報道的社會責任和公共利益。人工智能可以輔助生成新聞內容,但只有新聞工作者能夠賦予信息真實、客觀、多元的價值,通過深度采訪和深入調查揭示問題的本質,以人的情感和道德底線為基準進行判斷和挖掘。同時,新聞工作者還需要深入基層、深入現場,探究社會思潮,貼近實際、貼近生活、貼近群眾,與人工智能形成差異化競爭,從而更好地服務于公眾。

作為新聞從業者,除了技術技能外,良好的人文思維和新聞思維能力同樣至關重要,這些能力使受眾更好地認識到新聞報道的潛在價值、重要性、獨特性,并理解新聞在社會中的角色。新聞工作者應該運用人類智慧和寫作技能,將自己的觀察、思考和情感融入到新聞報道中,賦予新聞作品獨特的人文魅力,讓讀者更好地理解和共情。

五、結語

ChatGPT等大型語言模型的出現和快速迭代給新聞工作者帶來了機遇和挑戰,為了適應大型語言模型技術的發展,新聞工作者需要不斷學習技能和更新理念,尤其要在技術融合、創新思考、人文關懷方面下功夫。本文是關于ChatGPT對新聞采編實踐影響的全面分析,是在以ChatGPT類產品為代表的智能化浪潮下,利用ChatGPT開展新聞采編的一次嘗試性實踐研究。毋庸諱言的是,囿于時間、技術和篇幅,本研究仍存在以下不足,如無法對近期和遠期即將出現的產品或服務趨勢做出準確預測;由于中國版的ChatGPT尚未上線,且不能直接使用國外版ChatGPT,只能采用網絡上提供的ChatGPT接口進行測試,導致相關數據的精準性不夠高。團隊后續會在國內新的同類產品出現后加以深入對比研究,為新聞工作者提供更加符合本土化需求的分析結果與建議。

參考文獻:

[1]OpenAI官方博客.GPT-3為下一代應用程序提供動力[EB/OL].[2021-03-25].https://openai.com/blog/gpt-3-apps/.

[2]文巧,高涵.ChatGPT為何能“打敗”眾多大模型,除了千億級參數,還有什么?[EB/OL].[2023-02-20]. https://www.nbd.com.cn/articles/2023-02-20/2677040.html.

[3]呂霞,崔欣.“杭州3月1號取消限行”為不實信息!警方已介入調查[EB/OL].[2023-02-21].http://jsnews.jschina.com.cn/piyao/swrd/202302/t20230221_3166497.shtml.

[4]王樹義,張慶薇.ChatGPT給科研工作者帶來的機遇與挑戰[J].圖書館論壇,2023,43(03):109-118.

[5]李若一,王林,賈驥業. ChatGPT背后的知識產權風險[N].中國青年報,2023-02-21(006).

[6]韓永軍. ChatGPT進入法治研究視野[N].人民郵電,2023-02-17(008).

[7][德]卡爾·馬克思.馬克思恩格斯選集(第一卷)[M].北京:人民出版社,2012.

[8]李紫賢,覃信剛.人工智能在新聞傳播安全中的運用研究[J].新聞論壇,2023,37(01):94-96.

作者簡介:張路正,江西師范大學新聞傳播學院講師,碩士生導師,博士;梁愷俊,江西師范大學軟件學院碩士研究生;張晨,江西師范大學新聞與傳播學院碩士研究生

編輯:文? 言

猜你喜歡
機遇挑戰新聞采編應對策略
“機器人新聞寫作”對新聞采編的機遇和挑戰
大數據時代背景下人力資源管理所面臨的機遇分析
媒介融合背景下的新聞采編新路徑探索
新媒體環境下的廣播電視臺新聞采編技巧探究
電視新聞采編存在的問題及應對策略研究
筑牢洪災后的輿情“堤壩”
利率市場化改革對商業銀行的挑戰及應對策略研究
我國信用評級業存在的問題及應對策略
大眾攝影時代新聞攝影的挑戰和機遇
營口市現代物流業發展現狀分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合