?

AIGC 賦能智慧圖書館建設:基礎、特征、場景及策略?

2023-04-18 22:13胡安琪
高校圖書館工作 2023年5期
關鍵詞:模態人工智能智慧

●胡安琪

蘇州科技大學圖書館,蘇州,215009

引言

2017 年,微軟人工智能少女“小冰”完成了世界首部完全由人工智能創作的詩集《陽光失了玻璃窗》。 2018 年,世界上首個由人工智能創作的肖像畫《埃德蒙·貝拉米》在佳士得拍賣行以43.25 萬美元成交,成為第一幅被拍賣的人工智能藝術品[1]。 2022 年, OpenAI 的大型語言生成模型ChatGPT 在各大領域掀起熱潮,自公開試用以來,其用戶規模在兩個月內破億,其具有高情商多輪對話和自動生成圖片、文本、代碼、音視頻等能力,深受用戶喜愛。 ChatGPT 的火爆出圈也引起學界對人工智能生成內容(Artificial Intelligence Generated Content,AIGC)的高度關注。 2022 年9 月,中國信息通信研究院發布了《人工智能生成內容(AIGC)白皮書(2022 年)》,其中對AIGC 進行了定義,即AIGC 既是從內容生產者角度進行分類的一類內容,又是一種內容生產方式,還是用于內容自動化生成的一類技術集合[2]。 AIGC 技術實現了低成本的自動化內容生產,這一內容生產方式的轉變將重塑內容生產供給行業,推動行業邁向新臺階。

目前,圖書館的內容生產模式仍以專業生產內容(Professional Generated Content,PGC)和用戶生產內容(User Generated Content,UGC)為主,這兩種內容生產模式的效率并不高且人機交互的智能性不強,從而導致用戶體驗不佳。 AIGC 的出現與發展,將推動圖書館內容生產模式的變革,實現“PGC+UGC”向“PGC+UGC+AIGC”轉變。 同時,在國家積極推進全國智慧圖書館體系建設的背景下,AIGC 的發展也為智慧圖書館建設帶來了巨大的機遇。 隨著AIGC 技術的不斷成熟和應用場景的大規模普及,以及圖書館智能化要求的提高,未來AIGC 在智慧圖書館內容生產中的比重將大幅提升。

1 圖書館內容生產模式的歷史演化

現代圖書館正在經歷從數字圖書館向智慧圖書館的變革,人工智能技術的出現與優化加速了這一進程,同時也推動了圖書館內容生產模式由“PGC”向“PGC+UGC”再向“PGC+UGC+AIGC”演化。

1.1 專業生產內容模式

PGC 是數字圖書館建設初期的主要內容生產模式,此時的互聯網是靜態互聯網,其資源組織方式還是經典的目錄式分類[3],內容的創建及發布權主要在專業人員手中,他們借助鼠標、鍵盤等傳統輸入設備生產內容,用戶只能通過圖書館官方網頁瀏覽內容,無法參與到內容的生產過程中。 該模式生產的內容具有較強的專業性,因而生產的內容質量較高,但其內容生產規模有限,內容生產成本會隨著內容生產量的增加而不斷提升[4]。

1.2 用戶生產內容模式

數字圖書館向智慧圖書館過渡的主要內容生產模式是UGC,但這并不意味著對PGC 的摒棄,而是二者的疊加,即“UGC+PGC”。 在圖書館轉型發展的過渡時期,移動互聯網、社交媒體等平臺大量涌現[5],內容生成及發布權由專家讓渡給用戶,用戶通過語音操作、隔空手勢識別等方式生產錄入內容,成為內容生產的中堅力量。 用戶從自身需求出發生產內容,內容呈現出個性化、多元化等特征,并借助平臺推薦系統觸達具有類似需求的用戶。 該模式生產的內容呈現規?;卣?在很大程度上豐富了圖書館的資源,但其背后存在內容質量參差不齊的問題,用戶的內容生產很難在保證內容質量和原創性的情況下兼顧更新頻率。 因此,此種內容生產模式引發的效率問題亟待解決。

1.3 人工智能生成內容模式

AIGC 將成為智慧圖書館時代標志性的內容生產模式,在智慧圖書館發展階段,內容生產模式轉變為“PGC+UGC+AIGC”。 AIGC 是利用人工智能技術驅動機器創作內容,目前主要用于生成文本、圖像、音頻、視頻等模態的信息。 早期的AIGC 基于小模型展開,為了與特定場景任務相匹配,這類模型需要特殊的標注數據訓練,因此,該模型通用性較差,無法任意遷移。 2014 年,生成對抗網絡(Generative Adversarial Networks,GAN)誕生,使AIGC 轉向大模型領域,在大數據、大算力與強算法的支撐下,AIGC實現了各種模態內容的生成。 2022 年11 月,OpenAI 發布了ChatGPT,以此為代表的大模型AIGC 能夠以對話的方式,在理解用戶問題和上下文語境的基礎上滿足用戶多樣化的信息需求,并且可以在提問和回答的交互中通過基于強人工反饋的自主學習完成與用戶的共同進步[6]。 AIGC 具有內容生產規模大、質量高、單位成本低的優勢,將成為智慧圖書館的主要內容生產模式。 未來,隨著AIGC模型的迭代更新,智慧圖書館內容將不斷創新和發展。

2 AIGC 賦能智慧圖書館建設的技術基礎

目前,AIGC 能夠實現文本、圖像、音頻、視頻等不同模態數據的生成與相互轉換,將其應用于智慧圖書館建設,自然離不開底層支撐技術。 其中,計算機視覺技術、自然語言處理技術、多模態大模型技術作為AIGC 的關鍵技術支撐,將推動智慧圖書館海量數字內容的孿生、編輯和創作[7]。

2.1 計算機視覺技術支撐智慧圖書館數字孿生

智慧圖書館數字孿生是指將現實圖書館中的物理屬性(如物體的大小、形狀、顏色等)和社會屬性(如主體行為、主體間關系等)進行數字化,建立從現實圖書館到虛擬圖書館的映射。 智慧圖書館數字孿生需要運用計算機視覺技術中的智能增強和智能轉譯技術。 智慧圖書館在數據內容采集、存儲、傳輸過程中可能會出現數據缺失、損壞等現象,運用智能增強技術可以消除上述問題,將原有的低質量原始數據經過增強后生成高質量數字內容,使現實中的數據內容在虛擬世界中完成數字孿生并重構完整的客觀世界。 相比于智能增強技術,智能轉譯技術更加注重不同模態數字內容間的相互理解、融合和轉換。 在智慧圖書館建設進程中產生了大量文本、圖像、音頻、視頻等多模態數據,為了與某些特定的服務場景相適應,需要進行大量的數據內容轉換。 例如,利用智能轉譯技術將語音信息進行字幕合成,依據文本內容進行語音轉換,甚至是將給定的圖像、視頻轉換成文本、語音等[8]。

2.2 自然語言處理技術支撐智慧圖書館內容編輯

智慧圖書館內容編輯旨在對虛擬世界進行編輯,從而直接對物理世界產生作用,實現實時反饋和互動。 智慧圖書館內容編輯需要運用到自然語言處理技術中的語義理解技術和屬性控制技術。 語義理解技術是對數字內容進行編輯的基礎,智慧圖書館包含的數字內容大多以多模態形式呈現,且內容由多種不同的語義信息組成,早期的語義理解技術無法處理語義糾纏問題,隨著自然語言處理技術的進一步發展,基于生成模型的可解耦語義學習技術誕生,通過理解并學習不同語義成分的變化,可解耦語義學習技術對數據內容有更深刻的理解。 在語義理解技術的基礎上,數字內容的智能屬性控制技術將直接根據用戶給定的屬性,對原有數字內容進行修改、編輯。 屬性控制技術可以被運用于智能圖像編輯、文本改寫、智能調音等工作任務中,從而提高智慧圖書館數字內容的創作效率。

2.3 多模態大模型技術支撐智慧圖書館內容創作

智慧圖書館內容創作可以分為基于模仿的創作和基于概念的創作。 基于模仿的創作需要人工智能模型先觀察人類的作品,通過學習這類作品的外部特征和內在特征,然后進行模仿式的創作。 2018年,世界上首個出售的人工智能藝術品就是人工智能模型基于模仿創作的佳品。 基于概念的創作不再是簡單地對某一類型的作品進行觀察和模仿,而是致力于在海量數據中學習抽象的概念,進而通過對不同概念的組合進行全新創作。 基于概念的創作需要依賴算法模型對多模態數據進行理解、融合及生成,多模態大模型技術的迭代升級為智慧圖書館基于概念的創作帶來了極大的發揮空間。 多模態大模型技術主要用于尋找不同模態數據間的對應關系以及實現不同模態數據間的相互轉化和生成。 基于多模態大模型技術,AIGC 具備了更加接近人類的創作能力。 例如,近期火爆的ChatGPT,在極大程度上繁榮了內容市場,在內容創作領域發揮了巨大價值。

3 AIGC 賦能智慧圖書館建設的內在特征

AIGC 正越來越多地參與數字內容的創意生產工作,以人機協同的方式釋放價值,成為新一代互聯網的內容生產基礎設施。 智慧圖書館建設的重點目標是為廣大用戶群體提供智慧化服務,AIGC 在底層技術支撐下將推動智慧圖書館跨越式發展,同時呈現出用戶體驗升級、內容生產效率高、個性化特征顯著、雙向實時交互增強等內在特征。

3.1 用戶體驗升級

區塊鏈、人工智能、虛擬現實、5G/6G 等技術的迅猛發展,推動智慧圖書館向元宇宙空間延伸,實現“在線”向“在場”轉變,AIGC 將成為打造圖書館虛擬世界的重要基石。 AIGC 除了能夠生產文本、圖片、音頻、視頻等二維內容,還能結合虛擬現實技術生產三維的立體物、場景及數字人。 在AIGC 技術的支撐下,用戶能夠在虛擬場館中體驗各種文化活動,用手觸摸三維立體書籍、文化藝術品等,還能與各類用戶的虛擬化身進行實時交互,包括對話、握手、共同合作完成某項任務等,當用戶的視覺、聽覺、觸覺、嗅覺、味覺等多感官交織在一起時,用戶體驗將產生跨越式提升。

3.2 內容生產效率高

AIGC 賦能智慧圖書館建設的一個顯著特征是內容生產效率大幅度提高。 相較于PGC 和UGC,AIGC 可以在很短時間內生成大量數字內容,使其服務于智慧圖書館建設。 隨著多模態大模型的不斷優化,AIGC 能夠從大量數據中學習并識別人類無法發現的復雜內容。 因此,未來AIGC 可能在內容生成質量上超越人類。 此外,AIGC 還具有規模遞減優勢,即隨著AIGC 生產內容規模的擴大,單位內容產生的邊際成本趨近于零。 此外,AIGC 賦能下的人機協同生產模式能夠釋放工作人員的時間和精力,將部分程序化任務交由人工智能完成,工作人員則能夠將更多精力專注于服務形式及內容的深度創新,從而不斷提高內容生產效率。

3.3 個性化特征顯著

以ChatGPT 為代表的AIGC 模型擁有對話情境理解能力,該能力能夠依據用戶的歷史對話信息理解用戶實際知識需求,并結合當前學習內容,為用戶提供個性化學習支持[9-10]。 同時,AIGC 還能夠通過多輪對話發現用戶對某些內容的錯誤理解,進而及時糾正,為用戶提供符合其年齡、身份的個性化內容。 此外,AIGC 技術還能夠與云計算、大數據等技術緊密結合,全面記錄用戶的個人身份信息、借閱信息及搜索信息,并不斷模仿人腦的思維方式進行自主學習[11],主動分析用戶的多樣化信息需求,提取關鍵信息,從而為用戶進行個性化服務推薦[12],實現內容服務的精準觸達。

3.4 雙向實時交互增強

從人工智能的實踐成果來看,目前,AI 交互類產品種類很多,但早期的AI 交互類產品大多以“語義預定義型”規則為主,這些AI 交互類產品可以輔助用戶進行交互行為,但它們是基于用戶的習慣性行為需求而產生的,因此,不會對用戶交互行為生態產生重要影響。 而內容生成式AI 產品聚焦于“語義生成型”規則,在尊重用戶習慣性交互行為的前提下,又具有一定的行為方式引導性,進而從根本上重塑了用戶交互行為的生態結構[13]。 ChatGPT 聊天機器人模型是內容生成式AI 的代表性產品,其能夠學習并理解人類語言,與用戶進行自然、連貫的多輪對話[14],能夠對用戶提出的問題產生質疑,并為用戶提供多種解決方案。 當智慧圖書館引入AIGC類產品,用戶與機器、環境的交互模式將發生重大轉變,交互的即時性和高效性將顯著提升。

4 AIGC 賦能智慧圖書館建設的應用場景

目前,人工智能時代已經到來,智慧圖書館必須緊緊抓住AIGC 的時代機遇。 在計算機視覺、自然語言處理、多模態大模型等底層技術的支撐下,將用戶體驗升級、內容生產效率高、個性化特征顯著、雙向實時交互增強等內在特征作為AIGC 與智慧圖書館融合發展的運行邏輯,積極探索AIGC 賦能下的智慧圖書館建設場景與應用,從而推動智慧圖書館內容生態螺旋式上升發展。

4.1 智慧生產系統:多元化生產

智慧圖書館時代也是“模型”主導內容生成的時代,以人為主的知識生產將被以機器為主的內容生產取代。 因此,智慧圖書館可以利用AIGC 技術打造全新的智慧生產系統。 智慧圖書館的智慧生產系統包括兩大部分:一是原有館藏資源的數字孿生,即將AIGC 與計算機圖形學、區塊鏈等技術相結合,將智慧圖書館館藏資源以數字孿生的形式進行復刻,實現實體館藏數字化。 通過這種方式,將會實現館藏資源在虛擬空間的永續保存。 二是原生數字資源生產,AIGC 技術支撐下的原生數字資源生產需要依靠多模態通用大模型、強算力和大規模訓練數據,而圖書館是數據內容的聚集地,除了擁有書目、論文、專利等文獻資源數據和用戶個人資料、閱讀行為等用戶數據[15],還包括各種傳感器動態實時捕捉的智慧圖書館環境狀態數據[16],這些數據將融入AIGC 的整體架構中,成為預訓練數據的一部分。AIGC 賦能下的智慧圖書館不僅可以大規模生產出文本、圖片、音頻、視頻等內容,還能進一步生產出3D 物品、虛擬場景、數字人等內容,并實現多模態數據內容的轉換生成。 2022 年9 月,谷歌發布了文本生成3D 模型工具DreamFusion,同年12 月,英偉達在NeurIPS 上展示了AIGC 模型GET3D,該模型具備生成具有顯示紋理的3D 網格的能力,可根據2D圖像快速合成3D 物體,這2 個模型在生成速度和分辨率上都在不斷升級,智慧圖書館可以借助此類工具重塑圖書館內容生態,拓寬現實世界和虛擬世界的邊界,為用戶提供虛實融合的沉浸式體驗。

4.2 智慧檢索系統:生成式檢索

在數字圖書館信息檢索過程中,用戶需要對檢索詞的組合進行反復試驗和修正才能檢索出所需答案,如果想要進行更加精準的檢索,還需要具備一定的檢索技能和知識,因而大多數用戶的檢索效率不高。 當AIGC 技術及其代表性產品出現后,智慧圖書館可以借此打造智慧化檢索系統,實現“生成式檢索”,該系統以自然語言處理、機器學習、計算機視覺、人機交互、數據挖掘等技術為支撐[17],檢索依托的終端設備可以是手機、平板、穿戴設備等。 當用戶輸入文本、圖像、音頻、視頻等多模態自然語言查詢請求時,系統首先將用戶的多模態自然語言轉換成特定的知識表達形式,并利用AI 的內容理解、知識學習、計算推理等技術[18]以可視化方式向用戶輸出個性化、智慧化的答案。

4.3 智慧傳播系統:精準化傳播

數字圖書館信息內容傳播主要依靠的是館員,但此種傳播模式在服務時間、服務內容和服務質量上不可控[19]。 隨著人工智能技術的普及和發展,圖書館陸續開發了各類機器人承擔信息傳播任務。 例如,清華大學圖書館開發了基于AI 標記語言的機器人“小圖”,上海交通大學圖書館開發了基于MSN的聊天機器人“小交”[20],但此類型的機器人目前還無法處理復雜的用戶需求。 ChatGPT 的火爆出圈使GPT 技術被高度關注,智慧圖書館可以將GPT 技術與機器人技術進行有效結合,開發更適合特定服務場景的智能聊天機器人,構建智慧圖書館的智慧傳播系統。 在該系統中,用戶可以運用自然語言與系統進行交流,系統可以有效識別用戶聲音、表情、行為及所處環境[21],通過語義分析、機器學習和計算機視覺等技術,準確理解用戶意圖,快速搜索與用戶最為匹配的信息,并根據語料庫中的知識計算出最佳答案,將答案進行智慧化推送。 同時,該系統還能夠在多輪人機交互過程中不斷優化模型,以更加智慧化的形式為用戶提供知識服務。

4.4 智慧評估系統:個性化評估

AIGC 可以輔助智慧圖書館創建智慧化學習評估系統[22],在學習開始前,人工智能系統可以針對用戶以可視化的形式生成用戶自身情況分析報告,讓用戶明晰自身原有的知識結構,從而選擇合適的學習方向。 在學習過程中,人工智能系統將實時收集用戶在整個學習過程中的數據,包括表情數據、動作數據、心理變化數據、生理反應數據等,針對這些結構化和非結構化數據,運用大數據分析技術、數據挖掘技術進行關聯規則分析、回歸分析、聚類分析[23],形成智能化評估報告,并通過云服務推送給用戶[24],幫助用戶了解當前學習狀態和挑戰,從而為用戶提供個性化的學習建議。 在學習結束后,人工智能系統將以可視化的形式展現用戶在整個學習過程中的認知學習圖譜,讓用戶了解自身認知遷移變化,同時,該系統還能夠將評估結果與其他利益相關者共享。 在人類反饋強化學習機制支持下,人工智能系統甚至能夠分析用戶對評估結果的反應。AIGC 支撐下的智慧化學習評估系統將重塑智慧圖書館評價模式,使其向智能化、智慧化方向發展。

5 AIGC 賦能智慧圖書館建設的發展策略

AIGC 時代已來臨,智慧圖書館應當借助計算機視覺、自然語言處理、多模態大模型等技術變革機遇,在新的運行邏輯下針對多元化生產、生成式檢索、精準化傳播、個性化評估等服務場景,通過完善基礎語料庫建設、訓練高質量大型語言模型、提升相關人員數字素養、升級智慧圖書館基礎設施等手段,推動智慧圖書館的發展躍上新臺階。

5.1 內容生產層面:完善基礎語料庫建設

AIGC 技術應用的關鍵在于海量多源多模態數據資源,智慧圖書館作為數據資源的聚集地,擁有強大的數據基礎。 其不僅擁有圖書、期刊、專利等靜態館藏數據,也包含用戶借還書、查詢、參考咨詢、薦購等動態數據,同時還涉及各種傳感器動態實時捕捉的圖書館環境狀態數據。 將這些海量的數據資源作為AIGC 的“燃料”和“驅動力”,可以為圖書館生產適應各大場景的文本、圖片、視頻、音頻等數據內容,但這也存在一些問題,諸如數據標注費時費力、數據多樣化不足、數據獲取與使用面臨隱私保護的挑戰等。 因此,圖書館需要探索新的路徑來完善基礎語料庫建設。 而合成數據可以幫助圖書館解決上述問題,其是計算機模擬技術或算法創建、生成的自標注信息,可以在數學或統計學層面反映真實世界數據的屬性,能夠作為真實世界數據的替代品來訓練、測試AI 模型[25]。 圖書館利用合成數據技術可以改善數據質量、避免用戶隱私泄露、增加數據多樣性、提升AI 模型訓練速度和效果。 因此,未來可以將合成數據納入智慧圖書館基礎語料庫建設,推動智慧圖書館的可持續化發展。

5.2 內容檢索層面:訓練高質量大型語言模型

AIGC 將重塑智慧圖書館信息檢索新范式,基于海量文獻數據訓練高質量的大型語言模型是將人工智能模型嵌入智慧圖書館檢索服務中的關鍵。 大型語言模型的訓練和學習是文本生成的核心,并且大型語言模型具備易擴展性,能夠實現跨模態的知識沉淀,同時,還能夠利用海量無標注文本進行預訓練。 智慧圖書館可以參考基于人類反饋的強化學習思路,以圖書館海量文獻數據、用戶行為數據、空間環境數據等為基礎構建大規模語言模型,通過反復測試、迭代,不斷優化,使其在關鍵詞生成、文獻分類、智能問答、文本相似性計算、摘要生成、情感分析等圖書館檢索服務中發揮價值。

5.3 內容傳播層面:提升相關人員數字素養

內容傳播效率的提升除了需要依靠智能機器設備,還需要依賴高數字素養的館員和用戶。 一方面,AIGC 技術的準入門檻較高,圖書館館員中擁有人工智能專業背景及相關技術的人員并不多。 另一方面,AIGC 與智慧圖書館深度融合后會引發系列問題,諸如知識產權歸屬與認定困難、虛假信息與錯誤信息泛濫、用戶個人隱私信息泄露 、算法歧視等。因此,智慧圖書館在引入AIGC 技術之前,需要配備AIGC 技術團隊,通過提供后期專業學習和定期培訓的形式打造適應各種場景應用開發的復合型人才隊伍,提升內部人員的數字素養。 同時,圖書館需要通過常規培訓與制度安排,培養工作人員及用戶的AIGC 技術風險認知、個人隱私信息保護意識、AIGC生產虛假信息鑒別能力,以提升工作人員和用戶的數字素養。 此外,圖書館還可以聯合相關部門制定一套適合我國本土發展的用戶數字素養評價指標體系,通過評價與反饋不斷優化數字素養提升路徑。

5.4 內容評估層面:升級智慧圖書館基礎設施

基礎設施是AIGC 生產數據、存儲數據、分析數據和利用數據的載體,也是推動智慧圖書館發展的支撐力量,因此,升級圖書館基礎設施是打造智慧圖書館智慧評估系統的基礎和保障。 首先,AIGC 在智慧圖書館中的應用對算力提出了較高要求。 例如,GPT-3. 5 模型采用了海量的訓練數據,擁有超過1 750 億個參數,其在Azure AI 基礎設施上進行訓練,總算力需要消耗3 640 PF-days(即假如每秒計算1 000 萬億次,需要計算3 640 天)。 然而,目前絕大多數圖書館無法獨立承擔如此龐大的算力供給,因此,圖書館可以借助企業設施和國家工程提高算力。 例如,圖書館可以依托企業GPU 云服務器和國家“東數西算”工程,利用API 接口調用相關應用程序來打造智慧圖書館基礎設施體系。 其次,圖書館應當投入一定的資金來購買智能可穿戴設備。 例如,美國羅得島大學圖書館已將可穿戴技術引入圖書館中,用戶借助可穿戴設備可以自由進行閱讀、學習和交流,圖書館繼而收集可穿戴設備中的多模態數據,利用人工智能模型對用戶的生理和行為數據進行綜合分析和評估。 由此可見,AIGC 與可穿戴技術的結合,對智慧圖書館建立強大的智慧評估系統十分關鍵。

6 結語

AIGC 的內容創造力、跨模態融合及認知交互力等技術優勢將進一步推動圖書館傳統服務模式的轉型,逐步實現“AIGC+”的智慧化服務模式。 未來AIGC 在智慧圖書館中的應用場景將進一步拓展,結合區塊鏈、虛擬現實等技術,最終實現場景間的深度融合,構筑虛實融合的“自生成、自更新”[26]的新型內容生態。 但不可否認的是,目前AIGC 技術發展還不夠成熟,將其應用于智慧圖書館建設還存在一些難點。 因此,在智慧圖書館建設進程中,應當提前制定好AIGC 戰略性發展框架,通過單點局部建設,逐步推動整體發展。

猜你喜歡
模態人工智能智慧
2019:人工智能
人工智能與就業
數讀人工智能
下一幕,人工智能!
國內多模態教學研究回顧與展望
基于HHT和Prony算法的電力系統低頻振蕩模態識別
有智慧的羊
由單個模態構造對稱簡支梁的抗彎剛度
智慧派
多模態話語模態的協同及在外語教學中的體現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合