?

基于媒體智能中臺架構的內容庫設計與實現

2024-04-01 06:41
電視技術 2024年1期
關鍵詞:架構智能化智能

章 濤

(金華市新聞傳媒中心,浙江 金華 321000)

0 引言

隨著媒體融合不斷向縱深發展,廣播電視制作系統傳統“前臺+后臺”架構的缺陷日益顯著,如部署維護復雜、資源利用率低、能力單一等,已經不能滿足內容生產快速變化的需求,其原因主要在于前臺需求與后臺特性不匹配。前臺以用戶為中心,具有敏捷性,而后臺的作用是保證核心業務系統運行,具有穩定性。后臺的穩定性和前臺的敏捷性之間存在匹配速度的差異問題,導致后臺不能及時響應前臺的需求[1]。提取前臺、后臺的一些資源,使其具備一定的可復用能力,并以應用程序編程接口(Application Programming Interface,API)的形式服務于前臺應用,從而形成中臺的架構。

金華市新聞傳媒中心“金彩云”平臺自2017 年完成建設并投入運行以來,經過不斷迭代和完善,覆蓋了廣電采編制作全流程業務。在運行過程中,同樣遇到了用戶需求與平臺架構不匹配的問題,其中最為顯著的是智能化需求難以滿足。常規的廣播電視制作系統的智能化升級往往局限于媒資系統或內容庫,將智能化能力與系統進行緊耦合,因此難以在其他生產制作環節實現能力復用,造成極大的資源浪費?!敖鸩试啤逼脚_從架構入手,進行智能中臺技術系統的建設,并在此基礎上完成智能化內容庫的應用實踐。

1 智能中臺應用規劃

通過分析浙江省多個地市級電視臺的情況,發現智能化需求主要集中在以下3 個方面:一是能否顯著降低人員的重復勞動;二是能否賦能用戶提升作品質量;三是能否充分發揮媒資作用創造價值?;谝陨闲枨笠巹澚? 類應用,便于智能中臺貫穿于融媒體業務流程。

1.1 智能選題策劃應用

貫穿線索、報題、選題、任務等環節,為融合媒體內容生產發布提供數字化、流程化手段,協助業務部門強化媒體融合生產的指揮決策能力,構建媒體生產的“作戰指揮室”。

1.2 智能融合生產應用

支持圖文稿、音視頻稿、圖集稿等全媒體稿件生產,在新聞采集、生產、分發、接收、反饋中,利用文本、語音及視頻的三模態大模型,兼具跨模態理解和生成能力,結合海量全媒體數據積累和媒體融合業務需求,實現對媒體內容的創作、分析、處理,以及媒體內容的智能化、自動化處理,能夠幫助記者或者編輯更快地創作出大量高質量的內容,解決傳統人工創作過程中面臨的時間、成本及跨語種、跨領域等問題。同時,輔助媒體內容創作、生產和加工,提高媒體業務的效率和質量[2]。

1.3 智能審校應用

基于知識庫、機器學習、自然語言處理(Natural Language Processing,NLP)、光學字符識別(Optical Character Recognition,OCR)等相結合的內容檢查模型算法,建設專屬多模態內容的安全審核系統,實現對文字、圖片、視頻和音頻等的智能審核。支持常見錯誤檢查、用戶自定義錯誤校對,支持涉政、涉黃、暴恐、粗俗、廣告等內容的智能識別,降低業務違規風險。通過云校對服務接口結合私有化軟件開發工具包(Software Development Kit,SDK),實現同步和異步檢校,全面提升內容安全風險管控。

以上3 類應用基本覆蓋了媒體資源的生命周期,在技術實現上都依賴于中臺系統底部的內容庫場景。后文將解析智能中臺整體架構的設計,重點介紹智能中臺支撐下內容庫場景的構建。

2 智能中臺技術架構

2.1 總體架構

智能中臺在技術上采用容器+微服務的架構,一方面實現模型一鍵部署,自動調整彈性計算資源,具備虛擬化異構算力和彈性擴縮容能力,能夠滿足用戶快速業務創新需求。另一方面,利用微服務技術性能特性,將算法、數據、應用以微服務的方式解耦,其中任一模塊的調整對于整個人工智能(Artificial Intelligence,AI)技術應用的影響都是可控的,具備灰度發布、彈性伸縮、高可用性和無單點性能瓶頸等特點,從而加速新AI 應用場景的開發。智能中臺架構,如圖1 所示。

2.2 架構主要優勢

智能中臺在技術上采用容器和微服務架構,具備以下優勢。第一,快速滿足創新需求優勢。由于平臺采用的是容器和微服務架構,一方面能夠快速部署,另一方面將算法、數據、應用以微服務的方式解耦,可對任一模塊進行調整,從而加速實現AI 新應用場景的開發。第二,具備技術性能資源優勢。擁有自動調整彈性計算資源和模型一鍵部署能力,在灰度發布、彈性伸縮和高可用上具有無單點性能瓶頸等特點。通過虛擬化異構算力和彈性擴縮容能力,能夠解決模型部署復雜、資源浪費、手工擴展資源效率低的問題。第三,使用統一標準接口優勢。包括統一API 網關、調用接口、業務計量、用戶管理和運維管理,為二次開發提供良好基礎。支持多業務系統對接驗證及能力調用,支持第三方媒體應用、AI 算法模型及AI 服務能力接入,并支持單一原子能力API 的調用等[3]。

3 內容庫場景的智能化模型

內容庫是內容資源整合、管理、共享和使用的樞紐,是節目“多元生成”和媒體融合生產的基礎支撐系統,更是實現其他媒體業務智能化場景的必要條件。在智能中臺基礎上進行內容庫場景搭建,就是在實現公共能力服務、流程定制服務及開放接口服務的基礎上,提供以數據為核心、面向平臺業務、基于融合生產及全媒體應用特性的統一內容服務能力[4]。團隊以業務為驅動,以自主構建智能化模型為核心,基于自身及生態圈用戶需求進行模型調試訓練,完成內容庫場景的落地。

3.1 內容庫設計思路

在浙江全省媒體融合之際,對接廣電和報社現有歷史媒體素材,對歷史素材進行AI 識別,提升歷史素材的可用性,通過素材資源庫上傳的素材也可以自主選擇AI 識別的方式,實現基于互聯網的上載、存儲、編目、加工、分析、分發和下載等業務流程。充分利用AI 人工智能中臺,提供多媒體素材的智能識別,包括智能編目、人臉識別、語音識別、場景識別以及智能標簽在內的分析與處理功能,實現資源管理的高效化與智能化。同時,賦能數據統一融合、協同發展,盤活數據資產,實現數據資產的高效利用[5]。

3.2 智能化模型

智能化模型是智能中臺的技術核心,其性能決定了內容庫的業務能力。團隊基于NLP、OCR 和人臉圖像識別等基礎原子能力,從媒體業務需求出發構建模型。按業務的時間順序劃分,模型主要由智能調度處理中心、智能學習分析中心和智能算法引擎中心3 部分組成。智能調度處理中心完成媒體文件預處理,分析調度管理和輸出處理結果等。智能學習分析中心實現對數據文件的分析提取,并進行邏輯判斷、數據提煉和數據推送等。智能算法引擎中心提供如人臉識別、語音識別、文字識別和場景識別等識別處理的智能化應用。

3.2.1 智能調度處理中心

智能調度處理中心負責整個AI 智能中臺的能力調度與管理。媒體文件輸入后,智能調度處理中心通過調用各種AI 算法,根據調度規則管理完成媒體文件視頻的分類、視頻的切分、視頻文字識別與分類等預處理,并將預處理結果輸出至智能學習分析中心進行進一步處理。智能調度處理中心業務邏輯,如圖2 所示。

3.2.2 智能學習分析中心

進一步分析音頻、圖像、視頻、文字等媒體文件類型,根據預測的視頻結構化處理模板進行邏輯判斷、數據提煉和數據推送,實現對數據類型的智能化分析提取。智能學習分析中心業務邏輯如圖3 所示,智能化分析詳情頁面如圖4 所示。

圖3 智能學習分析中心業務邏輯圖

圖4 智能化分析詳情頁面

3.2.3 智能算法引擎中心

部分場景較為復雜的媒體文件通過智能學習分析中心分析提取標簽后,經智能調度處理中心判斷為分析結果不完整的,將轉入智能算法引擎中心進行深度分析。智能算法引擎中心包含多種智能算法能力(圖5),集成多個AI 算法工作流模版,具備音頻算法能力、圖像算法能力、自然語言算法能力等核心能力。

圖5 智能算法能力

3.3 內容庫應用實踐

經過充分的研發調試,內容庫已經能夠準確處理不同類型的媒體文件。針對較為復雜的視頻文件,內容庫調用智能化模型從片段層、場景層和鏡頭層3 個維度進行分析,實現標簽精準提取,內容要素無遺漏。內容庫于2022 年7 月正式投入使用,截至2023 年12 月已完成分析媒體文件31 939 個。內容庫數據統計系統詳情頁面如圖6 所示。

圖6 內容庫數據統計系統詳情頁面

4 內容庫技術亮點與創新點

此前的廣播電視技術系統智能化平臺以及具備智能化能力的內容庫,在實際運行的各環節中人工介入的占比仍然較大。經分析,可以歸納為以下3 點原因。第一,AI 能力的跨模態協同不深入,導致內容分析識別不準確,需要人工調試。第二,內容標簽邏輯與實際場景不匹配,需要人工反復修正。第三,創建實例過于復雜,需要專業人員進行操作。針對上述問題,“金彩云”進行一次次技術攻關和軟件功能迭代,不僅解決了現有問題,還實現了新技術的探索實踐和創新運用。

4.1 基于音、視、圖、文多維跨模態的AI 分析

中臺結合多維度能力輸入,融合場景識別、語音識別和人臉識別算法模型打造精準的視頻切分能力,新聞視頻拆分支持鏡頭切分、場景切分和片段切分?;谥悄芊饷?、智能摘要、臺標識別、片段類型識別、公眾人物識別、實體關鍵詞識別、抽象關鍵詞識別和新聞幀標簽等多種算法,自動獲取各新聞片段、場景和鏡頭的標題、類型、封面、摘要、標簽內容。相較于常規的多模態AI 分析,中臺系統基于廣電需求進行針對性的優化,有效提升了分析識別的準確度。

4.2 全媒體內容的標簽識別功能

基于標簽治理和清洗規則以及20 多種治理預處理和后處理策略,對標簽數據進行校驗、過濾、排序、糾錯、匹配等處理。中臺系統識別模型的自優化,在實際應用中不僅減少了無效數據項所帶來的運算存儲負荷,而且有效提升了基于中臺系統各項應用的易用性和準確度。

4.3 基于分布式基座的鏡像倉庫托管能力

中臺以分布式容器編排平臺Kubernetes 作為基座,能夠托管100 多種平臺鏡像倉庫和模型服務,支持第三方算法/模型托管,平均算法接入時間為1 d。在算法的開發和接入過程中,制作鏡像往往有比較高的時間成本和技術門檻,要求用戶掌握一定的Docker 相關指令。中臺系統通過統一鏡像接入平臺和可視化界面使得普通用戶也可以輕松制作算法微服務,大大提升了接入效率。針對鏡像生成耗時較長和鏡像文件體積較大的問題,中臺使用鏡像倉庫的方式進行動態管理。通過動態分析鏡像制作任務,采用以空間換時間的策略提前預備組件使用中頻率和耗時大的鏡像,將基礎鏡像里安裝的常用組件構建成模型鏡像,實現類似組件場景的快速復用,縮短制作鏡像的時間。

5 結語

智能中臺采用云計算、大數據和人工智能等新技術,建設了混合云架構的云服務體系,實現了媒體融合生產、管理、發布業務的一體化?;陂_放設計思維,平臺為各類創新應用提供底層支撐,引入多種第三方功能,集約化管理多種類應用,實現媒體泛智造能力的統一匯聚。

自2022 年8 月運行以來,“金彩云”智能中臺實現了用戶多終端參與媒體內容生產的雙向、多樣化的平臺管理方式,在支撐臺內和全市媒體新聞融合生產上發揮了重要作用。平臺以先進技術支撐生態圈的協力合作,通過服務變現保證了智造模式的可持續發展。平臺將不斷更新迭代,力求在廣播影視、智慧城市、網絡安全、醫療健康和工業制造等領域進行開拓,引領產業協同創新,促進產業鏈的協同共進,為各項事業的發展提供強勁助力。

猜你喜歡
架構智能化智能
基于FPGA的RNN硬件加速架構
智能化戰爭多維透視
功能架構在電子電氣架構開發中的應用和實踐
印刷智能化,下一站……
智能前沿
智能前沿
智能前沿
智能前沿
LSN DCI EVPN VxLAN組網架構研究及實現
基于“物聯網+”的智能化站所初探
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合