?

AIGC 時代有聲書行業的機遇與挑戰

2024-01-25 06:31■文/程
張江科技評論 2023年6期
關鍵詞:音色語音內容

■文/程 輝

在生成式人工智能時代,有聲書行業的生產流程將重塑,生產力會有突破性提高。

隨著人工智能(Artificial Intelligence,AI)技術的不斷發展,聊天生成式預訓練模型(Chat Generative Pre-trained Transformers,ChatGPT)橫空出世,我們迎來了生成式人工智能(Artificial Intelligence Generated Content,AIGC)時代。

AI 正加速滲透各行各業,以塑造產業新范式,一場新的生產力與創造力革命蓄勢待發。AI 語音技術是AIGC 領域的重要分支之一,隨著AI 技術的發展,其角色功能、產品服務和行業生態等都發生了巨大的變化。

AIGC 影響各行各業

2022 年,ChatGPT 憑借其在語義理解、文本創作、代碼編寫、邏輯推理、知識問答等方面的卓越表現,以及自然語言對話的低門檻交互方式,迅速躥紅網絡,收獲了大批用戶。ChatGPT-4 引起了人們對AIGC 的廣泛關注。第50 次《中國互聯網絡發展狀況統計報告》顯示,截至2022 年6 月,中國互聯網普及率已高達74.4%。在網民規模不斷提升、網絡接入環境日漸多元、AI 技術助推行業數字化轉型升級的宏觀環境下,作為新型內容生產方式的AIGC 技術,為行業轉型的落地提供了想象空間。

AIGC 是一種基于人工智能技術的自動化內容生成系統,可以使用機器學習和自然語言處理(Natural Language Processing,NLP)等技術,學習和分析海量數據,讓計算機模擬人類的創造力和判斷力,自動生成符合人類需求的各種文本、圖像、音頻和視頻等多媒體內容。

AIGC 興起主要源于自然語言處理和擴散模型(Diffusion Model)的發展與開源。20世紀50年代,計算機科學家就開始嘗試使用計算機生成語言模型。隨著機器學習和深度學習等技術的不斷突破,AIGC 技術得到了快速的發展。

AIGC 是一次新技術革命,具有極強的普適性,可以改造和升級人類生產、生活的方方面面。它的發展分為3 個時期:醞釀萌芽階段(20 世紀50年代至90 年代中期)、穩步推進階段(20 世紀90 年代中期至21 世紀第二個十年中期),以及迅猛發展階段(21 世紀第二個十年中期至今)。

在醞釀萌芽階段,AIGC 處于實驗室探索中。在穩步推進階段,隨著算法的不斷優化,AIGC 逐步出現在各式各樣的應用場景和商業模式中,在圖像、音樂、視頻等領域得到了廣泛應用。在迅猛發展階段,AIGC 開始與其他技術深度融合,如自然語言處理、計算機視覺、機器學習等,融合后,AIGC 更加全面,可以實現更復雜、更高級的內容生成和創作等。

艾瑞咨詢2023 年發布的《AIGC 系列報告——中國AIGC 產業全景報告》指出,內容生成與理解是大模型的核心能力,AIGC 的產業價值主要體現在以此為核心的“變革內容生產方式”與“變革人機交互方式”兩方面。大模型對內容理解和內容生成的雙向能力使AIGC 既能以極低門檻實現多模態內容生成,也可脫離內容生產核心場景泛化為一種人機對話的媒介?;诖朔N理解,AIGC 將實現內容創作權的下放,借助針對各垂直領域衍生的大量AI 生產工具,實現全行業內容生產效率的飛升。

AIGC 會引發內容行業巨變。2023 年9 月21 日,愛奇藝創始人、首席執行官龔宇在“2023 愛奇藝iJOY 悅享會”上分享了他對行業的最新思考。在他看來,AI 在影視內容策劃、開發、制作以及宣發等方面將有重要的應用空間。其實,不僅在影視行業,AIGC 還會在許多其他內容行業如編輯出版、新聞、設計等的生產端、分發端、產業端重構生產模式。

AIGC 可幫助教育行業突破傳統教育模式及人工生產效率的限制,實施個性化教學、智能輔導、自動化評估,構建在線學習平臺以及提供全面的管理。它的介入會提升教學效率和質量,實現個性化教育和精準教育,助力教育行業的數字化轉型和教學模式的變革。

AIGC 與金融業的結合也格外引人注目。目前,摩根士丹利、彭博、德意志銀行等都已有初具雛形的應用落地。有學者指出,AIGC 可以在金融行業中的客戶服務、產品創新、智慧辦公、研發管理、監管合規知識庫建設和代碼開發等方面發揮作用。有了AIGC 的加持,金融行業將發生質的蛻變。

對網絡視聽行業而言,置身以內容分發平臺為核心的內容消費賽道,連接供應端的創作者和需求端的大量用戶,線上內容資源是最核心的生產力,創作者需要將內容質量保持在可持續吸引用戶注意力的水平。AIGC 主要影響的是內容創作與人機交互,線上化程度越高、內容占比越大的行業,變革越深刻和廣泛。由此,它的入局對業態而言勢必是一場深刻的顛覆與變革。

語音合成技術進入有聲書行業

近年來,國內各大互聯網巨頭的發展軌跡都有一個“共性”:利用AI 技術賦能傳統行業。AI語音技術作為AIGC 的重要分支之一,被應用于傳統有聲書出版業,為有聲書行業重塑生產流程、提高生產力提供了可能性。

AI 語音技術包括語音識別(Automatic Speech Recognition,ASR)、自然語言處理和語音合成(Text to Speech,TTS)等三大技術。其中,語音合成技術在有聲書行業的生產端已顯現出強大的生產力。

語音合成是將計算機自己產生的或外部輸入的文字信息轉變為口語輸出的技術。它涉及聲學、語言學、數字信號處理、計算機科學等多個學科,主攻如何將文字信息轉化為可聽的聲音信息,讓機器像人一樣開口說話。不同于錄音機式的聲音回放設備,語音合成是將任意文本轉換成具有高自然度的語音。

語音合成流水線包含文本前端(text frontend)、聲學模型(acoustic model)和聲碼器(vocoder)等3 個主要模塊。語音合成的流程是:通過文本前端模塊將原始文本轉換為字符/音素;通過聲學模型將字符/ 音素轉換為聲學特征,如線性頻譜圖、mel 頻譜圖、LPC特征等;通過聲碼器將聲學特征轉換為波形,最終合成語音。

隨著AI 的進步,神經網絡、深度學習等技術出現,“TTS+AI”的組合使得電子合成語音愈發自然和準確。針對情感起伏大、音色個性化、聲線多元、貼合人聲等更精細化的需求,目前已有AI 語音廠商提供“情感TTS”定制,旨在通過調整音色的語調、音高、語速,甚至模擬人類的生氣、傷心、高興等語氣,讓電子合成語音符合語境或場景,具有“情感”。

得益于互聯網技術發展與移動終端的普及,近年來,人們更青睞于“內化”的居家生活方式,有聲讀物市場呈爆發式增長。智研咨詢認為,2023 年中國有聲讀物市場規模有望突破100億元(見圖1)。

圖1 2015—2023 年中國有聲讀物行業市場規模

有聲書行業的傳統制作流程由人工手動操作。審聽音頻、拼接多名主播的人聲、制作后期墊樂等依靠純人工完成,僅20 萬字的讀物需要耗費近1 個月的時間才能完成制作。此外,有聲書行業存在大量重復勞動的工作,準入門檻低,從業人員多由利用閑散時間發展副業的兼職人員組成,內容裂變雖然增長迅速,優質精品卻是鳳毛麟角,目前尚未形成行之有效、監管有力的行業規范?,F存有聲書普遍存在制作流程周期長、成本高、質量不穩定、水平良莠不齊的問題,傳統低效的制作方式很難滿足井噴式增長的有聲書市場需求。AI 入局,其內容創作方式與人機交互模式會充分發揮技術優勢,為有聲書行業的轉型提供參考路徑。

首先,AI 音色具有高擬人度、高流暢度的特色。語音合成平臺能提供多樣化、個性化的音色,可模擬人在不同場景下的語氣、狀態與情感,在一定程度上媲美真人,其提供的大量音色素材,為有聲書創作奠定了技術基礎。

其次,有聲讀物的制作周期縮短。TTS 技術在短時間內將海量文本生成語音,極大地縮短了錄制時間。例如,在Reflect Audio 推出的有聲讀物制作平臺上,AI 主播的制作速度超過500 萬字/天。

最后,制作成本降低。用AI 代替真人,音色可從語音合成平臺提供的豐富音色中選擇,實實在在地省去了高昂的錄制費用,低廉的成本即可獲得一級主播的優質聲音,實現高品質的創作。

“AI+有聲”新模式

在大量AI 生產工具的應用陸續落地的背景下,各類企業數字化語音廠商都在圍繞大模型尋找自身的優勢空間與定位。在有聲書行業這一垂直領域內,涌現一大批在AI 語音發力的企業,或能實現AI 語音生產的實際落地。

國內一家首創“AI+真人”混合錄制形式的企業——上海家瑤網絡科技有限公司的業務模式與成長路徑,或能為“AI+有聲”的應用層落地提供注腳。除利用“情感TTS”音色批量錄制有聲讀物之外,針對有聲書行業存在的核心痛點問題,公司獨立研發的AI 自動對軌、AI 輔助審聽的應用級產品“愛對軌”,借助行業領先的語音識別模型,實現了AI 全流程參與制作,由AI 自動完成繁復低效的操作,并輔助對音頻內容進行審校,“以看代聽”,極大地縮短了制作周期,提高了內容準確率。

AIGC 在內容消費領域引起了生產力變革,從技術到商業模式的路徑已全線打通,各類企業借助技術背景發揮自身優勢,帶來的海量下游應用優化將進一步釋放行業創作活力與創新力?!癆I+有聲”模式作為其中一個縮影,也將拓展有聲書行業市場規模,助力形成更加蓬勃發展的有聲書市場。

猜你喜歡
音色語音內容
內容回顧溫故知新
精雕細琢的外形與音色 Bowers & Wilkins(寶華韋健)805 D4
魔力語音
基于MATLAB的語音信號處理
基于MQ3與MP3的價廉物美的酒駕語音提醒器
對方正在輸入……
擅長營造美好的音色 Marantz SA-10 S1/PM-10 S1
論長笛演奏的音色變化
從輝煌到柔美——七彩音色之西方管樂篇
主要內容
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合