?

基于復雜噪聲干擾的英語口語測試系統*

2022-11-28 09:28霍小靜
自動化技術與應用 2022年10期
關鍵詞:端點特征分析英語口語

霍小靜

(西安培華學院,陜西 西安 710125)

1 引言

英語口語測試是英語教學測試的重要組成部分[1]。傳統英語口語測試主要由人工完成,由于人工測試具有較強的主觀因素影響,且測試效率較差,費用較高,因此英語口語測試從人工測試轉變為線上人機交互測試,利用計算機實施自動測試成為信息化社會的迫切需求[2-3]。

當前普遍使用系統主要為基于技術模型的測試系統和基于序列匹配的英語口語發音質量評估系統[4-5],但它們均存在測試結果波動大等缺陷。究其原因主要是由于系統檢測過程中,語音信號中存在明顯噪聲導致[6]。

為了獲得更優的結果,針對當前測試過程存在的問題,設計一種針對復雜噪聲背景的口語測試系統,主要針對復雜應用環境下,對信號中語音和非語音的準確判斷進行研究,以此提升系統的應用性能。

2 復雜噪聲干擾的英語口語測試系統

2.1 測試系統整體結構

本文系統整體結構如圖1所示。系統包含六個模塊,分別是:語音采集模塊、預處理模塊、語音特征分析模塊、測評模塊、映射模塊與輸出模塊。其中語音采集模塊主要采集被測者的語音信號,并將采集結果輸入預處理模塊中,預處理模塊對含噪信號進行降噪處理;降后信號傳輸到語音特征分析模塊中,得到文本標注信息與特征文件,測評模塊根據文本標注信息與特征文件進行機器測評,生成機器打分。映射模塊根據機器打分與人工打分實施映射處理,得到最終測試結果,并通過輸出模塊向用戶展示最終測試結果。

2.2 英語口語信號預處理模塊

在語音信號采集過程中,受環境噪聲以及信號傳輸過程中電路噪聲的影響,語音信號通常存在復雜的噪聲背景,對測評結果產生干擾,導致測試結果不夠準確[7]。為提升測評準確性,需對語音信號進行降噪處理,提升被測者輸入信號的質量,為此通過預處理模塊對環境噪聲、電路噪聲進行處理,去除信號中的復雜噪聲背景。

2.2.1 環境噪聲處理

針對信號中的環境噪聲,選取譜相減降噪技術進行降噪處理[8]。|yi(t)|2(t=1,2,…,k)表示第t幀幅值譜的第i元素的語音功率,和分別表示噪聲功率和除噪后語音的功率,譜相減降噪技術的表達式:

式中,α表示權系數。

通常將噪聲設為平穩噪聲,這樣要求整個語音段、噪聲功率和α值通常具有一致性[9]。在實際應用中,環境噪聲通常具有非平穩性,因此利用一致性的噪聲功率值無法得到有效的去噪效果。且權系數α一致的條件下,會概率產生消除過度或消除不足的問題,部分區域中出現噪聲消除不完全或消除過度,|si(t)|2會出現失真現象,因此需對譜相減降噪技術進行優化。

對噪聲功率進行優化時,利用整體區域語音外輸入幀功率|xi(t)|2逐次更新噪聲功率,描述如下:

式中,β為噪聲譜特征。

為使α同輸入語音功率相匹配,根據式(3)使權系數α隨輸入語音功率的變化而變化:

式中,θ1、θ2和C1、C2分別表示門限閾值和常數。

利用式(3)可防止出現消除過度或消除不完全的問題。

2.2.2 電路噪聲處理

針對語音信號中的電路噪聲,選取倒譜均值規整降噪技術實施降噪處理[9]。Ci(t)表示第t幀倒譜的第i元素噪聲下的語音倒譜,表示除噪后語音的倒譜。由此得到倒譜均值規整降噪技術的表達式:

式中,表示整體輸出語音的倒譜平均值。

倒譜均值規整降

噪技術存在兩個問題:

(1) 輸入信號不利因素的出現頻度對值產生直接影響;

(2) 需對整體信號計算完成才可確定值,對降噪過程實時性產生不利影響。

因此,利用最大后驗概率優化值計算精度,式(4)可轉換為:

式中,γ和Ci0均表示自適應訓練系數,兩者分別由實驗和學習數據確定。

作為漸進自適應方法,最大后驗概率算法中樣本采用逐個輸入方式,從而去除樣本數據中的噪聲。

2.3 語音特征分析模塊

語音特征分析模塊主要功能是對降噪處理后信號進行分析,特征分析質量對測評結果產生重要影響。正確判斷一個單詞開始對于語音特征分析尤為關鍵,即語音端點檢測技術[10]。通常情況下端點檢測普遍采用短時能量En與短時平均幅度函數Mn兩種方法進行,兩種方法描述如下:

式中,Sn(m)表示信號頻率特征,m=0,1,…,N表示幀數。

短時能量En與短時平均幅度函數Mn均可描述單幀信號的能量,在端點判斷過程中,通過設定|En|值或|Mn|值確定語音端點位置。

語音特征向量的構造是以模糊聚類矢量量化特征為主,結合英語口語測試的實時性要求,同時考慮計算量進行選取。在選取信號特征矢量Xi時,參考部分相關資料后決定合成一個特征矢量,該特征矢量由12 階梅爾頻率倒譜系數與各階差分參數加短時能量En合成。

2.4 語音信號的測評模塊

測評模塊根據文本標準與特征文件對輸入的語音信息進行測評,采用隱馬爾可夫模型作為語音識別軟件,依照語音特征分析模塊中特征矢量對信號進行測評。利用隱馬爾可夫模型能夠獲取指定文本Ti(i=1,2,…,N)的發音數據O的輸出概率P[O|T]。在進行測評過程中,利用后驗概率P[O|T]作為英語口語質量測評的工具,后驗概率是針對孤立字實施的,在連續語音信號條件下需對連續信號實施分割并分段累加。針對連續信號,選取貝葉斯公式計算后驗概率P[O|T]:

式中,Q和q分別表示模型集合和Ti可能被誤讀成的音素,NF(Ti)和P(|Ti)分別表示音素Ti的總幀數和發音矢量的似然度。

3 仿真測試

實驗為驗證復雜噪聲背景的英語口語測試系統的應用效果,在TIMIT語料庫中數據作為測試對象,選取NOISEX-92噪聲庫中的F16噪聲和pink噪聲為添加的復雜噪聲,采樣頻率和采樣精度分別為12.14kHz和18bit。

3.1 復雜噪聲背景下端點檢測結果

選擇基于技術模型的測試系統和基于序列匹配的測試系統作為對比系統。選取1段純凈無噪音信號,具體如圖2所示。

在圖2中英語口語語音信號中添加噪聲,統計不同復雜噪聲,不同系統的端點檢測結果,具體如圖3和4 所示。由圖3可知,添加F16 噪聲后,對比系統均出現極為不穩定的能量波動,而本文系統的輸出較平穩,可以檢測到信號有用信息;由圖4可知,添加pink 噪聲后,基于技術模型的測試系統無法有效去除pink 噪音干擾,檢測效果差,基于序列匹配的評估系統雖然去除了一定的噪聲干擾,但檢測結果不穩定,而本文系統信號檢測平穩,良好地去除了噪聲的干擾。因此,針對復雜噪聲環境下信號,本文系統的去噪效果好,端點檢測結果更加準確,利于提升測試結果。

3.2 測試結果顯示

將本文系統應用于實際英語口語測試過程中,選取4個被測者從單詞發音與對話兩方面進行測試,相同測試內容分別進行3次測試,結果如表1所示。分析表1得知,基于技術模型的同一被測者單詞發音測試分值差異上限為10分,對話測試分值差異上限為11分?;谛蛄衅ヅ涞脑u估系統的同一被測者單詞發音測試分值差異上限為8分,對話測試分值差異上限為9分。本文系統的同一被測者單詞發音測試分值差異上限為2分,對話測試分值差異上限為2分。結果表明本文系統的測試結果更為穩定,提升測試結果的可信度,測試性能更優。

表1 不同系統的測試結果對比

3.3 系統工作效率測試

為了分析不同系統效率,統計不同系統的平均測試時間,具體如圖5所示。對圖5的時間進行對比和分析可以發現,相對于對比系統,本文系統的測試時間明顯減少,獲得更優測試速度,測試效率有了顯著的改善。

4 結束語

在經濟全球化的推動下,英語口語重要性更加凸顯,為更加有效準確的獲取英語口語測試成績,針對測試過程中的復雜噪聲,設計了復雜噪聲背景的英語口語測試系統,通過降噪處理、端點檢測以及語音特征分析等過程,利用隱馬爾可夫模型的語音識別軟件進行測評,測試結果表明,本文系統能夠獲取更加精確穩定的測試結果,具有更高的實際應用價值。

猜你喜歡
端點特征分析英語口語
2013—2020年開封地區無償獻血人群HIV感染狀況及特征分析
1822號臺風“山竹”演變特征分析
穆夏藝術特征分析
近60年銀川氣溫變化特征分析
例談求解“端點取等”不等式恒成立問題的方法
英語口語課中“以學生為中心”教學模式的應用
辯論賽在高中英語口語教學中的運用
不等式求解過程中端點的確定
基丁能雖匹配延拓法LMD端點效應處理
淺談加強高中英語口語教學
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合