?

耳語特征變異分析

2017-04-24 07:44張紅兵
中國刑警學院學報 2017年1期
關鍵詞:耳語元音共振

張紅兵

(中國刑事警察學院聲像資料檢驗技術系 遼寧 沈陽 110035)

耳語特征變異分析

張紅兵

(中國刑事警察學院聲像資料檢驗技術系 遼寧 沈陽 110035)

說話人湊近別人耳朵或私下里輕微發音,被稱為“耳語”。相較于正常發音,耳語發音在聽感和圖譜上都存在著明顯變化,給話者鑒別工作帶來諸多困難。從分析耳語的語音學基礎入手,運用對參數統計分析和圖譜比對等方式,深入研究耳語發音在聲調特征、共振峰分布特征以及能量特征等方面的變異情況,以期給耳語話者鑒別工作提供參考和借鑒。

耳語 話者鑒別 共振峰 LPC

說話人湊近別人耳朵或私下里輕微發音,被稱為“耳語”,話者經常會受內外部因素影響或因表意的需要發出所謂的耳語。從語音學角度分析,耳語是依靠氣流沖擊摩擦未閉合的聲帶及其他聲腔部位而發出的特殊語音,更多地表現出聲帶震動能量(即基音)的消失,并伴隨著發音能量的明顯減弱。相較于正常發音,耳語發音在聽感和圖譜上都存在著明顯變化,耳語檢材在聲紋鑒定中的出現,給檢驗工作帶來諸多困難。嫌疑話者之所以通過耳語方式發音,較常見的是發音人試圖通過耳語方式進行偽裝;另外,由于話者的聲帶結構不完整甚至被完全切除,只能靠喉部其他組織代替聲帶完成發音,也會產生耳語效果。

漢語屬于聲調語言,耳語過程中聲帶未振動,意味著聲調的弱化甚至消失,話語辨識度也有所下降,但為什么耳語仍能實現話者間的溝通交流?耳語過程未產生聲門波,那么音節中元音韻母的圖譜特征是否依然存在?耳語發音與正常發音的在聲學特征方面會存在哪些異同?基于上述問題,本文從分析耳語的語音學分析入手,通過對聲學參數的統計分析和圖譜比對等方式,深入研究耳語發音在聲調特征、共振峰分布特征以及能量特征等方面的變異情況。

1 耳語

1.1 耳語的產生

耳語的產生過程類似于清輔音,聲門的不完全閉合形成了耳語發音部位,氣流對聲門的摩擦產生了具有噪聲特性的耳語發音。雖然耳語在元音發音時未產生基音和后期明顯的聲腔共振,但相對于清輔音而言,其仍具有較為規律的能量分布特性,這里以類共振峰特征來描述,如圖1所示。

圖1 耳語發音寬帶語圖

1.2 耳語特點

有人認為“耳語”等同于“氣聲”,2種發音過程中聲帶都未完全閉合,聽感上存在明顯的氣流聲[1]。兩者最明顯的區別在于前者發音時聲帶是完全不振動,而后者發音時聲帶是不完全振動,屬于一種聲樂演唱技法。耳語亦不同于漢語中的輕音和輕聲,雖然都伴隨著聲調的缺失,但耳語話者為了清晰表意需要放慢語速,因此單個耳語音節的音長明顯大于正常音節;而漢語輕音和輕音長則明顯小于正常發音,并且漢語輕聲和輕音雖然受重音的影響而能量減弱,但不妨礙其具備元音的發音特性,即有基音和較為清晰共振峰存在,如圖2所示。

圖2 “桌子”2種發音的寬帶圖譜

2 耳語特征變異分析

話者鑒別主要是通過對各類圖譜和數據進行特征比對和統計分析,判斷話者異同程度,耳語的產生機理明顯有別于正常發音,在圖譜能量分布上必然存在差異。要想準確地鑒別耳語話者,就需要通過具體的耳語變異實驗來進行量化分析耳語給話者本質特征帶來何種變化,以確定耳語檢材和正常發音樣本之間是否還存在可比性,進一步確認耳語發音的變異程度。

2.1 實驗設計

隨機選擇15名在校大學生作為發音人,模擬案例自然對話的方式,進行正常發音(普通話)和耳語發音,每位話者發音語料中包含2個二合元音(/ ao/和/ia/)各10個、2個三合元音(/iao/和/uei/)各10個。使用OLYMPUS LS-12型錄音筆在專業錄音室條件下錄制語料,以減少噪音和空間混響的影響。最終建立各300個音節庫容的正常語音庫和耳語語音庫[2]。

利用聲學分析方法通過智能語音分析系統對各類發音進行圖譜分析和數據統計,重點研究耳語發音的變異情況,進而比較分析多次耳語發音的特征曲線形態,以充分研究耳語話者特征的穩定性以及利用耳語特征進行話者鑒別的可行性。

2.2 實驗分析

2.2.1 過零率曲線分析

過零率一般被用來表示短時或者單幀語音波形通過波形中心線的次數,常被用來區別清音和濁音。耳語發音缺失了濁音發音的關鍵因素,可以通過過零率曲線比對來分析耳語發音給語音信號帶來的變化,如圖3所示。

圖3 過零率曲線形態對比

從2個語音庫中隨機選取對應20個字的發音,利用訊飛智能聲紋鑒定工作站分別提取短時過零率曲線,首先在對應音節間進行曲線形態比對分析。結果表明,相對于正常發音,耳語發音中輔音聲母區域的曲線形態高度未發生顯著變化,但元音韻母的過零率曲線存在著明顯差異,意味著耳語發音中元音部分短時能量得到提升,表現出清音的過零率特征,這與耳語發音機理相吻合。

從2個語音庫中隨機抽取5個字的發音,測量各音節韻母部分的短時過零率均值,利用Eviews6.0軟件對上述均值做配對樣本T檢驗。統計結果顯示t值為18.282,P值=0.00<0.05,表明耳語發音與正常發音在韻母區的過零率有顯著差異,并明顯高于正常發音。

2.2.2 共振峰特征分析

發音原理的差異,導致2種發音的共振峰分布產生明顯的差異,相較于正常發音,耳語除整體能量下降外,在低頻區和中高頻區存在著明顯的能量衰減,出現了此區域共振峰的淡化甚至消失。耳語靠氣流摩擦產生能量,并且摩擦力度強于輔音,因此高頻區域能量得到增強,發音語速的降低使得能量橫向分布較為舒展。

圖4 2種發音的寬帶圖譜

把正常發音元音共振峰的位置、相對關系以及走勢等特征,與耳語的類共振峰特征進行形態化比較,如圖4所示。共振峰能量明顯減弱,共振峰數量明顯減少(低頻區和高頻區共振峰由于能量明顯減弱而淡化甚至消失),共振峰帶寬也存在增大現象;輔音區域的能量相對增強,輔音圖譜特征更為明顯。在統計過程中,由于受發音個體、發音隨機性、樣本數量以及圖譜清晰度等方面的影響,共振峰特征的形態化差異度并非絕對穩定。

從2個語音庫中分別抽取每位話者的二合元音和三合元音的各10次發音,利用Praat軟件測量每個發音第二共振峰的起始值、核心值和收尾值(二合元音只測起始值和收尾值)。利用Eviews6.0軟件對每組1500個樣本值(3000個觀測值)做配對樣本T檢驗,以分析正常發音與耳語發音之間在共振峰特征方面是否存在明顯差異,針對第三共振峰的均值測量計算以及統計分析方法同上,統計結果見表。

表 15位話者耳語前后F2、F3的配對樣本T檢驗分析結果

統計結果表明,耳語發音的F2和F3相對于正常發音,有較為明顯變化,變化范圍在260Hz~360Hz之間,并呈上升趨勢,特別是第二共振峰,整體的變化程度基本不影響話者個體特征的判別。針對數據組做相關回歸分析。由于耳語發音的類共振峰能量較弱,因此在選取測量點、測量方式以及數據計算方式等方面還存在一定誤差;耳語導致共振峰帶寬變大,對于某些元音共振峰進行形態化比較和定量分析就存在困難,同樣會影響到檢驗結果。另外,話者的發音次數以及總體樣本量還需要進一步提高,因此,個別發音人的共振峰變化規律與整體規律存在差異是在所難免[3]。

2.2.3 FFT長時平均曲線分析

FFT長時平均曲線是利用不同參數集合來獲取話者發音特征的有效方式之一,該曲線不受發音內容的限制,表現出較為明顯穩定的話者特征,并且隨著發音方式方法的變化,曲線形態也會反映出話者自身差異[4]。

利用訊飛智能聲紋鑒定工作站建立每位話者兩種發音的FFT長時平均統計曲線并進行數據均值分析,可較為具體地分析出,耳語相較于正常發音而言,韻母區能量明顯衰減的具體頻率區間為低頻區(1000Hz 以下)以及中高頻區(2500Hz~4200Hz),這與寬帶圖譜的形態化對比結果基本一致。如圖5所示,其中粗黑曲線是代表正常發音,較細曲線代表耳語。

在6000Hz左右處耳語能量開始接近于正常發音,并在更高頻段處有超越正常發音的趨勢,這與耳語的產生機理有直接關系,但超出6000Hz以上的能量分布,對于大部分話者的個體特征識別已經沒有太大的應用價值。

圖5 2種發音的FFT長時平均曲線

2.2.4 LPC譜分析

LPC譜分析能夠較好地反映話者聲道特性,并且與發音樣本無關,因此常被用來分析話者特征差異以及特征穩定性。通過智能聲紋鑒定系統,分別提取話者2種發音的長時LPC譜分析曲線,以及音節發音中韻母穩定段瞬時LPC譜分析曲線,并加以比對分析。如圖6、圖7所示,其中粗黑曲線代表正常發音,細曲線代表耳語。

圖6 長時LPC譜分析曲線

圖7 瞬時LPC譜分析曲線

長時LPC譜清晰顯示出耳語發音的能量集中區位置有所提高,并且在低頻區和中高頻區域能量明顯弱于正常發音,導致整體的LPC譜分析曲線形態出現顯著差異,而在高頻區域又回歸正常,這與共振峰數據統計結果和FFT長時平均曲線比對結果基本一致。

瞬時LPC譜分析曲線能夠清晰顯示出元音穩定段瞬時能量~頻率分布狀態。圖7中耳語曲線的能量強區位置稍有上移,對應于音節韻母F2、F3所處位置,體現出耳語發音共振峰存在位移現象。耳語曲線中各峰的頻率跨度略大于正常發音,意味著耳語音節中所謂共振峰帶寬的提高。

3 結論

耳語的產生機理與正常發音存在著較大差異,在聽覺感知、圖譜能量特征分析以及聲學特征參數測量統計等方面,都給檢驗人員帶來干擾甚至較大誤差。本文針對一定量樣本發音的聲學圖譜、曲線進行形態化比對和數值分析,并對聲學特征參數進行統計分析。較之其他相關研究,本文進一步提高了樣本量,并針對二合元音和三合元音音節進行關鍵點數據測量,并利用專業數據統計分析軟件對上千個觀測值進行配對檢驗,增強了聲學參數統計和圖譜分析的語音學意義。另外,在圖譜分析過程中,采用了過零率曲線、FFT長時平均譜以及LPC分析譜,并進行曲線分布形態比對和數值分析,擴充了對耳語特征變異的分析途徑,豐富了比對結果。

分析結果表明,耳語導致元音韻母低頻區以及中高頻區的能量發生明顯下降,F1的利用價值明顯降低,F2和F3位置都有一定程度的提高(平均在260Hz~360Hz之間),并且共振峰帶寬也隨之增大,上述變異情況給耳語圖譜的清晰度帶來負面影響。

話者在耳語發音時,為了更加清晰地表述內容,勢必會加大發音力度以及喉部的緊張程度,給輔音發音的能量提升提供幫助。同時,較強的氣流在聲腔的調制之后,體現出了類似于共振峰的能量分布特征,在形態分布方面不會產生較大改變,但在整體共振峰數值上出現了提升,但未達到本質差異程度,因此可以利用耳語檢材進行話者特征鑒別,需要鑒定人員在數值比對時加以適當修正。

綜上所述,耳語雖然損失了一部分話者的常規特征,通過研究耳語的發音機理可知,耳語發音具有一定的穩定性,在話者鑒別工作中,可以利用耳語檢材與正常樣本或者耳語樣本進行話者比對分析,但需要提高樣本量以減少發音不穩定性以及其他內外部因素所帶來的干擾。

參考文獻:

[1] 潘欣裕,趙鶴鳴.中文耳語元音的聲調特征研究[J].信號處理,2011(10):1525-1530.

[2] 楊莉莉,李燕,徐柏齡.漢語耳語音庫的建立與聽覺實驗研究[J].南京大學學報(自然科學),2005(3):311-317.

[3] 張翠玲,張紅兵,曹巧玲.耳語偽裝語音的聲學研究[J].中國刑警學院學報, 2005(4):43-46.

[4] 楊俊杰.利用長時平均LPC譜檢驗雙胞胎語音之探討[J].中國人民公安大學學報(自然科學版),2003(4):32-37.

(責任編輯:于 萍)

Analysis on the Variation of Whisper Features

ZHANG Hong-bing
(Audio-Visual and Image Technology Department of Criminal Investigation Police University of China Liaoning Shenyang 110035)

The speaker speaks close to other’s ears, which is called whisper. Compared with normal speech, there are signif cant changes in the sense of hearing and the spectrum of whispered speech, which brought many diff culties to the speaker identif cation. In order to provide reference for the whispered speaker identif cation, this paper starts from the analysis on the basic phonetics of whisper, and the variation of tone characteristics, formant distribution and energy characteristics of whispered speech are studied by parametric statistical analysis and spectral equivalence.

Whisper Speaker identif cation Formant LPC

H017

A

2095-7939(2017)01-0096-05

10.14060/j.issn.2095-7939.2017.01.015

2016-09-29

2016年度遼寧省自然科學基金項目(編號:201602810)。

張紅兵(1979-),男,河南舞陽人,中國刑事警察學院聲像資料檢驗技術系副教授,主要從事公安視聽技術研究。

猜你喜歡
耳語元音共振
西江月·晚歸
元音字母和元音字母組合的拼讀規則
ZJP56型組合繩鋸組鋸機超諧共振分析
元音字母和元音字母組合的拼讀規則
選硬人打硬仗——紫陽縣黨建與脫貧同頻共振
路燈和螢火蟲
凝心聚力 互促共進 實現機關黨建與文明單位創建合拍共振
普通話聲調在耳語和正常發音時的語音對比分析
改革是決心和動力的共振
Playing with “ar”
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合