?

聲音端點的檢測方法

2016-12-26 21:40趙偉孫廣大
電子技術與軟件工程 2016年22期
關鍵詞:模型

趙偉++孫廣大

摘 要

眾所周知,在語音的系統的識別中,如何降低端點檢測得出錯率,一直是人們研究和考察的重點,然而重要的步驟就是進行端點的檢測。因此對端點檢測也成為了語音信號處理的一個一個關鍵的部分。本文就是根據聲音端點檢測的方法還有步驟,進行探討還有研究,在本篇論文中可能會涉及到實驗的相關的環節,本篇論文用實驗的客觀結果,來證明,這種端點檢測法的出錯率就會大范圍的的降低,催檢測的準確率也是一個大的提升,檢測結果也會越來越精確。這樣也更方便我們能準確的檢測出語音信號的端點。

【關鍵詞】端點檢測 模型 過零率

1 引言

在現代社會人類進行交流,最方便和快捷的方式毫無疑問那就是語音的交流。提高語音的傳播速度,擴大云因的傳播內容,一直是工程人員的一個研究的重點,如何能夠實現云因的人類還有機器人的互相交互,提高語音功能的智能化,一直是語音信號處理研究領域中的重要研究課題。然而語音端點檢測它包括以下幾項內容,首先是要對語音進行分析,然后還有語音的合成,對語音系統進行編碼處理,還有一個更為重要的技術難題就是對說話者的說話內容要能夠進行準確的識別也是一項十分重要的環節,它將直接影響到后面一些列工作的實施還有就是工作進行的準確性。但是在實際的操作的過程中,要做的第一步及是對系統的輸入信號能夠進行一個準確的判斷,語言的數據的準確性是保證和確定聲音的端點還有尾點的關鍵所在,因此這就會大大的增加準確性運算強度,提高了學習效率,同時降低了完成這項任務所需要花費的時間。

在日常的語音識別系統中,首先是根據一定的端點檢測算法,對語音的信號進行分割處理,語音信號一般分為有音信號,還有無音信號,兩者是有很大區別的,姐姐就是對有聲片段進行處理,這主要包括根據語音信號的某些明顯特征進行處理。通過實驗我們發現了一下幾點現象,首先是在安靜的環境中,語音系統識別的出錯率,都集中在端點位置上。從以上的實驗中我們可以得出,對語音的信號識別系統的檢測就顯得尤為重要。安靜的環境如此,在噪音的環境中更是如此,如果不能保證端點檢測的準確率,會直接影響后續工作的進行,所以我們必須保證準確性,這是我們進行下面工作的前提保證。所以語音信號的準確還有語音信號的端點檢測一直是現在進行研究的重難點分析。

2 語音信號的時域特征

2.1 短時能量分析

語音信號的強弱是由多方面決定,其中一個關鍵點就是,語音信號時間的長短問題,這也是人們非常容易忽視的一個問題,信號也會隨著清濁音的變化從而發生一系列相應的變化,通過總結和分析我們得出了一下的計算工程式:

2.2 短時平均過零率

大家都非常熟悉的一點是,段時間的平均的過零率會對信號有著極為嚴格的要求,平均值的準確性實際上就是所得符號它采集的準確性,這都密不可分。根據短時能量的定律我們可以得出,短時能量的大體位置和方向。

3 端點檢測

3.1 端點檢測介紹

識別語音信號的起止點是所有語音識別系統所必須經歷的一個過程。只有保證起點還有終點的準確率。這樣我們才能保證我們測試出的結果是正確的,這樣也能夠保證我們的數據分析得出的結果是準確的。通過這樣的方法,不但降低了我們數據量的采集,還有就是降低了運算的工程量還有處理的時間,這些方面的提高都會在一定的程度上降低我們的出錯率。人類的聲音也是各有特色的每個人都有每個人的特點,但是從總體上我們可以大體分為兩個部分首先第一個就是清音,第二個是濁音。這兩種聲音是有很大不同的,平常我們所采用的端點檢測方法,大多數會采用特征提取方法。根據這兩種聲音的發生規律,對其進行比較和研究,將該特征和設定的門限進行比較或是采取某種判決機制來判斷。

在日常的語音識別過程中,過零率的端點檢測,是最普遍的語音端點檢測的方法,它有明顯的物理意義,而且計算的過程也是相對的簡單,他的這些優點,使它在端點的實際操作中得到了最為廣泛的應用。但是任何事物都具有它的兩面性,因此他也具有不可否認的缺點,而最根本最實際的判斷的標準就是根據我們日常積累的實際經驗才判斷們限的端點問題。

3.2 雙門限端點檢測算法

對過零率的端點的檢測都是采用2級的判斷的方法,第一步就是根據平均值進行第一次判斷,接下來在這個基礎上,我們再利用段時間平均的過零率統一進行第二次判斷。之所以我們不用段時間判斷作為第一判斷,原因就是段時間的判斷不能準確的得出起點的關鍵位置,因此為了增加我們判斷的準確率,通常是常采用雙門限的方法,通過比較得出一個準確的答案。

從圖1我們可以看出,符值都會在這個限度范圍之內。通過這個步驟我們可以進行第一次初步的判斷。如果進行語音測試的語音落在了,這個起止點所對應的時間的間隔之外(即AB段之外)。接下來,要做的事要在噪聲的情況下,對語音進行數據研究分析,我們通過分析,得出以下兩個公式,從這公式中我們可以清晰地看到,平均值準確性,完全是由多級判斷而決定的,語音的起點還有結束的尾點都至關重要。

3.3 基于調頻-調幅模型的語音端點檢測技術

雙門限檢測方法我們在上文介紹中,已經提到了就是要根據我們以往的經驗值,來判斷一個大概的經驗值,榆次同時呢,要對判斷結果進行二次判斷,得出一個相對來說更為準確的門限值。這樣也會增加我們判斷的誤差。與之相反的如果我么采用而運用Teager能量算子判斷,這樣既可以反映幅值的變化,同時也能反映出頻率的變化。判斷他們是成正想觀性還是負相關性,是不是頻率的的增加,頻率也會增加。能量的輸出值是不是也會隨之發生相應的改變,同時呢,在針對不同類別的信號時,Teager能量算子的輸出也反映出不同的特性。因此,能量算法的使用非線性能量算子來跟蹤語音信號,這是我們語音信號系統的一個創新之舉,不在是單純的靠單個共振峰的語音信號能量的檢測進行分析:

可以看出R(n)信號的能量算子輸出由兩部分組成:一部分頻率調制后的瞬時頻率,另一部分是幅值調制后的幅值包絡,它可以反應出幅值和頻率的變化。根據這個特點可以進行以Teager能量算子輸出的能量為特征的端點檢測。

4 結論

本篇論文主要是對聲音端點檢測的方法進行研究,我們通過雙門限的檢測方法,可以高效的將頻率與幅值完全給結合起來,這種方法的檢測要比以往的傳統的能量進行端點檢測得到更為準確的結果。但是萬物都存在著優點還有缺點,如果在噪音較大的情況下,我們的檢測結果也是不準確的,在沒有噪音干擾的情況下它的檢測結果就會提高,同時信號不是很強的情況下,它的結果也不是很準確。

參考文獻

[1]趙力.語音信號處理[M].北京:機械工業出版社,2003.

[2]易克初.語音信號處理[M].北京:國防工業出版社,2004.

[3]王炳錫,屈丹,彭煊.實用語音識別基礎[M].北京:國防工業出版社,2005.

[4]雷靜.語音識別技術的研究及基本實現[D].武漢:武漢理工大學,2002.

[5]張雄偉,陳亮,楊吉斌.現代語音處理技術及應用[M].北京:機械工業版社,2003.

[6]韓紀慶,張磊,鄭鐵然[M].北京:清華大學出版社,2004.

作者簡介

趙偉(1978-),男,河北省保定市人。大學本科學歷?,F為河北化工醫藥職業技術學院工程師。主要研究方向為計算機網絡及自動化。

孫廣大(1982-),男,河北省唐山市人。大學本科學歷?,F為河北化工醫藥職業技術學院工程師。主要研究方向為計算機網絡。

作者單位

河北化工醫藥職業技術學院 河北省石家莊市 050026

猜你喜歡
模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
AVB網絡流量整形幀模型端到端延遲計算
考慮初始損傷的脆性疲勞損傷模型及驗證
3D打印中的模型分割與打包
離散型隨機變量分布列的兩法則和三模型
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合