?

語音信號幅值分布的統計分析

2016-05-19 13:34李亞
電腦知識與技術 2016年7期
關鍵詞:標準差語音

李亞

摘要:針對PCM編碼的語音信號,提出了一種基于正交矩陣變換的語音處理方法以改變語音信號幅值的分布規律,從而減小語音信號的動態范圍與標準差。實驗表明,正交矩陣變換算法可以明顯降低語音信號的幅值范圍,實驗數據顯示變換后語音信號的標準差降低20%。同時多人試聽實驗證明解碼后的語音質量沒有降低。此算法縮小了語音信號的幅值范圍和標準差,從而可以用更少的編碼比特完成語音信號的編碼,壓縮效率可以進一步提高。

關鍵詞: 語音;幅值分布;正交矩陣;標準差;熵

中圖分類號:TP391.08 文獻標識碼:A 文章編號:1009-3044(2016)07-0164-02

Statistics and Analysis of Speech Signal Amplitude Distribution

LI Ya

(Department of Computer Science, Tongji University, Shanghai 201804, China)

Abstract: In view of PCM(Pulse Code Modulation) speech signal, this paper puts forward a method of speech processing based on orthogonal matrix transformation to change the amplitude distribution of speech signal, which can reduce the standard deviation of speech signal. Experiments indicate that the orthogonal matrix transformation algorithm can obviously reduce the amplitude range of speech signal, and the results show that and speech signal standard deviation is reduced by 20% through the transformation. At the same time, voice quality after decoding is not decreased according to listening experimenter. The algorithm reduces amplitude range and standard deviation of the speech signal, so speech signal can be coded with less bits and compression efficiency can be further improved.

Key words: speech signal; amplitude distribution; orthogonal matrix; standard deviation; entropy

1 概述

早期的語音信號傳輸和處理都是以模擬方式進行的,自PCM脈沖編碼調制理論提出來后,語音信號處理進入數字化時代。從最初64kb/s的標準PCM波形編碼器到現在4kb/s以下的參量編碼的聲碼器,語音壓縮編碼在幾十年里得到迅速發展[1-2]。為了提高通信網中的信息傳輸效率及實現語音的高效存儲,還需要對編碼后的數字語音進行壓縮,即語音壓縮。

目前,比較成熟的語音信號分析方法[3-4]主要有時域分析、短時傅里葉變換、倒譜以及LPC譜分析。通過對語音信號幅值的相關研究,可以統計得到語音信號的幅值分布。根據其幅值分布的特點,可以研究其他編碼方案在語音信號中的應用,例如霍夫曼編碼。

2 原始語音信號的分布統計

對原始模擬語音信號采樣,可以得到語音信號的離散數據樣點。假設采樣后的語音信號有K=M×N數據樣點,記為X=(X1,X2,…,XK),其中K、M、N都是正整數。則采樣后信號數據點的矩陣形式可以表示為

5 結論

本文首先分析了語音信號相鄰樣本間的相關特性,并根據這種相關性,利用哈達瑪矩陣對原始信號進行變換并統計幅值分布,實驗結果表明此方法明顯減小了語音信號的動態范圍和標準差,從而提高語音信號的壓縮率。其次,利用哈達碼矩陣的正交特性可以恢復原始信號,同樣可以采用其他類型的矩陣進行變換并統計分析。最后,此算法在語音編碼和無線通信中有一定地參考價值,其具體應用有待進一步討論研究。

參考文獻:

[1] 趙曉群.數字語音編碼[M]. 北京:機械工業出版社, 2007.

[2] 時磊, 尚秋峰, 李健宇. 語音壓縮編碼技術研究進展[J]. 聲學技術, 2008, 27(4):553-556.

[3] 張宗念, 黃仁泰, 閆敬文. 壓縮感知信號盲稀疏度重構算法[J]. 電子學報, 2011, 39(1):18-22.

[4] 劉毅強,劉昱,段繼忠,劉亞峰. 壓縮感知處理語音信號的性能分析及比較[J]. 電聲技術, 2012, 36(2):44-47.

[5] 時娟. Walsh-Hadamard變換及其在信源編碼中的應用[J]. 甘肅科學學報, 2005, 17(2):38-40.

[6] Wang Guibao, Huang Hongzhong, Liu Yu, Zhang Xiaoling and Wang Zhonglai. Uncertainty estimation of reliability redundancy in complex systems based on the Cross-Entropy method[J]. Journal of Mechanical Science and Technology, 2009, 23(10):2612-2623.

[7] 傅祖蕓, 趙建中. 信息論與編碼[M]. 北京:電子工業出版社, 2008.

[8] 常荷. 熵與方差[J].開封教育學院學報, 2001,21(4):43-44.

猜你喜歡
標準差語音
用Pro-Kin Line平衡反饋訓練儀對早期帕金森病患者進行治療對其動態平衡功能的影響
第二語言語音習得中的誤讀
魔力語音
基于MATLAB的語音信號處理
基于MQ3與MP3的價廉物美的酒駕語音提醒器
對方正在輸入……
對于平均差與標準差的數學關系和應用價值比較研究
科大訊飛:押注語音生態圈
醫學科技論文中有效數字的確定
醫學科技論文中有效數字的確定
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合