?

對于平均差與標準差的數學關系和應用價值比較研究

2015-03-21 00:30梅林晨
赤峰學院學報·自然科學版 2015年15期
關鍵詞:標準差變異性方差

梅林晨

(陜西學前師范學院,陜西 西安 710100)

1 問題的提出

標準差與平均差都是人為構造出來,使用統計學手段,反映統計樣本或總體的離散程度的統計指標.一般來說,標準差在實際應用中要比后者廣泛一些.多數國內統計學教材在編寫時對兩者采取了平行介紹的方式進行處理,并從實用角度出發,偏重介紹應用更廣的標準差,并認為平均差計算存在不便.對此,十余年來一直有學者提出反駁意見,認為平均差優于標準差,相關論文和著作較多但觀點較為相似,試總結如下:

(1)認為在數字計算時,平均差計算不存在乘方和開方計算,計算量低于標準差,由此認為平均差更簡便,并使用例題舉證;

(2)從自己的實際工作經驗出發,發現標準差計算結果往往大于平均差,由此提出觀點,認為標準差存在高估變異性的問題,并使用例題舉證;

(3)從測量離差一般水平的思路出發,進而認為標準差是平均差的代替,所以標準差不如平均差;

(4)認為在高性能計算機大量普及的情況下,平均差即使有計算不便,但兩者在計算上的差異是可以被忽略的,使用哪種區別不大.

由以上觀點,進一步得出了平均差優于標準差,并且應當大力推廣平均差的結論.

2 平均差優于標準差的觀點不能成立

對于此種觀點,筆者作為一名從事高校統計學教學的教師,委實不敢茍同,現將以上所列論點進行逐條分析:

(1)對于平均差計算更簡便的問題,上述論證只能說明平均差在進行具體數字的手工算術計算時計算量要小于標準差,而對代數計算只字不提,對于具體數字來說,絕對值計算不需要討論正負問題,當然計算量要小,但對于不涉及具體數字的代數計算來說,絕對值的討論當然要復雜一些.平均差計算更簡便的觀點只在算術領域成立,在代數領域難以成立.

(2)標準差計算結果往往大于平均差是一個實際計算觀察的結果,而且也確實符合實際情況,后面筆者也會對此進行代數證明.但是標準差計算結果大于等于平均差這一現象其實無法得出標準差存在高估變異性的問題的結論,只能說明兩者對變異性的測量存在差異,到底是標準差高估了變異性還是平均差低估了變異性,這一現象是不足以說明的.

(3)與其說是標準差代替了平均差,不如說是由于標準差的優點獲得了廣泛使用,變異指標的意義在于衡量分布的變異性,并不是說越接近離差的一般水平變異指標就越好.

(4)即使在高性能計算機大量普及的情況下,平均差與標準差的差異也是不能忽視的.首先是標準差函數可導,平均差函數不可導,這一區別導致兩者在微積分處理上存在巨大差異.其次,標準差對應的是二階矩,對所有平方可積的函數適用,平均差對應的是另一種范數,其適用函數的空間不同于平方可積函數的空間.而平方可積函數的空間具有許多更好的性質.平均差與標準差函數的可導性和可積空間上有很大差異,沒有了導數存在且連續的標準差,大量的數學推導都無法展開,所以建立在標準差基礎上的數理統計體系很難使用平均差代替.因此平均差與標準差的差異不光在算術計算上,更重要的是在數理推導上的差異,而后者與計算機性能的高低并沒有太大關系.

綜上所述,認為平均差優于標準差的觀點無法成立.

3 平均差與標準差的數理關系分析

3.1 平均差與標準差的計算方式的聯系

平均差和標準差的計算方式都是以離差概念為基礎的,離差是單項數值與平均值之間的差,公式可寫作D=Xi-,離差是一個向量,其絕對取值代表了單項數值偏離平均值的程度,正負號代表了單項數值偏離平均值的方向,如果想要構造一個衡量總體變異性的統計指標,使用離差來作為構造的基礎是很自然的選擇,但是也很容易證明,由于離差取值的方向性,其數學期望恒為零.因此,取消離差的正負號后再來構造統計指標才有意義,從這個角度出發,我們可以構造出方差和標準差兩種指標,即σ2=E(D2)=E(Xi-X軍)2和A.D.=E|D|=E|Xi-X軍|.前者是離差平方的數學期望,后者是離差絕對值的數學期望,而方差本身計算出來的指標要比統計量高一階,所以可以對其求平方根進行標準化,就得到了標準差.由此可見,平均差和標準差的計算方式存在著密切聯系,其中,平均差的計算公式可以轉化為,而標準差的計算公式可以轉化為,所以,平均差和標準差的計算公式可以統一為,其中平均差為該統計量取一階的結果,標準差為該統計量取二階的結果.因此,平均差和標準差應當看作同源、同類但不同階的統計量,不存在誰是誰的替代品的問題.

3.2 平均差與標準差的相互關系

在得出平均差與標準差的一般公式之后,我們可以看出兩者的計算過程存在比較緊密的關聯,但兩者呈現的數量關系卻無法直接顯現,前面提到,實際數據觀察似乎支持標準差大于等于平均差的觀點,但直接對兩者進行相減的話,絕對值號又影響了進一步的討論.但是,既然平均差和標準差都大于等于零,如果可以證明標準差的平方即方差與平均差的平方之差大于等于零,其實也就證明了標準差大于等于平均差.計算如下:σX2-A.D.2=E(|Xi-X軍|)2-[E(|Xi-X軍|)]2=E(|Xi-X軍|-E|Xi-X軍|)2=σD2,(D=|Xi-X軍|).又易得 σD2≥0,所以標準差確實大于等于平均差,其中只有在離差絕對值的方差等于零時兩者相等.但這一結果不能說明標準差高估了變異性,前面的證明可以看出,方差之中包含了平均差包含的所有用離差反映的變量值的變異性信息之余,還包含了離差本身的變異性信息,進一步來說,既然方差可以被分解為變量值的平均差的平方與離差絕對值的方差之和,那么離差絕對值的方差也可以被分解為離差平均差的平方與離差的離差絕對值的方差之和,由此可以形成一個關于平均差的無窮級數,而這一無窮級數之和收斂于變量值的方差.由此可以看出,其實方差包含了變量值各級離差的平均差所反映的所有變異性,而且這些變異性之間不存在重復計算問題,而標準差正是方差的標準化,所以,并非是標準差高估了變量的變異性,而是平均差只測量出了變量值包含的所有變異性的一部分.

3.3 平均差函數與標準差函數對變異性敏感程度的比較

如果從平均數的角度觀察平均差函數與標準差函數,不難發現其中的一些區別,平均差函數可做如下變化:A.D.,可以看出平均差函數即離差的簡單算術平均數,離差的大小并不影響其權重,所以對于平均差來說,極端變量值的變異性被同等看待了.而標準差可做如下變化可以看出根號內的公式可以看成以離差本身大小為權重的加權算術平均數,所以越極端的變量值會被給予越多的關注,這一點更符合人們對于數據變異性的直接感覺.可以直觀的構造如下兩組數說明這種區別:1,1,0,-1,-1和 2,0,0,0,-2,兩者擁有相同的均值0和平均差0.8,但直觀感覺前者的變異性較小,如果使用標準差,則前者標準差為0.89,后者為1.26,就有效的衡量出了這種變異性.

3.4 在正態分布下平均差與標準差的取值討論

如假設 X服從正態分布,X~N(μ,σ2),令 Y=X-μ,則有Y~N(0,σ2).此時,由此可以看出,在正態分布下,平均差與標準差的取值存在穩定的倍數關系.同理其實不難證明,在參數確定的特定分布下,平均差與標準差的取值都存在該分布特有的穩定關系.至于是否可以在具體數字計算時結合這種穩定關系,使用平均差估算標準差,還有待后續研究證明其可靠性.

4 總結

由以上分析可見,標準差與平均差是有著統一公式和數學關系的兩種變異指標,并不存在排他性問題,其中平均差在具體數字計算時有一定優勢,但不利于代數運算和數學推導,同時平均差在計算變異性時存在信息損失低估變異性的問題,因此難于動搖標準差在統計學中的重要地位.

〔1〕韓兆洲,楊林濤.極差、平均差和標準差之間測度關系研究[J].統計與信息論壇,2008(04).

〔2〕桂文林,伍超標.標準差和平均差的內在關系及應用研究[J].數理統計與管理,2005(02).

〔3〕趙海燕,陳立秋,張曉方.平均差和標準差在變異指標中的代表性淺議[J].統計與咨詢,2002(04).

〔4〕朱子云,朱益超.平均差的算法改型及其數學性質研究[J].麗水學院學報,2012(02).

〔5〕呂華興.統計中的標準差標準嗎?——平均差比標準差更標準[J].江蘇統計,2000(05).

猜你喜歡
標準差變異性方差
概率與統計(2)——離散型隨機變量的期望與方差
方差越小越好?
計算方差用哪個公式
方差生活秀
運動、健康與心率變異性的研究進展
咳嗽變異性哮喘的中醫治療近況
清肺止咳湯治療咳嗽變異性哮喘40例
醫學科技論文中有效數字的確定
醫學科技論文中有效數字的確定
冬病夏治止咳貼貼敷治療小兒咳嗽變異性哮喘40例
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合