白 雪,龍 兵
(荊楚理工學院 數理學院,湖北 荊門 448000)
冪分布是貝塔分布的一種特殊情形,在貝葉斯統計分析中常被用于產品合格率的先驗分布。冪分布的概率密度函數和累積分布函數分別為
其中參數θ>0,0<x<1。
在文獻[1-4]中取冪分布作為幾何分布參數的先驗分布,討論了未知參數的貝葉斯估計問題。文獻[5]在抽樣總體服從冪分布的情況下,研究了次序統計量的性質。文獻[6-7]在部分缺失數據樣本下討論了兩個冪分布總體參數的極大似然估計、參數之差的置信區間和假設檢驗,并通過隨機模擬驗證估計的精度。
在許多情況下,我們需要估計概率密度函數和累積分布函數。例如,我們使用概率密度函數來估計微分熵、Kullback-Leibler散度和Fisher信息量;我們使用分布函數估計分位數函數和累積剩余熵等。因此文獻[8-14]討論了多個總體分布的概率密度函數和分布函數的估計,計算了估計的均方誤差并對多種估計進行比較。然而,對冪分布的概率密度函數和分布函數進行統計分析的文獻到目前為止還沒有見到,本文將對這一問題進行探討。
假設X1,X2,…,X n是從冪分布(1)和(2)中抽取的獨立同分布隨機樣本,由極大似然法可以得到參數θ的極大似然估計(MLE)為
根據極大似然估計的不變性,可以得到密度函數和分布函數的極大似然估計分別為
由于-2θlnX i~χ2(2),因此,則Y的概率密度函數為
定理1概率密度函數和累積分布函數極大似然估計的r階矩分別為
其中K v(·)表示第二類v的修正貝塞爾函數。
證明:根據(4)式,可以得到
利用文獻[15]中的公式(3.471.9),則
因此
注記:從定理1可以看到,當取r=1時因此分別是f(x),F(x)的有偏估計。
定理2和的均方誤差分別為
證明:根據均方誤差公式可得
在定理1中分別取r=2和r=1,可以得到
下面將得到f(x)和F(x)的一致最小方差無偏估計(UMVUE),進而得到這些估計的均方誤差。
設X1,X2,…,X n是從冪分布(1)中抽取的獨立同分布隨機樣本,則是關于θ的一個完備充分統計量。設f·(x)是f(x)的一致最小方差無偏估計,根據Lehmann-Scheffe定理
其中f·(t)=f X1|T(x1|t)是當給定T=t時X1的條件概率密度函數,f X1,T(x1,t)是X1和T的聯合概率密度函數。
定理3當給定T=t時X1的條件概率密度函數為
證明:設Z i=-lnX i,i=1,2,…,n,則,根據(3)式可以得到T的概率密度函數為
因此當給定T=t時X1的條件概率密度函數為
因此
定理4當T=t時,f(x)和F(x)的一致最小方差無偏估計分別為
其中-lnx<t<+∞。
證明:根據(8)式和定理3,我們立即可以得到(x)是f(x)的一致最小方差無偏估計。對~(x)積分就可以得到F(x)的一致最小方差無偏估計(x)。
定理5和的均方誤差分別為
利用(9)式,可得
由于
因此
令θt=u,則
因此
由于
因此
利用均方誤差的公式則定理5得證。
基于分位數的估計由Kao[16]在1958年提出,當某個概率分布的分位數函數具有較簡單的形式時可以考慮使用這種方法來估計分布的未知參數。
設X1,X2,…,X n是從冪分布(1)中抽取的獨立同分布隨機樣本,又設X(1),X(2),…,X(n)為次序統計量。記θ~PC為參數θ基于分位數的估計。通過極小化
利用最小二乘法,可得
因此f(x)和F(x)的估計分別為
在這一部分通過Mathematica和Matlab軟件進行模擬計算。當未知參數θ的值分別取1.5,2,2.5,3時,利用逆變換法X i=(i=1,2,…,n),其中U i是(0,1)上獨立均勻分布隨機數,則X i就是服從參數θ的冪分布隨機數,樣本量分別取n=10,20,30,40。對于產生的每一個隨機樣本計算出估計量的值,經過1000次重復模擬計算出各種估計的均方誤差。
從表1中的數據可以看出,隨著樣本量n的增大,估計量的均方誤差變小?;诜治粩档墓烙嫷木秸`差比極大似然估計和一致最小方差無偏估計的均方誤差都要大。概率密度函數的極大似然估計的均方誤差要小于一致最小方差無偏估計的均方誤差,對于分布函數而言兩者的均方誤差比較接近。