?

綜合評價方法中的最優無量綱化模型研究

2024-03-26 03:13李興奇高曉紅
統計與決策 2024年5期
關鍵詞:綱化區分度無量

李興奇,高曉紅

(楚雄師范學院a.管理與經濟學院;b.數學與計算機科學學院,云南 楚雄 675000)

0 引言

由于不同指標的單位、數量級和趨勢不同,因此在綜合評價時需對指標進行無量綱化處理?,F有的綜合評價方法和無量綱化方法眾多,但經不同無量綱化方法處理后的綜合評價結果不同,如何針對不同評價方法來選擇或構建最優無量綱化模型是解決綜合評價過程中無量綱化方法選擇盲目性問題的重要途徑。目前有很多學者對無量綱化方法的選擇進行了研究,例如:郭亞軍和易平濤(2008)[1]基于單調性、差異不變性等6 條性質進行無量綱化方法選擇;易平濤等(2014)[2]通過無量綱化結果的波動性進行方法選擇;李玲玉等(2016)[3]根據變異性、差異性和穩定性進行方法選擇;李興奇和高曉紅(2021)[4]根據分布不變性、變異不變性和效率最優性進行方法選擇,發現線性無量綱化方法不改變數據的分布特征,伸縮法不改變數據的分布特征和變異特征;郭亞軍等(2011)[5]根據拉開評價結果的檔次來進行方法選擇;高曉紅和李興奇(2020,2022)[6,7]根據第一主成分貢獻率和信息損失大小來選擇主成分分析法中的無量綱化方法,并進一步根據擬合優度來選擇多元線性回歸模型中的無量綱化方法。容易發現,現有關于無量綱化方法選擇的研究較多,但關于最優無量綱化模型構建的研究甚少,并且無量綱化選擇的標準不一,其盲目性問題依然存在?;诖?,本文首先對綜合評價結果的優良性進行度量;其次,構建無量綱化方法有效性的統計檢驗方法;最后,以無量綱化方法有效為約束條件分別構建穩定性最高、區分度最高以及兩者均最高的最優無量綱化模型,并通過數值模擬實驗來求解模型。

1 綜合評價方法

現有的綜合評價方法眾多,有標準差法、變異系數法、熵權法、相關系數法、主成分分析法等。不同綜合評價方法的賦權機理不同,所得的綜合評價結果也不同。假設n項指標構成一個綜合評價指標體系X=(X1,X2,…,Xj,…,Xn) ,每項指標擁有m個樣本觀測值,即Xj=(x1j,x2j,…,xmj)T,其均值為,指標體系X經無量綱化處理后的結果為Y=(Y1,Y2,…,Yn),Yj=(y1j,y2j,…,ymj)T,其均值為,各指標權重為w=(w1,w2,…,wn)T,綜合評價結果為Z=(z1,z2,…,zm)T,其中Z=Yw。

1.1 標準差法

標準差法是基于評價指標的標準差大小來確定權重的,標準差越大的指標其數值波動越大,指標內包含的差異信息也越豐富,因此應被賦予較大的權重。假設第j項指標的標準差為Sj,j=1,2,…,n,歸一化得到第j項指標的權重為

1.2 變異系數法

與標準差法類似,變異系數法也是根據指標的差異信息大小來確定權重,但變異系數法中改用變異系數來度量指標內的差異信息,更能真實反映指標內數值的差異信息大小。假設第j項指標的變異系數為因變異系數可正可負,為保證指標的權重為正數,故對變異系數的絕對值進行歸一化得到第j項指標的權重為

1.3 熵權法

熵權法是根據指標的熵值大小來確定權重,熵值越大表明指標內的差異越小,應被賦予較小的權重,熵值越小表明指標內的差異越大,應被賦予較大的權重。假設第j項指標的信息熵為,其中,k=1 lnm,,則第j項指標的權重為

1.4 相關系數法

相關系數法是根據指標間的相關性來確定權重,若某項指標與其余指標的相關性越大,則其被替代的可能性就越大,應被賦予較小的權重。偏相關系數能在控制其余指標的情況下單獨反映任意兩項指標相關性的大小,更能真實反映指標間的替代關系。假設rkj為簡單相關系數矩陣的逆矩陣中第k行、第j列的元素,則第j項指標與其余指標的偏相關性大小為,權重為wj=因指標被替代的程度只與相關性的大小有關,與方向無關,故對偏相關系數取絕對值。

1.5 主成分分析法

主成分分析法是根據最大特征值所對應的特征向量來確定權重,假設指標間協方差矩陣的特征值為λ1,λ2,…,λn,最大特征值λ1所對應的特征向量為α1=(a11,a21,…,an1)T,則各指標的權重為

1.6 因子分析法

因子分析與主成分分析類似,均屬于統計降維方法,適用于指標間存在強相關或多重共線性的情況,不同之處在于,因子分析是用幾個潛在的、不可觀測的公因子來線性表示原始變量,主成分分析則是將原始指標線性組合成一個綜合指標。因子分析的前提是各指標間存在一定的線性相關關系,如果原始指標的相關性較弱則很難找到潛在的公因子,其效用不佳。在運用因子分析法時,首先,計算變量間的相關系數矩陣,求解初等載荷矩陣;然后,提取適當數量的公因子,對因子進行旋轉,計算因子得分和貢獻率;最后,根據各因子貢獻率在累計貢獻率中所占的比重來確定指標權重。

2 綜合評價結果的穩定性

綜合評價是一個復雜的多環節系統,任意環節的變化都可能對綜合評價結果帶來影響。由于不同的評價指標和模型代表了不同的評價目的和機理,因評價指標或模型變化而導致評價結果不同屬于合理現象,但當綜合評價指標體系和模型一定時,因樣本局部變動、單位變化或數據處理方式不同而導致綜合評價結果產生逆序屬于不合理現象。因此,將樣本局部變動、單位變化和無量綱化方法不同而導致綜合評價結果發生的波動性大小稱為綜合評價結果的穩定性,計算公式為:

其中,σs2為整個評價系統的方差,其值越小時綜合評價結果的穩定性越高;σij為指標i與指標j的協方差。

3 綜合評價結果的區分度

傳統的區分度主要用于度量試卷能有效分辨出不同水平學生的能力,其未能反映任意兩個評價值之間的可區分性大小?;诖?,根據任意兩個評價值間的可區分性來構建新的區分度函數。

其中,D表示綜合評價值的區分度。在計算區分度時,首先,將綜合評價值Z=(z1,z2,…,zm)T按從小到大的順序排列得到;然后,計算任意兩個相鄰評價值間的差距表示兩個相鄰評價值間的區分度,用表示最大值與最小值之間的區分度;最后,將與ln加總表示總的區分度,除以m可消除評價值數量對結果的影響。

4 無量綱化的有效性檢驗

H0:μ1=μ2=…=μn。無量綱化后各指標間不存在量綱差異,方法有效。

H1:μ1,μ2,…,μn不全相等。無量綱化后各指標間存在量綱差異,方法無效。

構造檢驗統計量。根據統計學原理,分別用組間均方MSA與組內均方MSE來度量指標間的量級差異大小和指標內的數值差異大小,構造檢驗統計量為:

統計量F服從自由度為n-1 和mn-n的F分布。當F>Fα(n-1,mn-n)時,應拒絕原假設,表明無量綱化方法無效;當F≤Fα(n-1,mn-n)時,不能拒絕原假設,表明無量綱化方法有效。

5 綜合評價方法中的最優無量綱化模型構建

5.1 穩定性最高的最優無量綱化模型

現有關于無量綱化方法選擇的研究較多,有關最優無量綱化模型構建的研究較少。故以綜合評價的穩定性為目標函數,以無量綱化有效為主要約束條件構建以下模型:

其中,F<Fα表示方法有效,-max(xj)≤aj≤max(xj)和表示平移尺度和伸縮尺度可在較大范圍內取值。通過該模型可求解出穩定性最高時的最優平移尺度和伸縮尺度。

5.2 區分度最高的最優無量綱化模型

以區分度最大為目標函數,以無量綱化有效為主要約束條件可構建以下最優化模型:

5.3 穩定性和區分度均最高的最優無量綱化模型

穩定性和區分度作為兩種不同的評價標準,僅考慮其中一個達到最優有時未能滿足實際需求,所以需要構建一種能讓穩定性和區分度同時達到最優的無量綱化模型。以系統方差與區分度函數之差最小作為目標函數,以無量綱化有效為主要約束條件,構建以下模型:

5.4 小平移尺度約束下的最優無量綱化模型

模型(4)至模型(6)中的平移尺度均設定了較大的取值范圍,可保證模型有最優解。但對指標進行大范圍的平移會改變指標的變異特征,造成原始信息的損失[4],所以為盡可能減小指標內變異信息的損失,將模型(4)至模型(6)中的平移尺度約束改為aj∈U( 0,δ),即在零附近取值,分別得到小平移尺度模型(7)至模型(9)。

穩定性最高的小平移尺度模型:

區分度最高的小平移尺度模型:

穩定性和區分度均最高的小平移尺度模型:

6 仿真模擬實驗

現有關于無量綱化方法的研究大多是基于個案來說明某種方法的合理性,但隨著大數據技術的發展,指標體系越來越復雜,個案型的研究結論難以進行推廣,故通過數值模擬實驗展開研究。用MATLAB 軟件產生6組方差相同、均值各異的正態分布隨機數,每組隨機數包含5000 個樣本,記作N(50,102),N(100,102),N(500,102) ,N(1000,102) ,N(3000,102) ,N(5000,102) ,相當于利用6 項指標對5000 個對象進行綜合評價,各指標間存在明顯的量綱差異。

6.1 大平移尺度約束下的最優無量綱化模型求解

根據以上隨機數據,分別用模型(4)至模型(6)求解6 種綜合評價方法所對應的最優平移尺度和伸縮尺度,并進行比較分析,結果如表1所示。

表1 大平移尺度下各綜合評價方法的最優無量綱化模型計算結果

從表1可看出,通過最優化模型可求解出不同綜合評價方法中的最優無量綱化結果,且最優無量綱化結果隨綜合評價方法、目標函數和約束條件的變化而變化。

從最優平移尺度看:當穩定性最高時,各綜合評價方法中第一項和第六項指標的平移尺度均小于零,說明取值最小和最大的指標需向右平移;當區分度最高時,各綜合評價方法中均滿足第五項和第六項指標的平移尺度小于零,其余的大于零,表明取值較大的指標需向右平移,取值較小的指標需向左平移。從絕對值大小來看,各綜合評價方法均滿足 |a1|> |a2|> |a3|> |a4|> |a5|> |a6|,表明取值越小的指標平移尺度越大;當穩定性和區分度均最高時,各綜合評價方法均滿足第一項和第六項指標的平移尺度小于零,其余的均大于零。

從最優伸縮尺度看:當穩定性最高時,各綜合評價方法均滿足k6>k5>k4>k3>k1>k2;當區分度最高時,各綜合評價方法均滿足k6>k5>k4>k3>k2>k1;當穩定性和區分度均最高時,各綜合評價方法均滿足k6>k5>k4>k3>k1>k2。綜合分析后發現,取值越大的指標其壓縮比例越大。

從目標函數值看,在相同的約束條件下各綜合評價方法所能達到的最優目標不同。當穩定性最高時,各綜合評價方法的穩定性大小關系為相關系數法>因子分析法>變異系數法>標準差法>熵權法>主成分分析法;當區分度最高時,各綜合評價方法的區分度大小關系為相關系數法<因子分析法<標準差法<變異系數法<熵權法<主成分分析法;當穩定性和區分度均最高時,排序情況與區分度最高時相同。

從檢驗統計量來看,在0.05 的顯著性水平下,通過MATLAB軟件計算出其分位數約為2.214。當穩定性最高時,所有綜合評價方法的檢驗統計量都小于0.05 分位數,說明相應的無量綱化方法均有效;當區分度最高時,各綜合評價方法的檢驗統計量都略高于0.05 分位數,說明相應的無量綱化方法沒有完全消除指標間的量綱差異,現實中受數據復雜性和多樣性的影響,難以完全消除指標間的量綱差異,此時可適當放松條件,當檢驗統計量略高于其分位數時可認為無量綱化方法弱有效;當穩定性和區分度均最高時,除熵權法外,其余綜合評價方法的檢驗統計量都小于0.05 分位數,而熵權法的檢驗統計量為3.115,大于0.05 分位數,表明熵權法無效,其余方法有效。

6.2 小平移尺度約束下的最優無量綱化模型求解

分別用模型(7)至模型(9)來求解6 種綜合評價方法的最優無量綱化,結果如表2 所示。

表2 小平移尺度下各綜合評價方法的最優無量綱化模型計算結果

從表2 可看出,在小平移尺度約束下,最優平移尺度及伸縮尺度因綜合評價方法和目標函數的不同而不同,表明在使用無量綱方法時,應充分考慮其與評價方法和目標函數的適用性。從平移尺度看,通過模型(7)至模型(9)求解出的平移尺度都非常小,等于或約等于零,這避免或減少了指標內變異信息的損失。從伸縮尺度看,同一項指標在不同目標函數及不同評價方法中的最優平移尺度相差不大,都約等于指標的均值,這說明當平移尺度較小時,在均值附近對指標進行壓縮可提升無量綱化的效果。從目標函數值看,各綜合評價方法的目標大小排序均為相關系數法<標準差法<變異系數法<熵權法<因子分析法<主成分分析法,說明相關系數法的穩定性最高、區分度最低,主成分分析法的穩定性最低、區分度最高。從檢驗統計量看,標準差法、變異系數法、熵權法、相關系數法中的最優無量綱化方法均有效,主成分分析法和因子分析法中的最優無量綱化方法弱有效。比較表1和表2發現,各評價方法的最優無量綱化結果會隨約束條件的變化而變化。

通過比較表1和表2發現,當約束條件發生變化時,各綜合評價方法的最優平移尺度和伸縮尺度、目標函數值、檢驗統計量也隨之改變。與大平移尺度相比,小平移尺度下各類綜合評價方法中目標函數所能達到的最優解有所下降,說明模型(7)至模型(9)不僅可以保護指標內的變異信息,還可使目標函數所能達到的最優解盡可能理想。

7 結論

本文通過理論分析和仿真模擬實驗分別針對6 種綜合評價方法構建3類最優無量綱化模型,對模型進行不斷優化,輸出相應結果,并進行深入對比分析后發現:

(1)綜合評價方法、目標函數和約束條件不同時所對應的最優無量綱化結果不同。綜合評價過程中應充分考慮評價方法、目標函數、約束條件等因素來構建最優無量綱化模型。

(2)最優無量綱化模型構建與無量綱化方法選擇不同。無量綱化方法選擇只能從已有方法中選擇較為適合的方法,其受現有方法的影響,而最優無量綱化模型可以針對特定的綜合評價方法來尋找全局范圍內的最優無量綱化方法,其不受現有方法的影響,還可以根據實際需求來設定目標函數和約束條件,降低了綜合評價過程中無量綱化方法選擇的盲目性,提高了綜合評價結果的可信度。

(3)利用穩定性函數和區分度函數可以科學度量綜合評價結果的穩定性和區分度,進而判別綜合評價結果的優良;利用無量綱化的有效性檢驗方法可以準確判斷無量綱化是否有效消除了指標間的量綱差異,進而構建最優的無量綱化模型。

猜你喜歡
綱化區分度無量
無量綱化方法選擇及最優無量綱化方法構建
烏雷:無量之物
劉少白
淺談試卷分析常用的幾個參數及其應用
圖形推理測量指標相關性考察*
論書絕句·評謝無量(1884—1964)
炳靈寺第70 窟無量壽經變辨識
線性無量綱化方法比較研究
淺觀一道題的“區分度”
無量綱化方法的選取原則
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合