?

基于改進Gini-Simpson指數的指標及權重均為混合屬性的廣義灰靶決策方法

2019-02-15 08:19馬金山
統計與信息論壇 2019年2期
關鍵詞:組數靶心權重

馬金山

(河南理工大學 能源科學與工程學院,河南 焦作 454000)

一、引 言

自鄧聚龍教授提出灰靶決策方法以來,許多學者對其進行了研究改進[1]171-209。隨著決策理論與方法研究的深入,決策方案的指標值也由單純的實數值拓展為混合屬性指標值?;旌蠈傩曰野袥Q策方法也隨之產生,進一步增強了該方法的適用性?;野袥Q策方法的核心是求各決策方案對于靶心的靶心距,并以靶心距作為各方案優劣決策的依據。決策方案指標值為確定性實數的灰靶決策方法,其對靶心距的獲取主要采用距離法,如采用歐氏距離法或馬氏距離法等[2]。包含確定數和不確定數的混屬性灰靶決策方法對靶心距的獲取方法:一類是采用距離的方法進行處理,主要是采用歐氏距離[3-4];另一類是采用變形方法如采用蛛網面積和關聯系數求靶心距[5-6];還有一類是采用向量的方法進行處理,這稱為混合屬性廣義灰靶決策方法[7-8]。廣義灰靶決策方法是基于傳統的灰靶決策方法,在遵循其基本原理不變的基礎上提出的一種方法,基本的計算過程與傳統方法有所不同[7-9]。由于混合屬性灰靶決策中涉及不確定性的屬性值,需要融入能夠測度這種不確定性的理論方法來進行方案的決策更具有理論意義和實際的應用價值。意大利統計學家Gini首次提出了不均等指數及其算法,稱為基尼指數(Gini index)。該指數是一個定量測定收入分配差異程度的指標[10]。隨著研究的深入,基尼指數已經不局限于度量收入分配的不均衡,而有了更深入的改進和應用?;嵯禂涤性S多表現形式,近年來其重要的形式Gini-Simpson指數得到了重視和應用[11-13]。Gini-Simpson指數主要應用于生物多樣性的檢測等方面[11-12]。另外該方法在醫學病毒檢測方面的應用也獲得了理想的效果[14]。同時,Gini-Simpson指數還被用于不確定性的測度方面[15-17]。鑒于Gini-Simpson指數能夠測度信息的不確定性,所以可以將其用于涉及不確定數的混合屬性廣義灰靶決策中。

二、基本理論

(一)不確定數及區間數

由于客觀事物的復雜性和不確定性以及人類的知識局限性和認識能力的模糊性,人們對事物的認識常常具有不確定性,而描述這些事物特征的數據則稱為不確定數。在實際的應用中,由于測量、計算所帶來的數據誤差,以及信息不完全帶來的數據缺乏,表示特征行為的原始數據往往會是一個范圍,為此下面給出區間數及其拓展的n參數區間數(多參數區間數)的定義。

本文在不引起歧義的情況下,區間數有時也包含n參數區間數(多參數區間數),而本文所稱的不確定數主要指的是區間數及其拓展的多參數區間數。

(二)二元聯系數

定義2記R為實數域,稱A+Bi為二元聯系數,其中A,B∈R,i∈[-1,1],A表示確定的項,B表示不確定的項,i是一個變動的項,它的存在統一了不確定數的確定和不確定性。

(1)

(2)

(3)

(4)

v=min{η,θ}

(5)

圖1 確定-不確定空間

(三)Gini-Simpson指數

定義5Gini-Simpson指數。對于概率分布P=(p1,p2,…,pm),其Gini-Simpson指數定義為[12-13]:

(6)

其中pj為對應的某一變量的概率。

定義6綜合加權Gini-Simpson指數。設S=((x1,y1),(x2,y2),…,(xm,ym))Τ為在多屬性灰靶決策中某方案指標的(確定度,不確定度)二元組數向量,E=((p1,q1),(p2,q2),…,(pm,qm))T為靶心的(確定度,不確定度)二元組向量,且S和E已經過了規范化處理,其屬性權重向量為W=(w1,w2,…,wm)Τ,則其綜合加權Gini-Simpson指數為:

(7)

與式(6)不同,式(7)包含了針對各方案指標的(確定度,不確定度)二元組數與靶心指標的(確定度,不確定度)二元組數的相互聯系,即由式(7)中的|xj-pj|和|yj-qj|予以體現,表示的是各方案指標與靶心指標的相似性程度。即改進后的綜合加權Gini-Simpson指數既體現各自指標的差異又反映了與靶心指標的相似性。

三、基于Gini-Simpson指數的混合屬性廣義灰靶決策方法

(一)決策的基本原理

基于改進Gini-Simpson指數的指標及權重均為混合屬性的廣義灰靶決策方法,其基本原理是:首先,將決策方案的各指標均轉換為可以統一度量的二元聯系數;其次,將各指標的二元聯系數分解為(確定,不確定)二元組數,并據此求出各屬性靶心指標的(確定,不確定)二元組數;然后,對方案指標和靶心指標的(確定度,不確定度)二元組數進行規范化處理,采用權重函數將各混合屬性指標權重確定化;最后,求得各方案的綜合加權Gini-Simpson指數,以其值越小方案越優。

該決策方法有如下關鍵點:一是采用二元聯系數作為基本的工具,將各類不同的數據如實數和區間數(包括多參數區間數)等統一轉換為包含了確定和不確定性的二元聯系數便于隨后的統一處理;二是將靶心指標與對應的各方案指標歸一化后的(確定度,不確定度)二元組數建立聯系,此處是確定靶心指標與對應的各方案指標接近性或同一性的重要依據;三是構造混合屬性指標權重確定化方法,將不確定性混合指標權重確定化。

(二)基本決策要素的處理

設有方案集T={T1,T2,…,Tn},屬性集A={A1,A2,…,Am},則方案Ts在屬性At下的指標值記為vst(s=1,2,…,n;t=1,2,…,m),其屬性權重向量為W=(w1,w2,…,wm)T。

1.方案指標均轉化為二元聯系數

采用式(1)~(5)將不同類型的數據轉換為二元A+Bi的聯系數形式,其中實數認為是二元聯系數中的確定項為該數值本身,不確定項為0,即為A+0i的形式。設轉化后的各指標聯系數為Vst=Ast+Bsti(s=1,2,…,n;t=1,2,…,m)。

2.各指標屬性的靶心指標二元組數的獲取

(8)

式(8)為求某一指標屬性靶心的(確定,不確定)二元組數,注意此處所求出的(確定,不確定)二元組數為未事先進行規范化的二元組數。當其為正向指標時,分別取該屬性下的最大確定項及最小的不確定項為該屬性下的靶心二元組數;當其為逆向指標時,分別取該屬性下的最小確定項及最小不確定項為該屬性下的靶心二元組數。

3.各決策方案指標值的歸一化處理

已得到各屬性下各方案的指標聯系數Vst(s=1,2,…,n;t=1,2,…,m)及靶心的指標聯系數Vct(c=n+1;t=1,2,…,m),則可以將其表示為由確定度和不確定度組成的二元組數向量。

(9)

式(9)中ast,bst分別代表對應的某一屬性下各指標標準化后的二元聯系數的確定度和不確定度。為此,可以組成各方案的二元組數向量為((as1,bs1),(as2,bs2),…,(asm,bsm))T。但此處需要說明的是針對實數的情況,由于不確定性部分為0,所以首先不能對其進行規范化處理,否則某一屬性下的實數值的確定性部分會全部相同,導致計算過程出現錯誤。

前面所求出的各方案的指標向量與靶心指標向量的(確定度,不確定度)二元組數是不同的,屬性之間不具有可比性,因此這里需要針對各個屬性下的(確定度,不確定度)二元組數中的元素ast和bst進行歸一化,計算見式(10)。

s=1,2,…,n;t=1,2,…,m

(10)

4.混合屬性指標權重的確定化方法

混合屬性指標權重值wt(t=1,2,…,m)包含了不確定性的內容,其可以為實數或不確定數,當其取值為不確定數時,可為區間數、3參數區間數或者4參數區間數形式,即有:

(11)

此時一般有下面的關系式成立:

(12)

指標權重為混合屬性值時確定化的步驟如下:

(1)將各屬性權重值轉化為二元聯系數

首先采用式(2)~(5)計算各類型權重值的基本參數包括均值、標準差以及極差值。然后將各類型數據表示的權重轉化為二元聯系數的形式見式(1),并且分別組成(確定,不確定)二元組數。以二元組數構成的權重向量為((a1,b1),(a2,b2),…,(am,bm))Τ。

(2)求權重(確定,不確定)二元組數的基準值

根據權重的(確定,不確定)二元組數,求出各二元組數中確定項的最大值和不確定項的最小值,即采用式(13)。

w0=(max{aj},min{bj}),j=1,2,…,m

(13)

由式(13)可以得到權重確定的基準二元組數為(amax,bmin),amax和bmin分別代表選出的(確定,不確定)二元組數中,確定性最大的項及不確定性最小的項。值得注意的是此處的bmin為除0以外的其它的不確定項的最小值。

(3)構造不確定性權重確定化的函數

不確定性權重確定化既要包含確定性因素對權重的影響,也要考慮不確定性部分對權重的影響,其權重函數見式(14)。

j=1,2,…,m

(14)

其中,αj為求權重wj時(確定,不確定)二元組數中確定項所貢獻的比例;βj為不確定項所貢獻的比例;bmin為除0以外最小的不確定項的取值。公式(14)表示,當bj≠0時,某指標確定性的權重與其(確定,不確定)二元組數中確定性部分和不確定性部分相關;當若權重指標(確定,不確定)二元組數為(aj,0)的形式時則wj只取決于確定性部分。

式(14)中,雖然αj的取值可以根據決策者的偏好來決定,但考慮到不確定數自身所包含的信息,所以對式(14)進行參數的賦值修正見式(15)。

wj=

j=1,2,…,m

(15)

(4)擬采用權重的歸一化處理

步驟(3)所求出的各指標屬性的權重值wj未經規范化,與通常意義上的各指標屬性權重值的和為1有所差異。為此,對步驟(3)求出的權重數據參考式(10)進行線性歸一化處理,得到通常意義下的權重值。

(三)決策步驟

基于改進的綜合加權Gini-Simpson指數的混合屬性廣義灰靶決策方法決策步驟如下:

(1)所有方案指標依據式(1)~(5)轉化為二元聯系數,并分別組成為(確定,不確定)二元組數。

(2)采用式(8)求各屬性下的靶心指標的(確定,不確定)二元組數。

(3)將各指標及靶心的(確定,不確定)二元組數運用式(9)進行標準化,然后對在各屬性下的(確定度,不確定度)二元組數采用式(10)進行線性歸一化處理。

(4)采用式(13)及(15)獲得各決策方案指標屬性的確定性權重。

(5)采用式(7)求得各方案的綜合加權Gini-Simpson指數,根據所獲得的Gini-Simpson指數對各決策方案進行決策,以其值越小方案越優。

四、案例分析

(一)數據來源

對戰術導彈進行評估,采用6個指標分別是命中精度(km)、彈頭載荷(kg)、機動性能(km·h-1)、價格(106g)、可靠性和可維護性,分別用A1~A6表示[7]。其中A1和A4為成本型指標,其余為效益型指標。其中各個指標的權重為W=([0.16 0.18

0.2],[0.18 0.2 0.22],0.1,[0.18 0.2 0.22

0.24],[0.14 0.18],[0.12 0.16])。4個方案分別用T1~T4表示,數據見表1所示。

表1 各方案的指標值

(二)決策過程

(1)計算決策方案指標的二元聯系數參數。由表1中數據采用式(1)~(5)可以求出各指標的用于二元聯系數計算的參數見表2。

表2 各方案指標參數的均值、標準差和最大偏差

注:表中的“a/b/c代表“均值/標準差/最大偏差”。

(2)將所有方案的指標均轉化為二元聯系數。根據式(1)~(5),基于表2數據將表1所示的各指標值轉化為聯系數的形式見表3。然后對表3的二元聯系數形式轉化為(確定,不確定)二元組數的形式,見表4所示。

表3 轉化后的各指標二元聯系數

表4 轉化后的各指標二元組數

(3)求各指標屬性靶心的二元組數。采用式(8)求得各屬性的靶心的二元組數向量為:((1.8,0),(540,0),(55.5,0.5),(4.7,0.5),(0.7,0.1),(0.9,0.1))。

(4)對各方案及靶心確定度及不確定度二元組數進行規范化。首先對表4的各方案指標及靶心指標二元組數采用式(9)進行規范化,然后采用式(10)再對其二元組數進行歸一化處理后見表5。

表5 各方案及靶心的規范化二元組數

(5)不確定性權重的確定化。已經給定各個指標的混合屬性權重W=([0.16 0.18 0.2],[0.18 0.2 0.22],0.1,[0.18 0.2 0.22 0.24],[0.14 0.18],[0.12 0.16]),其中以不確定數表示的權重數據的參數下限值為小于或等于1,而上限值為大于或等于1。首先,采用式(1)~(5)計算各個混合數據類型權重的參數見表6;其次,將各權重表示為二元聯系數向量的形式見表7。

表6 所有指標權重參數的均值、標準差和最大偏差

表7 指標權重的二元聯系數

采用式(13)計算得到權重(確定,不確定)二元組數的基準二元組數為(0.21,0.02)。然后采用式(15)計算得到確定化的權重為(2.644 2,2.849 5,1.609 9,2.962 7,2.463 0,2.312 6)。最后進行線性歸一化后得到的權重為W=(0.178 0,0.192 0,0.108 5,0.199 6,0.166 0,0.155 8)。

(6)求各方案與靶心綜合加權Gini-Simpson指數。給定確定化后的權重W=(0.178 0,0.192 0,0.108 5,0.199 6,0.166 0,0.155 8),采用式(7)計算得到各方案的綜合加權Gini-Simpson指數為ICWGS=(0.006 0,0.037 8,0.011 8,0.024 7)。根據綜合加權Gini-Simpson指數越小越優的決策原則,可以得到各方案的優劣排序為T1?T3?T4?T2。

(三)分析討論

為了說明該方法的可行性和有效性,此處與Ma的以向量接近度為決策依據的方法進行對比[7],同樣采用權重W=(0.178 0,0.192 0,0.108 5,0.199 6,0.166 0,0.155 8)時,可得到各方案綜合加權的接近度為:ICWP=(0.195 5,0.303 0,0.227 0,0.274 4)。根據綜合接近度越小方案越優的原則,可以得到各決策方案的排序為:T1?T3?T4?T2。表8為兩種不同方法計算結果的對比。

表8 兩種決策方法的計算結果對比

以上兩種不同方法決策結果的對比分析,說明所提出的決策方法決策結果與以向量接近度為依據的方法相比決策結果完全一致,決策的效果較好。兩種決策方法的相同點為:均是將各類不同的數據統一轉化為包含確定和不確定性的可統一處理的二元聯系數,即二元聯系數為各類不同數據統一轉化的工具。兩種決策方法的不同點為:本文的方法是采用基于改進綜合加權Gini-Simpson 指數的方法作為決策的依據,是從方案的不確定性度量的視角進行決策;而文獻[7]中的方法則是采用以向量為基礎的接近度為基礎作為決策的依據,是從方案的向量接近性或相似性視角進行決策。

總之,案例分析的結果表明,本文的方法與已有的以向量接近度為基礎的方法相比決策結果符合性很好。不同于以向量的接近性或相似性為視角的混合屬性廣義灰靶決策方法的決策思路,該方法解決問題的視角是以方案的不確定性度量為基礎的。

猜你喜歡
組數靶心權重
正中靶心
權重望寡:如何化解低地位領導的補償性辱虐管理行為?*
找準演講稿的三個靶心
權重常思“浮名輕”
正中靶心的秘密
為黨督政勤履職 代民行權重擔當
權重漲個股跌 持有白馬藍籌
游樂場(下)
小組合作學習有效性的實踐與探究
論高三體育考生訓練中的力量訓練
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合