?

基于CHAID算法和貝葉斯網絡的基金風險預警研究

2016-12-17 15:41王玉斌劉建和施炳寬張淑
會計之友 2016年22期
關鍵詞:貝葉斯網絡風險預警決策樹

王玉斌+劉建和+施炳寬+張淑

【摘 要】 隨著基金業的迅猛發展,其風險日益突出,對基金業實行適當的風險監管顯得尤為重要,這其中離不開風險預警模型的參與。研究發現目前金融預警模型主要針對宏觀金融風險、銀行業風險和企業財務風險等,對基金業風險預警模型的研究存在不足。同時,金融時間序列尖峰厚尾的特征也并不完全滿足傳統的參數檢驗方法。正是如此,文章采用CHAID和貝葉斯網絡方法構建基金的風險預警模型,在CHAID的基金風險預警模型中,預測準確率約為0.766;而在貝葉斯網絡的基金風險預警模型中,最優的預測準確率約為0.841。研究發現,不同的基金風險預警模型檢出準確率會有所差別。因此,綜合運用各個基金預警模型并進行定期調整是非常必要的。

【關鍵詞】 基金; 風險預警; 決策樹; CHAID算法; 貝葉斯網絡

【中圖分類號】 F830 【文獻標識碼】 A 【文章編號】 1004-5937(2016)22-0098-05

一、引言

金融市場的風險預警是在風險到來的時候,能夠預示市場參與者即將面臨的損失,使其做好防范,盡可能地降低風險造成的損失。

基金行業作為資本市場的重要組成部分,在2015年得到爆發式的增長。截至2015年12月底,A股公募基金規模達到8.4萬億元,較2014年末增加3.9萬億元,年度增幅達85.27%,其中貨幣基金資產規模達到44 443.4億元,突破4萬億元,創出歷史新高;私募基金資產管理規模達到4.05萬億元,較2014年末增長90%,已登記備案的私募基金有24 054只,近上年底的3.8倍①。然而,基金的風險會伴隨其設立和運作而產生,如2015年6月25日的國富健康優質生活基金巨額贖回事件,受兩家保險機構同時巨額贖回的影響,國富健康優質生活基金第二日凈值跌幅高達16.07%。在下跌行情中,由于現金頭寸的缺乏,基金經理會考慮賣出證券,而由此造成的證券價格下跌風險卻全部由剩余的證券持有者承擔②。因此,為保護投資者利益、保證市場的公正、推動基金業的規范發展,有必要對基金業實行適當的風險監管,這其中離不開風險預警模型的參與。

但是一方面,現有金融體系預警機制方面的研究成果往往主要針對宏觀金融風險、銀行業風險和企業財務風險等[ 1-2 ],對基金業的風險預警研究存在明顯不足;另一方面,以往的金融預警模型多使用判別分析法[ 3-5 ]和邏輯回歸法[ 6-10 ]等,這些方法要求樣本數據滿足正態分布、方差齊性等。而金融時間序列數據存在尖峰厚尾、異方差、非對稱性等特點,不能很好地滿足參數檢驗法的條件。正是如此,本文將利用開放式基金數據,建立非參數檢驗動態風險預警模型,并進行實證檢驗。本文結構安排如下:第二部分對現有金融風險預警研究的研究成果進行回顧,歸納這些研究成果的方法和特征,并提出本文的模型和方法;第三部分是實證研究,這一部分首先對實證數據進行了處理,其次構建了基金風險預警模型,實證研究得到模型的預測準確率;第四部分是本文的結論。

二、文獻回顧

金融體系預警機制方面的研究成果主要集中在宏觀金融風險、銀行業風險和企業財務風險等方面,且采取的建模方法也不盡相同,因此本文按不同的研究方法對文獻研究成果進行分類和總結。

(一)參數檢驗法

參數檢驗法主要包括判別分析法和回歸分析法。判別分析法相對比較成熟,可以區分為單變量模型和多變量模型。Altman(1968)提出了一個包含5個變量的Z分數值模型,兩年內破產可能性預測的有效性達到72%;而后Altman(1977)在Z分數值模型的基礎上提出ZETA模型。吳世農和盧賢義(2001)也發現判別分析法可以對公司財務進行預警。

但判別分析法存在一些問題,如多變量判別分析法要求變量服從多元聯合正態分布和等協方差,這些在實證中很難得到滿足。因此,學者利用Logistic回歸和Probit回歸等回歸分析法來解決其存在的問題。

如Martin(1977)在預測銀行破產概率中發現Logistic模型較ZETA模型的預測能力好;Ohlson(1980)結合運用Logistic和Probit回歸分析,使預測準確率達到92%。國內一些學者也嘗試在財務風險、商業銀行風險和金融系統性風險等方面使用回歸分析法構建預警模型,包括多元的和混合的Logistic模型。

(二)非參數檢驗法

事實上,實際生活中相當多的時間序列數據存在尖峰厚尾、異方差、非對稱性等特點,并不能很好地滿足參數檢驗法的條件。因此除了判別分析法和回歸分析法之外,目前大量學者研究時利用神經網絡分析法、決策樹分析法、貝葉斯網絡等非參數檢驗法建模。

1.神經網絡(ANNs)

神經網絡模型從20世紀末起在金融市場用來風險預警。Coats and Fant(1992)[ 11 ]選取一個含有一定數量危機企業和相同數量正常企業的樣本,并采用神經網絡進行公司財務預警,指出其預警正確率較ZETA模型好。

國內學者對神經網絡模型在風險預警中的應用也進行了一系列研究,如基于小波神經網絡的上市公司財務危機預警[ 12 ]、基于神經網絡的金融風險預警[ 13 ],此外,還有基于遺傳算法優化神經網絡(Genetic Algorithm-Artificial Neural Network,GA-ANN)的中國金融安全預警系統構建[ 14 ]。

2.決策樹分析法

決策樹分析法有速度較快、準確率較高、生成較簡單等特點。目前已有學者基于決策樹分析法構建出頗具效果的公司財務預警模型[ 15 ],也有學者成功運用決策樹分析法構建了銀行風險預警系統[ 16 ]。

3.貝葉斯網絡

貝葉斯網絡是一種表示隨機變量相互聯系的圖形模式,其在不確定問題的智能化求解上得到了普遍運用③。薄純林和王宗軍運用貝葉斯網絡構建了包含多個角度的商業銀行風險預警模型[ 17 ];趙文平等用貝葉斯網絡研究了工業上市公司財務困境預警模型,其貝葉斯網絡模型具有較好的預警效果[ 18 ]。

用于構建預警模型的非參數檢驗法除了以上提及的三種方法之外,還有STV模型、FR概率回歸模型、KLR模型(信號法)等等,但成果不多。

綜合以上對風險預警模型的研究(表1),不難發現:在研究方法上,以往的預警模型多使用判別分析法或回歸分析法等,近年相關成果越來越集中到神經網絡、決策樹分析法和貝葉斯網絡;在研究對象上,以往的研究成果主要集中在宏觀金融體系、上市公司財務和商業銀行貸款等方面,而對基金業風險進行預警研究極少;在風險預警的準確率方面,目前在上市公司財務、宏觀金融體系和商業銀行等傳統領域風險預警準確率較高,普遍可達80%以上,但在其他領域準確率較低。參數檢驗法的準確率普遍較高,非參數檢驗法中神經網絡模型的應用沒有量化準確率,決策樹和貝葉斯方法在傳統領域的應用中準確率較高。因此,目前基金業風險預警研究成果的不足與基金業在證券市場的地位明顯不符,有必要對基金業的風險預警模型進行進一步的研究。同時,鑒于金融時間序列數據具有尖峰厚尾、異方差、非對稱性等并不符合正態分布的特點,有必要利用非參數檢驗方法對基金業風險預警模型進行檢驗。正是如此,受神經網絡方法缺乏量化準確率影響,本文將使用決策樹CHAID算法和貝葉斯網絡方法來驗證其在基金業風險預警模型建立中的有效性。

三、模型、方法和數據

(一)模型和方法

本文將使用兩種方法來構建基金業的風險預警模型,并檢驗這兩種方法在基金業風險預警中的有效性。

1.基于決策樹CHAID算法的預警模型

決策樹CHAID算法的流程如圖1所示。

2.貝葉斯網絡原理及算法

貝葉斯網絡跟統計相關,主要運用概率統計的原理來分類,比如預測某個數據在特定類別的可能性大小。其流程如圖2所示。

(二)樣本及風險預警指標選擇

1.樣本選取

本文選擇了開放式基金作為基金風險預警的檢驗對象。由于債券和貨幣的流動性較高和波動較小,債券型和貨幣市場基金的風險較小,而股票的流動性較低和波動較大,導致股票型和混合型基金的風險較大。此外,考慮到與基金業緊密聯系的A股市場在2014年下半年至2015年上半年的暴漲和2015年下半年的暴跌,導致這段時間的基金業數據波動較大,會對模型預警造成極大干擾,因此本文選擇的風險衡量指標結合現有的市場綜合評級,預測節點為2013年3月,且均以t-2年的值即t-2年④的指標數據來預測t年的開放式基金風險。預測指標如表2所示。樣本選取普通股票型基金和混合偏股型基金,總計290個基金;數據來源為同花順iFinD數據庫。再結合基金的外部評級和數據庫,對其經營效益和抵御風險等能力進行綜合評價,由此設定五個等級的評價標準,其中第五等級最優,第一等級最差。

2.風險預警指標體系

根據開放式基金的風險狀況、收益狀況和資產配置狀況等,本文參考張淑(2014)[ 19 ]的預測變量選取如表2所示指標。

其中,除X8是一個虛擬變量(1有效,0無效)外,均為連續變量。

四、計算結果

(一)CHAID算法的基金預警模型計算結果

通過運行CHAID模型,可得所有預測變量的重要性。如圖3所示,可以發現最重要的預測變量是年化收益率,其次是贖回率,而最不重要的是年化波動率和股票持倉比例。同時,訓練樣本可以得到基于CHAID決策樹的28條判別規則(具體判別規則略)??捎眠@些判別規則對樣本進行判別,若判別結果和初始樣本分類相同,為正確檢出;反之,則為錯誤檢出。檢測結果如表3所示,可以發現基于CHAID的開放式基金風險預警模型的檢出準確率為0.766。

(二)貝葉斯網絡的基金預警模型計算結果

本文選取三種貝葉斯方法來建模:樹擴展的貝葉斯網絡(TAN);具有馬爾可夫覆蓋結構的貝葉斯網絡(Markov);能選擇與目標變量有重大關聯的輸入,具有馬爾可夫覆蓋結構的貝葉斯網絡模型(Markov-FS)。運行三個模型,可得三種方法的網絡圖和條件概率。對結果分析發現,Markov和Markov-FS效果相對好一點,TAN的效果相對差一點。分析貝葉斯網絡模型的檢出準確率(表4)可以發現,Markov模型的檢出正確比為0.841,圖4為其貝葉斯網絡圖。

五、結論

本文構建了一個包含基金5方面指標的風險預警體系。一方面基于決策樹CHAID算法構建我國基金風險預警模型,樣本的預測準確率為0.766,基本能夠檢測出風險個案;另一方面在貝葉斯網絡的預警模型中,采用了TAN、Markov和Markov-FS三種方式建模,其中Markov模型的預測準確率最優,為0.841。

本文研究發現,不同的預警模型檢出準確率會有所差別。決策者在構建基金風險預警體系時,首先,要構建合適的風險預警機制,根據不同程度的風險等級及時調整監控力度和防范機制;其次,由于不同的預警模型檢出準確率存在差別,因此構建多個預警模型并綜合使用尤為重要。

【參考文獻】

[1] 孫靜芹.構建上市公司股權激勵制度的有效監管體系[J].會計之友,2006(25):80-81.

[2] 陳桂華.論外資銀行監管法律制度[J].會計之友,2008(14):12-14.

[3] ALTMAN E I. Financial ratios, discriminant analysis and the prediction of corporate bankruptcy[J]. Journal of Finance,1968,23(4):589-609.

[4] ALTMAN E I,HALDEMAN R G,NARAYANAN P. ZETATM analysis: a new model to identify bankruptcy risk of corporations[J]. Journal of Banking & Finance,1977(1):29-54.

[5] 吳世農,盧賢義.我國上市公司財務困境的預警模型研究[J].經濟研究,2001(6):46-55.

[6] MARTIN D. Early warning of bank failure: a logit regression approach[J].Journal of Banking and Finance,1977(3):249-276.

[7] OHLSON J A. Financial ratios and the probabilistic prediction of bankruptcy[J]. Journal of Accounting Research,1980,18(1):109-131.

[8] 于立勇,詹捷輝.基于Logistic回歸的違約概率預測研究[J].財經研究,2004(9):15-23.

[9] 鮮文鐸,向銳.基于混合Logit模型的財務困境預測研究[J].數量經濟技術經濟研究,2007(9):68-76.

[10] 郭棟.基于動態Logit模型的中國系統性金融危機預警研究[D].吉林大學,2013.

[11] COATS P K, FANT L F. A neural network approach to forecasting financial distress[J]. The Journal of Business Forecasting,1992,10(4):9-12.

[12] 姜金貴,梁靜國.基于小波神經網絡的上市公司財務風險預警研究[J].商業研究,2009(2):97-99.

[13] 樓文高,喬龍.基于神經網絡的金融風險預警模型及其實證研究[J].金融論壇,2011(11):52-61.

[14] 肖斌卿,楊旸,李心丹,等.基于GA-ANN的中國金融安全預警系統設計及實證分析[J].系統工程理論與實踐,2015(8):1929-1936.

[15] 謝潤椿.基于預警鏈和MKV選樣的財務風險預警研究及CHAID決策樹應用[D].暨南大學,2010.

[16] 李磊.決策樹模型在銀行風險預警系統中的應用[D].北京郵電大學,2007.

[17] 薄純林,王宗軍.基于貝葉斯網絡的商業銀行操作風險管理[J].金融理論與實踐,2008(1):43-46.

[18] 趙文平,王園園,張一楠,等.基于貝葉斯網絡的上市公司財務風險預警模型[J].財會月刊,2015(23):66-69.

[19] 張淑.逆周期監管視角下我國開放式基金風險預警模型研究[D].浙江財經大學,2014.

猜你喜歡
貝葉斯網絡風險預警決策樹
一種針對不均衡數據集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應用
以運營動態為載體,推動地市運監工作實用開展
無人機數據鏈測試與評估研究
基于貝葉斯網絡的流域內水文事件豐枯遭遇研究
高校財務風險預警指標的建立與應用研究
基于興趣預測和熱點分析的聯合推薦算法研究 
行政事業單位的內部控制問題以及解決策略思考
基于決策樹的出租車乘客出行目的識別
信息化手段實現檢驗檢疫工作風險管理的可行性探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合