?

基于PCA-NBC算法的上市企業財務風險預警研究

2021-12-08 20:23陳啟城
中小企業管理與科技·中旬刊 2021年12期
關鍵詞:主成分分析

陳啟城

【摘 ?要】企業因經營和財務杠桿不合理導致資金鏈斷裂等情況時有發生,進而形成財務危機。財務風險預警模型能夠在財務風險轉化為危機前及時預警,幫助企業盡早應對?;诖?,論文以基于PCA-NBC模型的財務風險預警模型為研究內容,采用滬深主板A股上市企業的t-3年的財務報告為數據樣本,綜合主成分分析法與樸素貝葉斯的優勢構建了財務風險預警模型。通過測試數據集的檢驗,結果表明PCA-NBC算法具有較高的預測準確性,適用于制造業上市企業風險預警。

【Abstract】Unreasonable operating and financial leverage of enterprises often leads to broken capital chain, which leads to financial crisis. The financial risk early warning model can give early warning before financial risks turn into crises, and help enterprises to respond as soon as possible. Based on this, this paper takes the financial risk early warning model based on PCA-NBC model as the research content, takes the financial reports for the first three years of the t-year of A-share listed companies in Shanghai and Shenzhen main boards for the data samples, and constructs the financial risk early warning model by combining the advantages of principal component analysis and Naive Bayes. Through the test data set, the results show that PCA-NBC algorithm has high prediction accuracy and is suitable for risk warning of listed manufacturing enterprises.

【關鍵詞】主成分分析;樸素貝葉斯;財務風險預警

【Keywords】principal component analysis; Naive Bayes; financial risk early warning

【中圖分類號】F275 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻標志碼】A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號】1673-1069(2021)12-0085-03

1 引言

企業財務風險從開始到量變以及質變為危機是一個持續的過程,是各種不良因素不斷積累到最終的結果。因此,企業財務風險實際上是可以預先檢測,提前防治的,企業如果能在財務風險質變前及時發現并采取措施,就有機會挽回損失。

在經濟全球化的大背景以及近年經濟壓力的影響之下,我國企業各方面都面臨著嚴峻的挑戰,雖然我國市場經濟制度正在逐步完善,政府的監管力度也在加強,但是依然有許多企業面臨財務風險。尤其制造業企業作為我國國民經濟的重要組成部分,由于重資產、重設備的特點,比其他企業更有可能遇到流動資金短缺等財務風險,嚴重的可能出現資金斷裂,瀕臨破產[1]。要想在激烈的市場競爭中占有一席之地,如何對財務風險進行預警,在面對來自外部風險的同時,抵御自身風險,顯得尤為重要。因此,本文以制造業上市公司作為研究對象,通過建立客觀、適用的財務風險預警指標體系,結合主成分分析法與樸素貝葉斯構建了財務風險預警模型。實驗結果表明PCA-NBC財務風險預警模型預測準確率高,適用于制造業上市公司的財務風險預警,具有使用價值。

2 PCA-NBC財務風險預警模型構建

2.1 數學模型的選擇

2.1.1 主成分分析

主成分分析(Principal Component Analysis, PCA)是Hotelling在1933年提出的一種使用廣泛的數據降維方法。其原理是通過正交變換,用相同數量的線性不相關變量來替代原來可能存在線性相關的變量,并且變換前后信息沒有損失,這些變換后的變量又叫主成分。原始數據的信息量一般用方差來衡量,因此為了實現降維的目的,通常根據實際需要選取方差貢獻率最大的前幾個主成分來代替原始變量,在降維的同時盡可能保留原來變量的信息[2]。如果研究數據有m個樣本和n個維度的屬性,則可以用X來表示樣本的數據集,其中xij表示第i個樣本的第j個維度的屬性。然后可以通過公式求C=XTX得X的協方差矩陣,最后求出特征值與特征向量。

2.1.2 樸素貝葉斯

樸素貝葉斯法是貝葉斯分類中使用較為廣泛的算法,該算法本身來源于貝葉斯定理。

2.2 財務風險指標體系設計

企業財務風險狀況一般會體現在公司的財務指標中,財務指標體系的構建對提高最終財務風險預警模型的準確性十分關鍵。為保證財務風險指標的評估及選取的客觀與適用,需要理解指標的功能并遵循一定的選取原則。預警指標的功能涉及比較功能、反映功能、評價功能、預測功能[4]。除了這四大功能外,還應遵從重要性原則、系統性原則、可操作性原則、動態性原則、定性和定量相結合原則[5]。

2.3 PCA-NBC財務風險預警模型建立

上述2種方法(主成分分析和樸素貝葉斯)各有優勢,主成分分析能提取主要信息,降低數據維度,樸素貝葉斯模型有穩定的分類效率,對小規模的數據表現很好,能處理多分類任務。因此,綜合考慮2種方法的優勢建立組合預測模型,即主成分分析與樸素貝葉斯模型。

3 基于PCA-NBC的企業財務風險預警模型應用

3.1 數據來源及樣本選擇

為保證樣本數據的可靠性,論文將受到監管與審計的上市公司年度財務報告作為數據來源。同時因為滬深A股與B股企業區別較大,A股遵守的是國內會計與審計準則,B股遵守的則是國際會計與審計準則,2種不同準則下的各財務報表項目和財務指標會有較大的區別[6]。因此,本文將選用滬深A股主板上市的制造業企業進行分析。實驗數據取自國泰安CSMAR數據庫,將選取的樣本(ST、*ST樣本、非ST樣本)隨機劃分為訓練樣本集與測試樣本集2類,用訓練樣本集訓練財務風險預警模型并用測試樣本集測試模型。根據相關文獻發現,財務風險預警模型的構建以第t-1年與第t-2年有關數據進行研究雖然能有效提升財務風險預測準確率,但是對于企業財務風險預警來說過晚,意義不大[7]。因此,本文的財務風險預警模型研究將同樣遵守該原則,采用制造業上市企業t-3年年度財務報告作為實驗樣本。

3.2 數據收集與標準化處理

3.2.1 數據收集

數據樣本將選取2017年到2020年滬深A股上市的ST、*ST制造企業共45家,同時去除樣本中含有缺失值的5家制造業上市企業,剩下40個ST或*ST企業樣本。對于制造業非ST、非*ST企業樣本,主要的選擇依據是資產規模要相同或接近,共選取70個樣本,因此總共取得研究樣本110份。在模型訓練的過程中,針對預警模型的訓練與檢驗,將樣本按照比例劃分為訓練集和驗證集,采用隨機劃分的方式將80%左右的樣本分訓練樣本,20%樣本分為驗證樣本,循環10次。

3.2.2 標準化處理

本文首先使用Z分數對樣本進行標準化處理,確保所有數據不受量綱影響。針對前文初步選取的24項財務指標,需要進行顯著性檢驗。根據樣本是否服從正態分布,顯著性檢驗可以分為參數檢驗和非參數檢驗。為判斷樣本是否滿足正態分布,需要對樣本進行K-S(Kolmogorov-Smimov)檢驗。在SPSS26.0中對27個指標進行顯著性檢驗,結果如表1所示,在95%的置信水平下,初步選出的指標顯著性都小于0.05,即樣本來自的總體不服從正態分布。接下來進行Mann-Whitney U非參數檢驗。

在95%的置信水平下,26個指標中有17個指標通過了顯著性檢驗。為使預測更加客觀和有效,剔除了不符合Mann-Whitney U檢驗的財務指標。

3.3 基于PCA-NBC算法的財務風險預警分析

3.3.1 使用PCA提取主成分

①KMO與巴特利特球形檢驗。KMO與巴特利特球形是主成分分析法適用性的2種常見的檢驗方法[8]。KMO檢驗是用于比較變量間簡單相關系數和偏相關系數的指標,取值在0和1之間。KMO值越接近1,意味著變量間的相關性越強。檢驗結果KMO值為0.671,說明相關性較強,原有變量適合使用因子分析。巴特利特球形檢驗則需要通過顯著性檢驗,檢驗結果巴特利特的自由度為136,近似卡方為6073.419,顯著性水平為0.000,說明原變量具有相關性,適合使用因子分析。

②主成分選取。主成分分析的特征值與方差貢獻率如表2所示,從表中可以看到特征值大于1的主成分有6個,這6個主成分的累計貢獻率只有72.684%,一般來說,累計貢獻率至少要達到80%以上,才能較好地代替原來變量。因此本文提取前8個主成分代替原變量。

3.3.2 基于PCA-NBC算法的財務風險預測

將預處理后的樣本隨機劃分為80%的訓練樣本和20%的預測樣本,每次訓練與預測循環10次,結果取平均值。第一組實驗不采用主成分分析方法提取主成分,只使用處理后的數據來訓練樸素貝葉斯、二次判別分析、邏輯回歸KNN(K-Nearest Neighbor)算法、SVM(support vector machine)模型,并列出預測結果。第二組實驗,模型采用主成分分析提取前8個主成分,然后進行模型的訓練和預測,同樣列出預測結果,如表3、表4所示。

實驗結果表明,在沒有使用PCA處理數據時,樸素貝葉斯算法的預測準確率只有67.4%,要遠小于邏輯回歸、KNN和SVM算法,但是在使用PCA處理數據進行降維后,樸素貝葉斯算法的預測準確率取得了較大的提高,已經優于KNN算法,與邏輯回歸和SVM相當接近,已經具有實際的應用價值。

4 結語

本文以滬深A股的制造業上市企業為研究對象,選取的實驗數據樣本為t-3年上市公司年度財務報表。通過數據標準化處理、K-S檢驗、Mann-Whitney U檢驗,分析并構建了客觀、適合的財務指標體系。經過KMO與巴特利特球形檢驗確定主成分分析方法的適用性。最終使用主成分分析提取8個主成分,降低變量間相關性,提高了預測結果的準確性。

主成分分析與樸素貝葉斯的有效結合消除了樣本間的線性相關關系,既降低了數據維度,又提高了模型的泛化性能,對樣本數量偏少同時數據維度較高的財務數據有很好的適用性。最后,PCA-NBC上市公司財務風險預警模型預測準確率已經達到87.8%,超過二次判別分析和KNN模型,與PCA-邏輯回歸、PCA-SVM模型的預測準確率十分接近,適用于制造業上市企業的財務風險預警。

【參考文獻】

【1】任廣乾.企業財務危機的董事會決策行為因素及其預警[J].中南財經政法大學學報,2018(6):52-61.

【2】操瑋,李燦,朱衛東.多源信息融合視角下中小企業財務危機預警研究——基于集成學習的數據挖掘方法[J].財會通訊,2018(5):95-99+129.

【3】Yang, Chen, Wenping, et al. Using Bayesian model averaging to estimate terrestrial evapotranspiration in China[J]. Journal of Hydrology, 2015, 528:537-549.

【4】張亮,張玲玲,陳懿冰,等.基于信息融合的數據挖掘方法在公司財務預警中的應用[J].中國管理科學,2015,23(10):170-176.

【5】康洋平.企業財務指標體系構建及其運用[J].科技經濟導刊,2021,29(19):237-238.

【6】劉玉敏,劉莉,任廣乾.基于非財務指標的上市公司財務預警研究[J].商業研究,2016(10):87-92.

【7】石先兵.基于PCA-SVM的企業財務危機預警模型構建[J].財會通訊,2020(10):131-134.

【8】劉玉敏,申李瑩,任廣乾.基于PCA-PSO-SVM的上市公司財務危機預警[J].管理現代化,2017,37(3):12-14.

猜你喜歡
主成分分析
Categorizing Compiler Error Messages with Principal Component Analysis
關于AI上市公司發展水平評價
大學生創業自我效能感結構研究
塔里木河流域水資源承載力變化及其驅動力分析
我國上市商業銀行信貸資產證券化效應實證研究
基于NAR模型的上海市房產稅規模預測
主成分分析法在大學英語寫作評價中的應用
江蘇省客源市場影響因素研究
SPSS在環境地球化學中的應用
農村勞動力轉移影響因素與轉移數量的動態關系研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合