?

基于知識圖譜的企業財務風險預警模型構建

2023-07-07 04:57汪新宇白咸芳
關鍵詞:知識圖譜

汪新宇 白咸芳

摘 要:風險預警具有事前控制的作用,預警效率的提高能夠有效提升應急管理效果。以風險預警模型為核心,圍繞風險監測與預警模型兩個方面,以知識圖譜為工具,構建基于數據驅動的企業財務風險預警模型。研究結果表明,構建的模型在預警效果上具有良好的表現,且能夠反映出各自變量對于因變量影響的重要程度,可用于指導實際的財務風險預警工作與應急預警機制的設計,為有效提高財務風險預警效率提供了新方法。

關鍵詞:風險預警模型;應急預警;知識圖譜;Logistic回歸

中圖分類號:F275 文獻標識碼:A DOI:10.7535/j.issn.1671-1653.2023.02.004

Construction of Enterprise Financial Risk Early Warning

Model Based on Knowledge Graph

WANG Xinyu, BAI Xianfang

(School of Economics and Management, Shenyang University of Chemical Technology, Shenyang 110142,China)

Abstract:Risk early warning is an important part of emergency management, which plays the function of beforehand control. Improving the efficiency of early warning can effectively promote emergency management effect. A data-driven enterprise financial risk early warning model was constructed by taking the risk early warning model as the core, revolving around two aspects of risk monitoring and early warning model, and using the existing knowledge graph as the tool. The results show that the constructed model has good performance in the early warning effect, and can reflect the importance of respective variables to the dependent variable. It can be used to guide the actual financial risk early warning work and the design of emergency early warning mechanism, which provides a new method to improve the efficiency of financial risk early warning effectively.

Keywords:risk warning model; emergency early warning; knowledge graph; Logistic regression

我國應急管理體系逐漸完善,目前的應急管理機制及應急管理預案對國內發生的重大突發事件發揮了較好的作用。應急預警是應急管理工作的第一重要任務,預警的及時性與準確性直接影響應急管理工作的整體效率,而預警效果直接取決于預警模型的設計。目前人工智能與大數據發展迅速,各種遙感衛星、傳感器等提供了豐富的數據源,因此提高數據整合能力,助力應急預警機制的設計,對完善我國應急管理體系具有重要意義。

知識圖譜于2012年由Google正式提出,它融合了多個學科的理論與方法,以符號形式描述物理世界中的概念及其相互關系,廣泛應用于智能搜索、深度問答及社交網絡等多個場景。當前,知識圖譜在金融、醫療、情報等領域發展相對較為成熟,但在應急管理領域,多是針對應急處置、應急知識圖譜構建的相關研究。杜志強等[1](P1344-1355)構建了自下向上和自上向下相結合的自然災害應急知識圖譜。李澤荃等[2](P94-100)構建了多源異構數據的應急知識圖譜,助力應急領域知識的形式化表達。劉永立等[3](P144-150)利用數據融合技術,構建了火災及耦合災害知識圖譜,并建立了多部門應急處置預案模型。邱芹軍等[4](P1875-1891)構建了面向災害應急響應的地質災害鏈知識圖譜。劉政昊等[5](P137-151)構建了面向應急管理的金融事理知識圖譜,用以輔助應急管理決策。已有研究缺少對基于知識圖譜構建預警機制的探討,

因此,本研究以風險預警模型為核心,圍繞風險監測與預警模型兩個方面,以知識圖譜為工具,構建基于數據驅動的風險預警模型,旨在從豐富的數據中獲取有效特征,實現傳統預警機制向數據驅動預警機制的轉變,以期為有效提高應急預警效率提供新方法。

一、知識圖譜的定義與架構

(一)定義

知識圖譜的主要目標是描述真實世界中存在的各種實體關系和概念,其基本組成單位是“實體-關系-實體”構成的三元組。在基本單位中,實體需要屬性值來標記,關系負責連接兩個實體,從而描述客觀世界存在的復雜關系(如圖1所示)。如果兩個節點之間存在關系,則兩者之間由有向邊來連接,節點稱之為實體,有向邊稱之為關系,屬性值是對實體所做的標記。

在邏輯上,知識圖譜可分為兩個層次:數據層和模式層[6](P23-27) ,數據層存儲真實的數據記錄,如圖1中的企業財務危機-財務報表;模式層建立在數據層之上,是知識圖譜的核心,數據經處理形成知識存儲于模式層并通過本體庫進行管理。

(二)整體架構

知識圖譜的構建過程主要包括數據獲取、知識抽取、知識融合、知識加工4個過程。

知識圖譜的構建始于原始數據的獲取和處理,數據是知識的來源,因此數據獲取與預處理是知識圖譜的基礎。依數據類型,原始數據可分為結構化、半結構化和非結構化三類數據,其中,結構化數據可直接用于知識圖譜的構建,而半結構化和非結構化數據需要進行信息抽取才能用于建立知識圖譜,來源不同的數據進行預處理的結果是形成一個統一的數據集,在此基礎上進行知識圖譜的構建[7](P1-13)。

知識抽取依據知識圖譜的基本組成單位可分為實體抽取、關系抽取和屬性抽取,它自動化地從半結構化和非結構化數據中進行實體、關系和屬性的抽取,并形成結構化信息。其中,實體抽取是從文本數據集中自動識別命名實體,因此也被稱為命名實體識別。關系抽取是為了得到語義信息,從相關語料中提取出實體之間的關聯關系,只有通過關系將實體聯系起來,才能形成網狀的知識結構。屬性抽取的目標是從不同的數據源中采集特定實體的屬性信息,采用數據挖掘的方法從文本中挖掘實體屬性和屬性值之間的關系模式,以實現屬性名與屬性值在文本中的定位[8](P46-54)。如圖1中的企業財務危機,其發生時間與損失報告是企業財務危機實體的屬性值。

知識融合是在知識抽取完成后,對數據進行的邏輯歸屬與錯誤、冗雜的過濾過程,對于結構化數據,主要通過知識合并的流程實現第三方庫的合并,以處理數據層與模式層的沖突;對于非結構化數據,主要通過實體鏈接實現實體消歧和共指消解,實體消歧解決同名實體產生歧義問題,共指消解解決多個指稱對應同一實體對象的問題[9](P459-473)。

知識加工過程包括本體構建、知識推理、質量評估和知識更新。本體構建是實體間并列關系的相似度計算、上下位關系的抽取以及本體的自動生成,實現數據歸類的過程;知識推理是通過基于邏輯規則、分布式表示以及機器學習等的知識推理,解決圖譜之間關系值的缺失問題;質量評估是通過設置置信度對知識的可信度進行定量化表達,以保障知識庫的可信度;知識更新是根據圖譜投入使用后產生的新數據對整體架構進行更新。其構建過程如圖2所示。

知識圖譜在構建完成后,與行業特有的應用形態、領域數據和業務場景相結合,即可助力某一特定領域的發展。本文的主要內容不涉及知識圖譜的具體構建,只將知識圖譜搜索結果應用于應急預警機制的設計過程。

(三)企業財務危機知識圖譜

企業財務危機知識圖譜是利用網絡搜索,結合定性分析,利用實體之間的關系和特征分析企業財務危機的詳細信息,用于企業財務危機指標體系的構建,為后續設計風險預警模型奠定基礎,同時根據應急預警模型實現預警信息的可視化,以此指導企業的財務應急預警工作,為企業發展提供保障。本文根據特定企業的財務現狀及影響因素,參考相關文獻,繪制出企業財務危機知識圖譜(如圖3所示)?;谠撝R圖譜,在進行企業財務危機分析時,可將圖譜呈現內容分為數值數據和非數值數據,數值數據可直接利用于模型的構建;非數值數據可結合特定行業要求與數值分析結果進行定性分析。

二、基于知識圖譜的企業財務風險預警模型

應急預警機制是包含多個系統和要素及其結構關系的運行機制。其社會學內涵可闡述為:在正視事物各個部分存在的前提下,

動員社會各種力量,利用有效的監控系統,對可能引起公共危機的多種風險因素和危機征兆進行監測,

并通過預判其危害程度進而發出正確的警報,同時在政府及其他部門的協同工作下,

協調系統各部分之間的關系以更好發揮應急預警作用的具體運行方式。因此,應急預警機制可以看作一個系統,即通過綜合考慮對研究目標產生影響的因素,能夠靈敏準確感知危險前兆的系統,以實現信息的超前反饋,為決策者及時采取措施奠定基礎。而整個應急預警機制包括對風險因素的監測、風險預警分析以及分析結果的傳達,其中風險預警模型在整個過程發揮核心作用。知識圖譜作為一種描述客觀世界復雜關系的技術,能夠對風險因素的監測與結果的可視化表達提供有力支撐,本文基于應急預警機制的主要內容與技術支撐設計了基于知識圖譜的風險預警框架,如圖4所示。知識圖譜要根據特定領域知識與行業要求構建,形成相應的數據層與模式層后再應用于風險監測系統與風險預警系統。

(一)風險監測系統指標選取

對風險因素的監測本質上是風險的識別過程,風險監測系統的主要任務是根據各種潛在的風險指標,構建風險監測指標體系,同時對數據進行相關處理后初步判斷研究目標的現狀,處理后的數據用于風險預警系統中的模型分析階段。在綜合考慮數據獲取難易程度、預警標志的設計、知識圖譜可視化結果等多個方面后,構建企業財務風險預警模型,進行應急預警機制的設計與實證分析。

姚爽等[10](P136-140)綜合選取了12個財務指標和7個非財務指標對企業的信用風險進行定量分析。關璧麟等[11](P82-89)選取了資產結構、財務結構等方面的29個指標進行了企業財務危機的信號與預測分析。參考相關文獻[12](P41-44),選取了14個財務指標作為監測指標,見表1。

(二)風險預警系統模型構建

1.預警標志確定

風險預警系統的主要任務是根據預警標志判定研究系統是否需要報警[13](P126-129)。對企業財務危機的界定方法眾多,比如依據企業股票是否為ST股票作為判定標準。本文將資產的經營性現金流量回報率是否為負作為判定企業財務危機的標準。資產的經營性現金流量回報率是經營活動產生的現金流量凈額與總資產的比值,其正負取決于企業經營性現金流量凈額的正負,若經營性現金流凈額為負,說明在報告期內經營活動的現金流出大于現金流入,企業面臨現金流動危機,因此該指標相對于ST股票更具合理性。

2.預警模型構建

在預警標志確定的基礎上,因變量Y為企業是否出現財務危機,當企業經營性現金流量凈額為正時,Y賦值為1,反之則賦值為0。由于Y為二值分類變量,因此選用二元Logistic回歸分析對該問題進行建模。上述風險監測系統確定的n(n=14)個指標為Y的影響因素,則令P表示在n個影響因子下企業出現財務危機的概率,則函數關系可記為P=P(Y=0|x1,x2,x3,…, x14)。

回歸模型為

將上式進行對數變換,得到以下線性模型:

Logistic P=β0+β1x1+β2x2+…+βnx14,

其中,回歸系數βi用來表示變量xi對企業財務危機出現的影響程度。

三、實例分析

(一)數據獲取與預處理

以上市企業為研究對象開展實證研究,選取2022年中國A股市場70家上市公司的財務數據,其中50家企業數據用于模型訓練,20家企業數據用于模型驗證。財務指標數據來源于新浪財經網的公開數據。以經營性現金流是否為負作為企業財務危機的判別標準,其中,正常企業23家,危機企業27家。預處理過程包括數據缺失值檢查與標準化處理,將有缺失值的企業刪除,并替換為無缺失值的其他企業;標準化處理是為了消除量綱影響。

(二)主成分分析

對選取的財務指標做主成分分析,以降低指標之間的相關性。在經過預處理之后,選用SPSS25軟件對歸一化后的數據進行主成分分析,得到KMO、巴特利特檢驗、評價指標的累積方差貢獻率和旋轉后的成分矩陣,見表2、表3和表4。

由表2,KMO取樣適切性量數為0.677>0.5,說明數據可以接受做因子分析,巴特利特球形度檢驗顯著性為0.000<0.05,說明該變量可以為因子分析提供合理基礎。

由表3可知,前5個公共因子可以解釋原始變量總方差的80.383%,說明這5個公因子對于總體有較好的代表性,因此本文從14個財務指標中提取出5個公共因子進行后續分析。

表4是使用凱撒正態化最大方差法得到的旋轉后的成分矩陣,根據各變量的因子載荷系數判斷因子歸類。公因子1由流動比率、速動比率、現金比率和資產負債率構成,反映企業的債務狀況;公因子2由成本費用利潤率、銷售凈利率和凈資產收益構成,表示企業的贏利能力;公因子3由主營業務收入增長率、凈利潤增長率和凈資產增長率構成,表示企業的成長能力;公因子4由經營現金凈流量對銷售收入比率、資產的經營現金流量回報率、經營現金凈流量對負債比率構成,表示企業的現金流量;公因子5由主營業務成本率構成,表示企業的付出成本。見表5。

由于旋轉后的成分矩陣并不是主成分載荷矩陣,因子在SPSS中根據公式(1)計算主成分載荷矩陣,并計算得出每個主成分的表達式。

Ui=Ai/√i ,(1)

其中,Ui是主成分載荷矩陣,Ai是因子載荷矩陣,λi是各個因子的特征值,Zxi是標準化后的變量。主成分表達式如下:

F1=-0.037 82Zx1-0.013 35Zx2-0.025 81Zx3-0.014 68Zx4+0.027 14Zx5-0.030 70Zx6+0.000 44Zx7+0.170 42Zx8+0.160 18Zx9+0.096 55Zx10-0.119 25Zx11+0.020 47Zx12+0.014 24Zx13+0.010 23Zx14。(2)

F2=0.007 37Zx1+0.156 48Zx2+0.326 57Zx3+0.159 88Zx4-0.075 97Zx5-0.065 2Zx6-

0.065 77Zx7-0.108 29Zx8-0.040 82Zx9-0.029 48Zx10-0.114 53Zx11+0.082 21Zx12-0.056 70Zx13-0.078 81Zx14。(3)

F3=0.001 83Zx1+0.005 49Zx2-0.172 97Zx3+0.029 29Zx4+0.474 05Zx5+0.396 27Zx6+0.297 43Zx7+0.175 71Zx8+0.033 86Zx9-0.107 07Zx10+0.170 22Zx11-0.018 30Zx12+0.043 01Zx13-0.169 30Zx14。(4)

F4=0.002 01Zx1+0.021 10Zx2-0.184 83Zx3-0.006 03Zx4-0.113 51Zx5-0.174 79Zx6+0.026 12Zx7-0.062 28Zx8-0.009 04Zx9+0.213 97Zx10-0.013 06Zx11+0.238 07Zx12+0.417 88Zx13+0.562 54Zx14。(5)

F5=0.636 66Zx1+0.067 24Zx2-0.119 77Zx3+0.029 42Zx4-0.419 19Zx5+0.222 73Zx6+0.148 13Zx7-0.213 27Zx8-0.114 52Zx9+0.217 47Zx10+0.180 70Zx11-0.514 79Zx12-0.027 32Zx13+0.121 87Zx14。(6)

(三)Logistic回歸分析

經過主成分分析后得到的5個公因子彼此之間是線性無關的,因此可以將數據用于后續的Logistic回歸分析,并另隨機選取10家上市公司財務指標進行驗證,訓練樣本與驗證樣本比例為8∶2。

使用主成分分析得到的5個公因子進行Logistic回歸,采用向前LR方法,因變量為企業是否出現財務危機,并將出現財務危機的公司內部編碼為0,正常公司內部編碼為1,P值大于0.1時退出模型,分析結果見6。

由表6,公因子F1,F2,F4,F5被納入模型中,且P值均小于0.05,

Y=-3.783F1+14.269F2+16.634F4-6.918F5-3.009。(7)

根據SPSS軟件分析結果,該風險預警模型包含4個變量,分別是債務狀況、盈利能力、現金流量和付出成本。其中,盈利能力和現金流量兩個變量回歸系數為正,說明企業的盈利能力和現金流量與該企業是否發生財務危機呈負相關,企業盈利能力越強,現金流量越大,說明企業財務狀況更為樂觀;債務狀況和付出成本回歸系數為負,說明企業資產結構不合理、成本控制不合理時,企業容易發生財務危機。

根據各變量對應的瓦爾德系數可知,現金流量與付出成本對于企業的財務危機具有更大的貢獻度,其次是盈利能力,最后是債務狀況。上述分析結果啟示企業財務管理者應著重關注公司的現金流量與成本控制,以預防財務危機的發生。

將驗證樣本數據代入該風險預警模型,并與訓練樣本正確率做對比。訓練樣本預測正確數為48,訓練樣本總數為50,訓練集準確率為96%;驗證樣本預測正確數為17,驗證樣本總數為20,驗證集準確率為85%,表明該模型在企業財務危機應急預警方面有較好的表現。

利用本文構建的應急預警機制優化企業財務危機的知識圖譜[14](P73-76)[15](P68-73),根據風險監測系統和風險預警系統的分析結果,在知識圖譜中添加實體關系,突出模型分析結果,展現危機預測方法,實現企業財務危機預警的可視化。如圖5所示,在應急預警機制的風險監測系統和風險預警系統下,重點關注企業的財務指標和財務報表,使用主成分分析與二元Logistic回歸分析的模型方法,得出不同關注程度的綜合財務指標,現金流量與付出成本為黃色標記,需重點關注。優化后的知識圖譜重點清晰,層次分明,對于企業財務危機預警工作具有實際參考意義。

四、結語

本文以當前應急預警機制中預警模型的設計為核心問題,借助知識圖譜的信息可視化,研究分析了預警的具體內容,包括風險監測系統和風險預警系統,構建了風險監測的指標體系與風險預警模型;以企業財務危機為例,利用SPSS數據分析軟件進行了實證分析。研究結論如下:訓練樣本模型準確度高達96%,驗證樣本模型準確率高達85%,這表明本文構建的應急預警模型在預警效果上表現良好。

知識圖譜為信息的獲取、管理與呈現提供了一種新的手段,為應急預警工作中信息收集與可視化呈現提供方便,在當前人工智能與大數據飛速發展的時代,基于數據驅動的模型構建能夠大幅度提高定量分析的準確度,為應急預警工作的決策提供可靠建議。另外,數據爆炸式增長不僅需要數據降維,更需要數據的篩選與系統呈現,應急預警工作需要更多先驗知識以構建模型,先驗知識越準確,維度越多,模型準確率越高,因此知識圖譜作為信息管理的新工具,既可以應用于信息搜集與分析階段,也可以應用于分析結果的呈現階段。

本文方法的有效性證明了知識圖譜應用于應急預警領域的可行性,為應急預警工作的信息搜集、模型構建與機制內容設計提供了新的方法,對于新時期完善應急管理體系具有重要意義。

本文不足之處包括知識圖譜應用與數據選取方面。首先是本文并未通過數據層與模式層的搭建來構建應急領域的知識圖譜,只是應用應急知識的搜索以知識圖譜的形式進行可視化展示,用以風險指標體系的構建;其次是以企業財務危機為例進行實證分析,在數據選取方面缺乏動態性,數據量相對較少,且未將非數值型數據納入數據選取范圍。

在后續研究中,可以就某一領域的應急管理工作構建應急預警知識圖譜,通過本文所述的構建過程,實現知識圖譜的自動化呈現。在數據選取方面,可嘗試動態的時序數據,同時擴大數據量與數據源進行模型訓練與驗證。

參考文獻:

[1]杜志強,李鈺,張葉廷,等.自然災害應急知識圖譜構建方法研究[J].武漢大學學報(信息科學版),2020(9).

[2]李澤荃,祁慧,曹家琳.多源異構數據應急知識圖譜構建與應用研究[J].華北科技學院學報,2020(6).

[3]劉永立,王海濤.基于知識圖譜的火災及耦合災害應急處置管理[J].煤礦安全,2022(9).

[4]邱芹軍, 吳亮, 馬凱, 等.面向災害應急響應的地質災害鏈知識圖譜構建方法[J].地球科學,2023(5).

[5]劉政昊,曾曦,張志劍.面向應急管理的金融突發事件事理知識圖譜構建與分析研究[J].信息資源管理學報,2022(3).

[6]張吉祥,張祥森,武長旭,等.知識圖譜構建技術綜述[J].計算機工程,2022(3).

[7]王毅,沈喆,姚毅凡,等.領域事件圖譜構建方法綜述[J].數據分析與知識發現,2020(10).

[8]姜磊,劉琦,趙肄江,等.面向知識圖譜的信息抽取技術綜述[J].計算機系統應用,2022(7).

[9]趙曉娟,賈焰,李愛平,等.多源知識融合技術研究綜述[J].云南大學學報(自然科學版),2020(3).

[10]姚爽,高江波,黃瑋強.制造業上市公司信用風險預警研究——基于FA-BA-BP神經網絡模型[J].財會通訊,2022(12).

[11]關璧麟,劉秋菊.制造業上市公司財務危機信號和預測分析——基于不同指標類型的比較研究[J].金融與經濟,2022(5).

[12]王紅偉.我國突發公共衛生事件應急管理體系建設研究[J].衛生經濟研究,2021(9).

[13]岳清春.協同應急視閾下的監測預警機制研究[J].消防科學與技術,2016(1).

[14]周苓羽.突發公共衛生事件預警機制研究[J].中國衛生法制,2021(5).

[15]范慧,范和生.疫情防控預警機制的社會脆弱性及優化策略——基于新冠肺炎疫情的分析[J].山東社會科學,2020(9).

收稿日期:20220922

基金項目:教育部產學合作項目(220505095305856)

作者簡介:汪新宇(1971-),男,遼寧開原人,沈陽化工大學經濟與管理學院教授,碩士,主要從事數據建模及優化研究;白咸芳(1998-),女,山東濟寧人,沈陽化工大學經濟與管理學院2021級管理科學與工程專業碩士研究生。

猜你喜歡
知識圖譜
國內圖書館嵌入式服務研究主題分析
國內外政府信息公開研究的脈絡、流派與趨勢
基于知識圖譜的產業集群創新績效可視化分析
基于知識圖譜的產業集群創新績效可視化分析
基于知識圖譜的智慧教育研究熱點與趨勢分析
從《ET&S》與《電化教育研究》對比分析中管窺教育技術發展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合