?

大數據背景下基于機器學習的公司財務風險識別研究初探

2024-04-20 05:53李仕瑾
審計與理財 2024年3期
關鍵詞:大數據背景機器學習

李仕瑾

【摘要】傳統的財務風險識別主要依賴對財務報表的分析和判斷,但財務報表可能存在偽裝、欺詐等問題,這將導致分析結果存在偏差。本文基于機器學習算法,構建了以企業財務評價指標和非財務評價指標為維度的財務風險識別體系,并對這兩個維度所采用的預測模型進行了初步分析。

【關鍵詞】大數據背景;機器學習;財務風險識別

【基金項目】江西省教育廳科學技術研究項目“大數據背景下基于機器學習的企業財務風險識別研究”(GJJ2205225);江西省高等學校教學改革研究重點課題“基于CDIO理念的大數據與會計專業課程體系優化與實踐”(JXJG-22-53-2);江西省教育科學“十四五”規劃年度課題“崗課賽證融通背景下高職商科專業教學質量學生滿意度實證研究”(22GZQN62);江西交通職業技術學院教改課題“基于CDIO理念的“一異二型三化”會計專業課程教學體系改革研究(2022JG16)”。

一、引言

2015年,國務院印發了《促進大數據發展行動綱要》,明確了大數據的主要特征。同年,黨的十八屆中央委員會第五次全體會議將大數據戰略上升至國家戰略層面,提出了要實施“國家大數據戰略”。2021年,工業和信息化部在《“十四五”大數據產業發展規劃》中明確了新的歷史時期大數據及大數據相關產業的發展目標。目前,大數據及大數據技術已廣泛的應用到行業的方方面面,助力經濟社會發展。

隨著經濟全球化發展及我國經濟體制改革的深入,企業需要面臨更加復雜的市場環境。當前,中美貿易摩擦、匯率變動、物價變化等市場外部環境越來越復雜,這給企業的經營增加了許多不可控因素。如果企業的外部市場或政策出現異常變動,企業的內部投資和融資決策出現問題,將會導致企業出現財務風險。上市公司作為市場經濟的重要組成部分,其財務狀況和風險對投資者、股東、經理人員和其他利益相關者都密切相關。

傳統的財務風險識別主要依賴對財務報表的分析和判斷。但財務報表可能存在偽裝、欺詐等問題,這將導致分析結果存在偏差。因此,基于數據挖掘技術對上市公司的各類數據進行分析,在海量的財務數據中發現潛在的風險因素,提前預測財務分險,對上市公司、投資者、股東及證券監管部門均具有重要意義。

二、國內外研究現狀

國外關于財務風險的研究始于上世紀30年代,到目前已有90多年的歷史??v觀相關學者的研究成果,主要聚焦在了財務風險預警模型上。經文獻梳理,研究成果從最初的單一變量預警模型發展到多變量風險預警模型,基于人工智能的預警方法也在不斷完善與發展。Fiztpatrick(1932)提出了最早的單元風險預警模型,選取了債務保障率、資產收益率、資產負債率、資金安全率、安全邊際率等單一財務變量作為預警變量;Altman(1968)突破單一變量風險識別方法的局限,首次提出了Z-Score多元判別分析模型;Martin(1977)打破財務指標數據必須服從正態分布的假設,首次引入了多元邏輯(Logit)回歸模型;Odom等(1990),首次將神經網絡理論應用于財務風險預警研究。進入21世紀以后,隨著計算機技術術的發展,財務風險預警模型的構建也在不斷創新。VanGestel(2003)建立了LS-SVM模型識別財務危機;Zieba等(2016)將梯度提升決策樹應用于破產預測;Halteh&Kumar等(2018)將決策樹、隨機梯度增強和隨機森林應用于101家伊斯蘭上市銀行組成的數據集的金融困境預測。

相較于國外,國內關于財務風險預警的研究起步較晚。吳世農等(1986)最早開始國內的財務風險預警研究;陳靜(1999)通過27家被ST和正常公司的財務數據開展了單變量分析和多元判定,開創了我國學者對上市公司進行財務風險識別預警的先河;關欣等(2016)將邏輯回歸模型及BP神經網絡模型應于財務預警模的實證分析;王玉冬等(2018)采用粒子群算法進行了改進,建立PSO-BP和FOA-BP神經網絡模型;楊貴軍等(2022)利用Benford律和Myer指數,構造了BM-BP神經網絡財務風險預警模型。

結合國內外的研究現狀,關于財務風險預警,經歷了簡單的單元預警模型、多元判別模型、邏輯回歸模型向復雜的神經網絡模型、支持向量機模型和其他混合模型發展歷程,相關文獻的研究結果證明了機器學習算法在財務風險預警領域的適切性。

三、傳統的財務風險識別指標體系

早期的研究中,受數據獲取渠道及計算機技術等方面的條件制約,難于獲取海量的公司財務數據,也難以實現對大規模數據的分析處理。因此,在傳統的財務風險識別過程,一般選取與企業財務信息相關的盈利能力、償債能力、營運能力和發展能力等方面的指標進行模型構建,采用的模型主要有邏輯回歸模型、BP神經網絡模型、粒子群算法改進的神經網絡模型等。從目前的發展狀況來看,包含傳統財務指標體系的賬務風險識別模型的構建已相對完善。

四、大數據背景下財務風險識別指標體系構建

隨著云存儲、區塊鏈、計算機等技術的飛速發展,海量數據的存儲、管理和應用變成了可能。大數據及大數據處理相關技術的應用,拓寬了投資者獲取企業財務信息渠道,也使快速、準確地收集、整理和分析財務數據成為了可能。云計算、大型計算機服務器的算力指數級增加,這使得對大規模數據的分析與處理成為了可能。

企業的財務風險與企業的財務評價指標和非財務評價指標相關。傳統的財務風險識別只考慮企業的財務評價指標,但對上市公司而言,社會網絡輿情數據、股權結構、董事會結構、管理成本、審計意見等非財務評價指標也與企業的正常經營息息相關。非財務評價指標一般為文本型數據,具有難于量化的特點,而機器學習算法對文本、圖像都具有強大的處理能力。因此,應用機器學習算法,結合企業的非財務指標對風險識別模型進行改進,可以取得更好的風險識別效果。有鑒于此,筆者對傳統的財務風險識別模型進行改進,采用財務評價指標和非財務指標兩個維度構建大數據背景下的財務風險識別模型。具體構建中,財務評價指標主要選取盈利能力、償債能力、營運能力、發展能力、現金流量等幾個代表參數;非財務評價指標主要選取社會網絡輿情數據、股權結構、董事會結構、管理成本、管理層穩定性、審計意見等參數。按照指標屬性、指標維度及具體的指標選取值,模型結構如圖1所示。

五、財務評價指標及非財務評價預測模型選擇

大數據背景下財務風險識別指標體系由企業的財務評價指標和非財務評價指標兩部分組成。在風險模型構建時,財務評價指標采用的是財務報表中以數值形式出現的反應盈利能力、償債能力、營運能力、發展能力及現金流量數據;非財務評價指標采用的是反映企業的股權結構、董事會結構、客理成本、管理層穩定性、審計意見及與企業相關的網絡輿情數據,這類數據在企業年報中,經常以文本的形式出現。針對以上兩種不同的數據類開型,在模型構建的過程中,需要采用不能的預測模型進行數據處理。

決策樹模型、隨機森林模型、梯度提升決策樹模型等以樹模型為基礎的預測模型對數值型數據具有強大的處理能力,可以很好的解決分類和回歸問題。因此,在財務風險的預測過程中,對于公司財務報表中的數值型數據,可以采用決策樹模型進行預測。利用對照組和實驗組數據,結合Bagging以及Boosting提升算法,可以模擬現實中人類決策行為,通過優化決策樹,相當于提高了財務分析人員的決策能力,使模型對公司是否存在風險的判讀更加科學、準確。

機器學習中的卷積神經網絡和循環神經網絡可以很好的處理文本型數據。因此在財務風險預測過程中,對于非財務評價指標等文本型數據,采用神經網絡中的詞袋(Bag of Words)模型進行,通過對非財務評價指標的分析,對比正常公司的年報文本和存在財務風險公司的年報文本,深度挖掘文本型數據下隱藏的規律,進而判斷公司是否面臨財務風險。

六、結束語

結合數值型數據,可以構建以財務報表為基礎,決策樹為主要算法的風險預測模型;結合文本型數據,可以構建以上市公司年度報告文本為基礎,深度神經網絡為算法的風險預測模型。綜合上市公司的財務報表數據及年報文本數據,將兩種模型進行集成學習,便可以獲得一個同時接收財務報表數據和文本數據的財務風險預測模型。

········參考文獻·····················

[1]王賀敏,劉明瑋.大數據在財務風險識別與管控中的應用探析[J].中國注冊會計師,2022,(10):107-112.

[2]吳世農,黃世忠.企業破產的分析指標和預測模型[J].中國經濟問題,1987.6(6):20-28.

[3]陳靜.上市公司財務惡化預測的實證分析[J].會計研究,1999,4(9):31-38.

[4]關欣,王征.基于Logistic回歸模型和BP神經網絡的財務預警模型比較[J].統計與決策,2016,17(49):179-181.

[5]楊貴軍,杜飛,賈曉磊.基于首末位質量因子的BP神經網絡財務風險預警模型[J].統計與決策,2022,38(3):166-171.

(作者單位:江西交通職業技術學院運輸管理學院)

猜你喜歡
大數據背景機器學習
大數據應用技術專業人才技能探究
淺析大數據背景下財務工作問題與創新
基于詞典與機器學習的中文微博情感分析
大數據背景下企業績效管理的探討
大數據背景下石油科技翻譯
大數據背景下石油科技翻譯
基于網絡搜索數據的平遙旅游客流量預測分析
前綴字母為特征在維吾爾語文本情感分類中的研究
基于支持向量機的金融數據分析研究
機器學習理論在高中自主學習中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合