?

基于聚類分析算法的縣域碳排放審計預警模型構建

2024-04-28 09:19蘇澤順王婷
財務管理研究 2024年3期
關鍵詞:碳排放聚類分析福建省

蘇澤順 王婷

摘要:在促進“雙碳”目標及縣域經濟高質量發展背景下,基于K-means聚類分析算法,構建一個有效的碳排放審計預警模型,以應對縣域碳排放審計問題。以福建省為例,在對2020年各縣域的碳排放情況及宏觀經濟水平指標分別進行聚類分組的基礎上,通過同組T檢驗找到疑似碳排放風險縣,進而提請審計師關注。相較于傳統審計方法,該模型能夠對縣域碳排放情況進行較為精準的審計。建議完善縣域碳排放數據監測體系,加強數據管理,培養復合型審計人才,通過持續改進更為科學、有效的大數據審計模型,保障碳排放的合規性。

關鍵詞:聚類分析;碳排放;碳審計;福建省

0引言

2022 年,黨的二十大進一步強調了“推動綠色發展,促進人與自然和諧共生”的理念。在發展低碳經濟大背景下,縣域碳排放情況成為衡量縣域經濟低碳發展的重要指標[1]。目前,福建省已有10個區縣的生產總值突破千億元大關,但高資源投入驅動經濟增長的現象依然比較普遍。為積極響應綠色低碳政策,打擊碳排放數據造假問題,促進縣域經濟的綠色發展,碳排放審計提供了一套切實可行的監督約束機制。

本文基于機器學習中無監督學習方法——K-means聚類算法,以福建省縣域為例,構建碳排放審計預警模型,通過識別偏離的異常點及同組T檢驗,判定該縣域是否存在碳排放風險,并針對數據管理及審計人員專業能力等提出保障措施,確保預警模型能夠行之有效。本文采用大數據審計思維,實現了對縣域碳排放審計疑點的精準定位,提高了審計效率。

1文獻綜述

隨著全球對氣候變化的逐漸重視,各國學者在碳排放問題上的研究也日益深入,無論是在視角、內容、理論上還是在方法上,都奠定了良好的研究基礎,研究尺度涵蓋了國家、市域等多個層面及諸多行業。

在碳排放強度測算方面,Chen等[2]基于PSO-BP算法等創新開發新模型,得到中國30個省份能源相關的碳排放量及陸地植被固碳量。胡彥勇等[3]構建了煤炭資源從開發到利用階段的碳排放估算模型。許向陽和胡佳男[4]在STIRPAT模型的基礎上,采用情景分析法,設置13種情景,對造紙行業碳峰值進行預測。韓楠和羅新宇[5]構建了碳排放系統動力學模型,模擬預測了華北地區3座城市的碳達峰時間、峰值及減排潛力。

在碳審計方面,呂伶俐[6]研究了“雙碳”目標下碳審計的發展現狀及改進策略。李兆東和李蘿宇[7]認為,云計算可以成為碳審計主體協同的技術支撐,進而構建了基于云計算的碳審計主體協同框架。頡茂華等[8]對我國碳會計未來發展進行規劃,對碳會計現階段面臨的問題進行深入分析并提出了相應建議。

在大數據審計方面,徐曉敏[9]基于大數據審計融合性課程的現狀及問題,建立了大數據審計融合性課程的新框架,并提出了優化設計方案??峦詈腿~戰備[10]結合具體案例進行深入分析,就如何完善大數據審計應用、識別涉農領域財務舞弊風險提出對策建議。張韜[11]運用系統分析、關聯分析等研究方法,總結提煉出涉農領域專項審計的疑點分析經驗及具體步驟和基本方法,并在此基礎上建立了涉農領域大數據審計分析流程圖。

總體來看,現有研究取得了較為豐碩的成果,但是對于縣級碳排放量及風險管理、疑點審計等還涉及較少,在大數據方法運用、地理覆蓋范圍等方面也存在一定的局限性。本文以縣域為研究單元,創新性地運用K-means聚類分析算法并與縣域碳排放審計相結合,豐富了現有碳排放、碳審計、大數據審計等研究的視角與方法,是對大數據技術運用場景的拓展,為縣域碳審計提供了新思路。

2福建省縣域碳排放現狀分析

近年來,福建省縣域經濟發展水平與碳排放量不斷提高,地區生產總值于2020年實現43 903.89億元,同比增長3.3%。2016—2020年5年,福建省縣域碳排放總量分別為2.25億t、2.30億t、2.35億t、2.40億t、2.45億t,整體呈穩步上升趨勢,但經濟發展存在省內東西部嚴重不平衡的現象,呈“子彈形”發展態勢[12]。

福建省縣域的能源結構仍以煤炭、石油和天然氣等化石燃料為主導。這些燃料的燃燒會釋放大量二氧化碳,成為碳排放的重要來源。福建省縣域尚未實現從傳統能源向清潔能源轉型的平衡。

福建省縣域的工業生產活動是重要的碳排放來源。特別是一些高耗能、高排放的傳統工業部門,如鋼鐵、水泥、化工等,在生產過程中產生了大量的二氧化碳及其他溫室氣體。農業活動中的農作物種植、化肥施用和農藥使用,以及畜禽養殖中的飼料種植和動物糞便等,都會產生甲烷和二氧化碳等溫室氣體。此外,森林砍伐、土地利用變化等也對碳排放產生影響。

隨著經濟發展和城市化進程的加快,福建省縣域的交通運輸需求不斷增加,導致汽車尾氣排放增加。同時,航空和航運等交通方式也產生了大量碳排放,對碳足跡貢獻較大。福建省縣域的城市化進程帶來了人口密集和能源消耗增加等問題,城市建設、能源消耗及基礎設施建設和運營等都對碳排放產生了影響。

3福建省縣域碳排放審計預警模型總體設計

長期以來,傳統審計以賬項基礎審計和抽樣審計等方法為主。這些方法可能會遺漏重要事項,存在較大的隨機風險。比如,在進行縣域碳排放審計時,簡單按照碳排放量的大小順序來判斷風險異常點,或者隨機抽取某縣域進行審計,并沒有考慮宏觀經濟水平的影響,且人為因素影響較大。

區別于傳統審計,本文采用K-means聚類分析算法來構建縣域碳排放審計預警模型,具體流程設計見圖1。該聚類分析算法的優勢在于不需要預先標注訓練樣本,能夠自動從數據中發現潛在的異常值、離群點和噪聲,也可以處理大規模的數據集。該模型可以降低人為干擾,將相同或相似經濟水平縣域的碳排放異常值挑選出來,保證其客觀性及效率。

根據圖1,基于K-means聚類分析算法的縣域碳排放審計預警流程如下:

首先,進行數據收集、整理。目前本文采用的數據以人工收集為主,后繼隨著碳排放數據的規范與數據庫的完善,可以采用API(應用程序編程接口)、Web接口等方式取得。數據整理包括數據清洗(如缺失值處理等)、Z-score標準化處理等。

其次,將某年各縣域的碳排放量與碳排放強度進行K-means聚類,將游離于大部分數據的值定位為疑似碳排放風險縣域。K-means聚類過程為:預將數據分為K組,則隨機選取K個對象作為初始的聚類中心,然后分別計算每個樣本到聚類中心的距離,將對象分配到距離最近的聚類中;通過質心的多次迭代,直到質心收斂至0為止,最終聚類結束。

再次,對各縣域宏觀經濟指標進行K-means聚類分析,將各縣域按經濟水平情況劃分為若干組,同組內縣域表示擁有相同或相似的經濟水平。

最后,采用T檢驗判斷疑似碳排放風險縣域是否與同經濟水平組的縣域的碳排放量存在顯著差異,從而評估該縣域碳排放量是否出現異常,進行預警并提請審計師關注。

4基于聚類分析的福建省縣域碳排放審計預警模型

4.1數據收集及整理

本文主要基于2020年福建省縣域指標數據進行分析。凡是福建省內所涉及的包含縣和市轄區的地級市,將縣與地級市分割,并將每個地級市的市轄區分別作為1個縣級行政單元。因此,本文共涉及85個縣域研究單元。其中,縣域碳排放量主要參考Chen等[2]的研究,用二氧化碳排放量來衡量(該項公開數據僅到2017年,故2020年數據采用插值法確定);縣域碳排放強度用碳排放量與縣域GDP(國內生產總值) 的比值來衡量。地區生產總值、地方財政一般預算收入等其他宏觀經濟指標數據,通過查閱《福建統計年鑒》《中國縣域統計年鑒》及相關地市級統計年鑒等得到。變量及其定義見表1。

4.2變量描述性分析

各變量描述性統計結果見表2。由表2可知,碳排放量的最大值為1 358萬t,最小值為28萬t,平均值為288萬t??梢钥闯?,2020年福建省縣域整體碳排放量水平較低。碳排放強度的最大值為1 514.13,最小值為37.37,標準差為296.86,表明個別縣域的碳排放強度差異較大,可能存在較大的碳審計風險。造成此結果的原因可能是:經濟發達的縣多靠近省內大中型城市,能夠很好地接受來自這些中心城市的優勢輻射及經濟發展帶動,故碳排放量較大;而經濟后發縣多數分布在邊遠山區,大多工業基礎薄弱,遠離交通干道和中心城市,產業結構不合理,縣域財政收入微薄,其碳排放的增長速度便遠遠低于經濟強縣。

由表2可知,各項變量指標之間數量級相差較大。為了消除變量間的量綱關系,在聚類分析前,對以上數據進行Z-score標準化處理,以便預警模型的數據更加精確。

4.3福建省縣域碳排放情況聚類分析結果

本文以碳排放強度、碳排放量兩個變量來解釋福建省縣域碳排放情況。選用2020年數據進行K-means聚類,結果見圖2。其中,橫軸為經Z-score標準化處理后的碳排放強度,縱軸為經Z-score標準化處理后的碳排放量。由圖2可知,聚類分析將所有縣域分為4類,有6個縣被聚在第一類(預警類別),有49個縣被聚在第二類(無預警類別),有27個縣被聚在第三類(無預警類別),有3個縣被聚在第四類(預警類別)。由此可知,福清市、長樂區、惠安縣、晉江市、南安市、龍海市、同安區、漳浦縣、云霄縣與其他縣域差異較大,可能具有較大的碳排放異常風險。這些縣域占樣本總數的10.52%,需進一步進行同組T檢驗。

4.4異常值同組T檢驗結果分析

在2020年福建省縣域碳排放情況聚類結果分析的基礎上,將疑似風險縣域在宏觀經濟條件背景下做進一步的同組T檢驗。

第一,對各縣的宏觀經濟水平指標(包括地區生產總值、工業增加值、地方財政一般預算收入、第一產業比重、第二產業比重等)進行聚類,經過5次迭代后,聚類中心達到收斂,分為4組,結果見表3。其中,有33個縣被聚在第一類,組平均地區生產總值位于縣域前50%;有1個縣被聚在第二類,其地方財政一般預算收入和工業增加值位于縣域首位;有4個縣被聚在第三類,組平均地區生產總值最高,但組平均第一產業比重最低;有47個縣被聚在第四類,組平均第一產業比重位于縣域前50%。

第二,將2020年福建省縣域碳排放情況聚類分析篩選出的疑似風險縣域定為擬待審單位,用T檢驗判斷該被審計單位是否與相同經濟水平情況下組內其他縣域碳排放量存在顯著差異。被審計單位組內T檢驗結果見表4。從表4看,除了晉江市的差異性在0.1水平上顯著以外,其他各縣域的Sig.值均小于0.05,表示這些縣域的碳排放量與各自所屬組別內其他縣域的碳排放量有顯著差異,存在審計疑點。審計師應該進一步關注福清市、長樂區、惠安縣、晉江市、南安市、龍海市、同安區、漳浦縣、云霄縣碳排放量與其他縣域發生偏差的原因。

5結語

5.1研究結論

本文基于K-means聚類分析構建了縣域碳排放審計預警模型,以福建省為例,選取2020年各縣域的碳排放強度、碳排放量及宏觀經濟水平指標等作為研究數據,通過K-means聚類分析識別各縣域可能存在的碳排放風險異常點。經研究比對發現,2020年,福清市、長樂區、惠安縣、晉江市、南安市、龍海市、同安區、漳浦縣、云霄縣可能存在較大的碳排放風險,需引起審計師的關注。

本文的主要貢獻在于:通過聚類分析算法,成功劃分了福建省各縣域的碳排放群組,為更好地理解福建省縣域碳排放的空間分布規律及其與經濟發展的關系提供了一個新方向,同時促進了碳排放管理和環境監測技術的發展。該研究結果可為政府部門制定碳減排政策、優化經濟結構和引導企業發展提供參考依據,從而促進低碳經濟發展和產業可持續發展。

本文不足之處在于:所采用的是2020年數據,仍有一定的滯后性,對于未來趨勢的研究有所欠缺。雖然本文采用了聚類分析算法構建模型,但有可能存在其他更先進、有效的算法可以用于該領域的研究。另外,本文提出的政策建議還需要結合實際情況進行評估和驗證,以確保其可行性和可操作性。

5.2相關建議

一是建立完善的縣域碳排放數據監測體系。在碳排放審計預警模型實施過程中,輸出效果是否可靠取決于數據的真實性與全面性。因此,縣域數字化水平的提高是有必要的,而不能局限于省或地級市。建立縣域碳排放數據監測體系,包括建立碳排放數據采集、處理、分析和發布機制,以確保數據的準確性和及時性。

二是加強碳排放監督和評估。加強對縣域碳排放減排工作的監督和評估,定期對減排工作進行評估和總結,及時發現問題和不足,在基于大數據審計縣域是否存在異常點時,能根據分析結果,結合當地經濟特點,準確識別碳排放異常的縣域,為接下來的減排目標和計劃確定提供方向。

三是提升審計人員的專業能力,培養復合型審計人才。在傳統審計向大數據審計轉型的大趨勢下,審計人員應加強對大數據平臺的學習與應用,熟練掌握相關分析方法的原理和應用路徑,針對統計分析得出的異常點,能夠結合當地經濟發展現狀進行分析和排查、風險預警傳遞,并對預警模型進行相應的優化。

四是持續改進預警模型。在不斷研究和改進聚類分析算法、提升預警模型的識別能力和準確性的同時,可以嘗試引入其他數據挖掘算法,如神經網絡算法或支持向量機算法等,以增強模型的預測能力。除了考慮縣域的碳排放強度和一些相關宏觀數據,還可以考慮其他可能會對預警結果產生影響的外部因素,如國內環保政策的發展等。建議將預警模型的改進與實際調研結果相結合,通過實地調研獲取更多數據并驗證模型的預測效果,以便不斷完善和修正預警模型,為縣域碳排放審計提供更好的保障。

參考文獻

[1]余文夢,張婷婷,沈大軍.基于隨機森林模型的我國縣域碳排放強度格局與影響因素演進分析[J].中國環境科學,2022,42(6):2788-2798.

[2]CHEN J D,GAO M,CHENG S L,et al. County-level CO2 emissions and sequestration in China during 1997-2017[J/OL]. Scientific Data,2020,7(1):391[2023-09-01]. https://www.nature.com/articles/s41597-020-00736-3?utm_source=other&utm_medium=other&utm_content=null.

[3]胡彥勇,張瑞,郄曉彤,等.全生命周期下中國煤炭資源能源碳排放效率評價[J].中國環境科學,2022,42(6):2942-2954.

[4]許向陽,胡佳男.多情景下中國造紙行業碳排放峰值預測研究:基于可拓展的隨機性環境評估模型[J].林業經濟,2022,44(5):5-22.

[5]韓楠,羅新宇.多情景視角下京津冀碳排放達峰預測與減排潛力[J].自然資源學報,2022,37(5):1277-1288.

[6]呂伶俐.“雙碳”目標下碳審計的發展現狀及改進策略[J]. 財會月刊,2022(S1):3-7.

[7]李兆東,李蘿宇.基于云計算的碳審計主體協同研究[J].會計之友,2022(24): 58-63.

[8]頡茂華,李玲玉,李曉玲.中國碳會計:遠景戰略、現實挑戰與實現路徑[J].財會月刊,2022(17):73-81.

[9]徐曉敏.基于互聯網技術的大數據審計融合性課程設計[J]. 中國鄉鎮企業會計,2023(3):193-195.

[10]柯威宇,葉戰備.農林牧漁業大數據審計應用探究:基于獐子島和輝山乳業案例分析[J].財務管理研究,2023(3):23-30.

[11]張韜.涉農領域大數據審計分析實踐研究[D].遵義:遵義醫科大學,2022.

[12]李霽.福建省縣域經濟發展研究[D].南寧:廣西大學,2012.

收稿日期:2023-09-06

作者簡介:

蘇澤順,男,2000年生,本科在讀,主要研究方向:智能審計。

王婷,女,1984年生,碩士研究生,副教授,主要研究方向:大數據與會計。

猜你喜歡
碳排放聚類分析福建省
福建省“兩會”上的“她”聲音
第四屆福建省啟明兒童文學雙年榜揭榜
第三屆福建省啟明兒童文學雙年榜揭榜
福建省巾幗館開館
寧夏碳排放與經濟增長的脫鉤關系研究
農村居民家庭人均生活消費支出分析
重慶市碳排放現狀及低碳發展路徑分析
基于省會城市經濟發展程度的實證分析
基于聚類分析的互聯網廣告投放研究
碳排放、產業結構與經濟增長的關系研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合