?

一種用于農產品供應鏈風險預測評估的貝葉斯決策樹算法模型

2024-03-18 08:20徐爽蔡鴻明趙林暢徐永馳
關鍵詞:供應鏈農產品評估

徐爽,蔡鴻明,趙林暢,徐永馳

1.貴陽學院 經管學院,貴陽 550005;2.上海交通大學 軟件學院,上海 201100;3.貴陽學院 數信學院,貴陽 550005;4.貴陽學院 電通學院,貴陽 550005

供應鏈的概念出現在20世紀下半葉,當時的消費品制造商、生產商和銷售商之間的合作得到了發展.21世紀世界經濟的全球化導致世界各地的聯系和服務范圍擴大.商品和服務的自由流動使得各國經濟突飛猛漲,主要表現在許多國家的國內生產總值增加,國民生活質量的提高和消費的增加,從而刺激了良好的經濟增長.供應鏈對于經濟的平穩運行至關重要[1].在現代經濟體系中,供應鏈發揮著重要的作用,是衡量現代經濟發展水平的一個重要指標.供應鏈中任何故障都會導致不利經濟的現象,例如交付貨物的技術質量下降、延遲或錯過交付.任何制約因素都會限制供應鏈,導致生產和分銷訂單的執行延遲和中斷.而供應鏈中斷則會導致關鍵商品短缺、價格上漲、工廠關閉、集裝箱卸載等負面影響.它們還影響著各種各樣的產品,從汽車和電子產品等昂貴商品到食品、藥品、石油和天然氣等必需品,這些都會對生活成本產生影響.如果供應鏈不間斷,同時原材料、組件、零件和其他配件的供應發展良好且順暢,最終產品的生產就會順利進行.什么時候會發生供應鏈中斷?如果政治、經濟和社會形勢等外部條件穩定,供應鏈中斷可能只是由于資金流動的損失或相對于供應的過度需求而導致鏈要素枯竭造成的.不穩定的經濟狀況,以及政治、社會和金融動蕩,可能導致供應鏈崩潰和全球經濟動蕩的出現[2].而今幾乎橫跨所有大陸的經濟聯系均可能由于這種現象而失去其順暢性,甚至瓦解.當供應鏈涉及跨越多個國家甚至大洲的大公司時,其相當于是一種大型物流事業.因此,對所有國家而言,供應、中間產品和生產投入的中斷意味著出口萎縮幅度大于進口,這會對其貿易平衡產生極其負面的影響.

目前,大數據和機器學習被研究并應用于供應鏈的需求和供應情況很常見[3].王洪峰等[4]提出了一種基于隨機優化法的方法來處理供應鏈系統中的不確定性.該方法可以有效地減少不確定性問題,并優化時間和復雜性.Ziari等[5]提出了一種戰術供應計劃模型,以克服產品生命周期短和需求不確定性等難點.該模型可以提供基于利潤和交貨時間最佳權衡的解決方案.鄒筱等[6]使用支持決策的風險評估關系,提出了一種供應鏈系統的層次結構.張天瑞等[7]研究了供應鏈網絡的可持續性.

在發展中國家,農業被視為第一產業,有助于消除貧困和保障糧食安全.農產品供應鏈是指以農產品為對象,圍繞農業供應鏈的核心企業,通過信息流、物流和資金流,實施農產品的生產、加工和營銷等過程.它將農業生產中的供應商(規模經營者)、農產品生產基地、農產品商品采購、物流服務經銷商、分銷零售商和消費者連接成一種功能型網絡鏈.

農產品供應鏈具有結構復雜、市場不確定性、市場力量失衡和脆弱性等特點.農產品的農業生產和加工的供應,經過從批發商、零售商到最終消費者的各個環節.農產品的生產和消費存在時間和空間差異.然而,市場信息極為分散和不確定,無論是農民個體還是農產品流通加工企業都很難完全掌握市場需求信息.農產品供應鏈物流的能力包括運輸、包裝、儲存能力,它們直接決定了農產品流通的規模和速度,也影響著農產品流通深度和廣度.近年來,農產品價格大幅上漲,一方面是受物價整體上漲的社會環境影響.另一方面,農業生產、運輸等環節遭到破壞,導致農產品供應鏈系統無法發揮正常的供應功能,使農產品供應鏈條結構和運行機制表現出極大的脆弱性.

通過風險分析和研究,可以確保農產品的質量和安全,提高供應鏈的效率,增加供應鏈的利潤,這是適應農業生產經營模式和社會化大生產加快需求轉變的有效途徑.因此,開展農產品供應鏈風險研究具有重要的理論和現實意義.為此,本文研究并設計了一種基于貝葉斯決策樹的農產品風險評估模型.在綜合考慮影響農產品供應鏈各個隨機變量的基礎上,采用ID3算法與貝葉斯算法建立決策樹模型,并提取風險評估權重.實驗結果證明本文模型具有較高的預測準確性以及市場敏感性,可為供應鏈中的決策者提供實際參考價值.

本文的貢獻如下:

1) 在綜合考慮影響農產品供應鏈的各個隨機變量的基礎上,采用ID3算法與貝葉斯算法建立決策樹模型并提取風險評估權重.

2) 決策樹模型應用于農產品供應鏈(APSC),提出了APSC管理框架,有助于決策者進行評估分析,以降低農產品供應鏈風險.

3) 使用接近專家推理來評估供應鏈風險,為供應鏈管理提供了一個新的決策支持維度.

1 供應鏈風險研究

目前,關于供應鏈的研究主要集中在風險識別、風險評估和風險管理等方面.丁存振等[8]根據不確定性和外部因素造成的供應中斷確定了供應鏈的風險.Tarei等[9]開發了一個用于評估供應鏈風險緩解策略的評估支持系統,該系統通過集成異構技術構建,采用系統評審方法探索主動和被動風險管理的推動者,利用基于規則的模糊推理系統(FIS)來抵消評估變量中涉及的不確定性.Rathore等[10]使用失效模式效應和模糊VIKOR來分析評估糧食供應鏈中的風險.他們使用模糊VIKOR對食品供應鏈風險因素進行優先級排序.這是一種多屬性評估技術,旨在根據標準對FSC的風險因素進行排序.Lotfi等[11]將混合模糊和數據驅動的穩健優化與供應商管理的庫存方法相結合,以實現彈性和可持續醫療保健供應鏈.陳美燕等[12]提出了基于貝葉斯的風險評估方法,用于使用歷史數據的供應鏈管理.該方法可以幫助供應鏈經理盡早識別風險因素.Yasamin等[13]提出了一個降低易腐食品供應鏈風險的模型.他們使用模糊最佳-最壞方法(F-BWM)對確定的策略進行了優先排序.最佳-最壞方法的模糊擴展有助于將模糊性納入評估中,是一種具有更高一致性的高效評估方法.梁冠宇等[14]開發了一個框架來識別、分析和評估供應鏈中斷因素和驅動因素.基于實證分析,在現實世界的工業環境中,確定并檢查了4個破壞因素類別,包括自然、人為、系統事故和財務,共有16個破壞驅動因素.Khan等[15]使用MCDM方法優先考慮清真食品供應鏈中的風險.該方法使用系統的文獻綜述來確定清真食品供應鏈條中的各種風險因素,并將其與專業人士和學者的專業知識相結合.然后,應用模糊層次分析法(FAHP)對識別出的風險要素進行優先級排序[16].翟羿蒙[17]進行了一項調查,以檢查整個食品供應鏈的欺詐和真實性以及食品欺詐對消費者和生產商的影響.結果表明,食品造假的普遍程度因行業而異,因此評估和檢測具有挑戰性.王曉梅等[18]回顧了新型冠狀病毒肺炎疫情期間農業食品部門面臨的挑戰,并推斷由于需求缺乏彈性,全球對食品的需求保持相對穩定.華樹春等[19]綜合多學科研究了新型冠狀病毒肺炎疫情如何影響食品供應鏈,包括如何影響食品安全和保障,人與動物相互作用的風險評估,以及如何導致食品行業的物流和規程發生變化.

農產品供應鏈中的風險包括內源性因素和外源性因素,一個階段的風險可能會給整個食品供應鏈帶來損失.外源性因素包括自然環境風險、經濟環境風險、政策環境風險和法律環境風險.何軍等[20]研究了自然環境風險對農產品供應鏈的影響.肖文金[21]分析了經濟環境風險對生鮮農產品供應鏈的影響.內源性因素是由供應鏈節點之間不可避免的利益沖突和信息不對稱引起的風險.例如,農業生產中的基礎設施限制加劇了運輸成本和風險,從而導致農業生產者的收入減少.風險在食品供應鏈上是傳遞的.目前對特定農業供應鏈風險的研究還很少,這不利于特定農產品的風險規避,容易影響農產品整體市場.

2 模型理論

2.1 數據預處理

首先,選擇構建決策樹所需的樣本屬性,并將數據分為2部分:訓練樣本和測試樣本.使用貝葉斯方法來補齊缺失的訓練樣本數據,并對數據進行離散化處理.樸素的貝葉斯方法使用已知的樣本屬性,將后驗概率最高的類Cx分配給未知的樣本屬性.假設有s個數據,屬性相互獨立,其中數據I已知z個屬性i1i2,…,iz,但屬性i是未知的,那么未知屬性屬于Cx的概率為:

(1)

U(I)=U(i1)U(i2)…U(iz)

(2)

(3)

U(I∣Cx)=U(i1∣Cx)U(i2∣Cx)…U(iz∣Cx)

(4)

2.2 構建決策樹

計算決策樹根節點的每個屬性的信息增益,選擇對應最大值的屬性作為根節點的屬性,然后從上到下遞歸計算其他子節點的屬性.假設樣本有s個數據,葉子節點有w個不同的分類Cx(x=1,2,…,w).sx為Cx的樣本數,ux是樣本屬于Cx的概率.假設樣本的某個屬性G有q個不同的類別,根據屬性G可以將樣本S分為q個子集,sxy為子集sy中分類Cx的樣本數,uxy=sxy/sy是sy中樣本屬于Cx的概率.那么,樣本分類所需的期望值X、基于屬性G劃分子集的熵E(G)、子集sy的期望X以及屬性G對應的信息增益A(G)分別為:

(5)

(6)

A(G)=X(s1+s2+…+sw)-E(G)

(7)

(8)

在父節點和子節點之間添加貝葉斯節點,檢驗父節點的屬性是否可知(Y:已知,N:未知).并在構建完決策樹后,對其進行后期剪枝(圖1).

圖1 貝葉斯決策樹示意圖

3 模型設計與開發

使用隨機變量來預測分析可能發生的風險,并根據觀察數據對其進行量化評估.風險作為狀態是固定存在的,但也會隨著自然變化隨機發生.本研究將農產品市場供應鏈系統建模為5個流程:來源、供應、需求、未來市場波動和市場價格.隨機變量是使用來自APSC操作的先驗知識設計和構建的.

將隨機變量分為3類:觀察到的、微觀的和宏觀的.觀察到的隨機變量評估直接環境情況,微觀隨機變量代表供應鏈活動,宏觀隨機變量評估市場行情.根據熵權法得到各隨機變量的權重詳見表1~表3.

表1 觀察到的隨機變量風險評估

3.1 觀察到的隨機變量

觀察到的隨機變量權重基于5個APSC評估類型,總結在表1中.

氣候問題影響農產品的生長和收獲,可以通過氣象站觀測或開放數據服務中獲得.利用種植面積估計農產品產量,可以手動完成或使用傳感器自動完成.氣候問題和種植面積提供有關來源的信息并暗示原材料加工.

原材料成本,如農產品市場價格可以通過開放數據服務觀察到,從中還可以看到損害次級生產量的基礎信息.勞動力資源反映生產能力,通過已登記的勞動力和法定節假日數據獲得.原材料成本和勞動力資源對于評估供應鏈中的供應環境至關重要.

對于需求,所需信息涉及產品消費和物流.出口成本和貨幣兌換是關鍵因素.這些信息可以從石油價格指數和網絡服務的貨幣兌換中獲得.此外,生產消費因農產品和市場性質而異.有些產品可能通過代理進行交易,而更多的產品則是通過標售進行交易.這意味著未來市場的波動性是用空盤量、交易量和市場價格來解釋的,這些可以從業務數據服務中觀察到.市場價格是由政府部門或代理人保留的農產品的指數市場價格,可以直接觀察到.

表1中所有隨機變量都是通過開放數據、信息系統和服務觀察獲得的,我們還需要針對特定的市場環境明確變量的狀態.例如,在氣候變化的情況下,根據農產品產量的脆弱性重點關注干旱、季風和洪水等風險.其他變量根據APSC非平穩特征得出的波動(下跌、平穩、上漲)和趨勢(下降、橫盤、上升、波動)進行分類.選擇狀態的標準是基于它的長短期波動如何影響交易過程.例如,原材料成本顯示了對生產制造業的影響,而空盤量、交易量和市場價格則反映了市場的需求.由于長期受到交易過程的間接影響,因此它們的狀態需根據趨勢進行分類.

3.2 微觀隨機變量

微觀隨機變量權重是根據APSC的先驗知識闡述的,總結在表2中.

表2 微觀隨機變量風險評估

農產品產量代表了市場來源的水平.生產能力是市場供應生產的中間步驟.消費者偏好概括了產品需求,反映了市場需求.市場波動是影響市場需求的外部因素.

這些微觀隨機變量利用低、正常和高狀態來反映其市場環境.其中,因市場波動監控市場情況,故使用下跌、穩定和上漲來定義.

3.3 宏觀隨機變量

宏觀層面的隨機變量總結了供應鏈動態,標識農產品供應鏈形勢.它由3種可能的狀態組成:均衡(指需求量和供給量相同)、短缺(指需求過剩)和過剩(指供給過剩).但需求、供應和市場價格之間的關系很復雜.例如,如果需求上升而供應下降,那么根據市場理論,就會出現農產品短缺導致價格上漲的情況.相反,如果供求關系引發價格下降,仍然是農產品短缺導致供應鏈異常的情況.后一種情況反映了市場政策功能失調,市場管理者必須實施修正(即控制參考市場價格或設置市場價格上限).

表3列出了需求、供應和市場價格波動背景下農產品供應鏈的風險權重,旨在幫助管理者評估及預測市場風險.

表3 宏觀隨機變量風險評估

市場控制農產品的生產和供應與消費者之間的需求關系.我們利用這些信息對隨機變量之間的評估假設進行建模,隨機變量指標使用決策樹模型運行后的結果如圖2所示.

圖2 隨機變量決策樹模型

最后將該決策樹模型應用于農產品供應鏈,提出了一個APSC管理框架,有助于決策者進行評估分析,以降低農產品供應鏈風險.該框架編碼了一種類似人類推理的方法,用于APSC管理(圖3).

圖3 APSC管理框架構建流程

該框架由4個部分組成:數據感知、觀察識別、形勢解釋和風險評估.

數據感知通過全球定位系統(GPS)、地理信息系統(GIS)、遙感技術和基于Web的應用程序等來源檢索APSC相關數據.原始數據通過觀察識別模塊轉換為可用于APSC的觀測數據.盡管這些觀察數據詳細描述了APSC的信息,但它們并沒有詳細說明APSC之間的關系,這需要更深入地了解APSC的情況.形勢解釋以類人推理的方式產生基于決策關系的理性解釋.最后,評估預測主動規劃的風險因素,從開放數據、信息系統了解的市場行情,并根據當前的APSC情況推斷出可能產生的風險結果.由此產生的評估結果有助于決策者決定解決方案并及時調整計劃政策.

4 實驗結果與分析

4.1 模型性能驗證

為驗證本文模型對APSC風險的預測能力,首先對模型進行了性能評估.

根據農產品供應鏈形勢可知,目標類別分布在9個可能的結果上,并且是不平衡的.根據10倍是最優值,對本文基于貝葉斯的離散模型進行交叉驗證.將數據重新采樣為10個子集,在每次迭代中使用9個子集進行訓練,其余的用于測試.采用10折交叉驗證來估計模型性能.

解釋驗證結果的度量標準是準確性,通過測量本文模型在學習過程中的預測性能來判斷,結果如圖4所示.

圖4 10折交叉驗證本文模型的預測精度

圖4顯示整體評價準確性高達92%.均衡和異常短缺是罕見事件,在樣本比例中的發生概率分別約為7%和8%,所以準確率低于90%.由于市場環境是動態變化的,所以均衡狀態是理想但很少發生的.同樣,異常短缺是指供不應求,是一種與供求規律相矛盾的異常情況,也是一個罕見的事件.

實驗結果表明,本文提出的模型具有良好的性能,可以應用于農產品供應鏈風險評估研究,該模型對市場風險評估情況正確且合理.

接著通過對模型正確性的預測性能測試,以及模型合理性的敏感性分析來驗證本文模型的有效性.

4.2 預測性能測量

實驗測量了本文模型的預測性能.目標類別是農產品供應鏈中隨機變量的狀態,它們有助于在供應鏈系統中提供最終評估結果.

使用標準分類算法來比較本文模型與其他4種模型(文獻[22]-文獻[25])在精確率、召回率和F1度量值3個指標上的預測性能.精確率(P)指的是正確預測正類樣品的比例,其計算公式為:

(9)

其中TP是真陽性預測,FP是假陽性預測.

召回率(R)指的是正確預測為正類的占全部實際為正類的比例,其計算公式為:

(10)

FN是假陰性預測.

F1度量值是P和R之間的平衡,其計算公式為:

(11)

分類器的性能取決于算法的參數,這些模型由具有默認參數設置的Python庫scikit-learn實現.例如,文獻[22]模型設置100個隱藏層,0.001學習率,200個epochs,ReLU作為激活函數,adam作為優化.使用測試數據集評估模型,每個模型的平均分數如圖5所示.

圖5 預測性能比較

圖5顯示了每個模型的精度、召回率和F1度量值,平均值遠遠超過80%.其中文獻[25]模型的精確率最低,為85%.該模型認為供應鏈的特征是獨立的,只取決于結果.事實上,對于功能通常相互依賴的供應鏈而言,情況并非如此.文獻[22-24]模型的精確率分別為91%,90%和92%,這些數據分數都很高,因為所有模型都是使用準備充分的數據進行訓練和驗證的.而本文模型相對更高,精確率可以達到96%,證明本文模型可以更好地應用于預測系統.本文模型在傳統的供應鏈管理中也非常有效.傳統供應鏈是與現代供應鏈相對應的概念.與現代供應鏈具有的數字化、智慧化、平臺化、服務化、綠色化、全球化等特征相比,傳統供應鏈的數據多數來源于企業內部,存在信息封閉的現象,而且在傳統的供應鏈管理中,許多公司會聘請專家來評估短缺或過剩的可能性.然而,小公司缺乏這方面的專業知識,因此對他們而言預測分析更加耗費人力和時間.而本文模型可以幫助這些小公司準確評估供應鏈風險.

4.3 敏感性分析

盡管本文模型的結果可以很好地應用于預測系統,但它并沒有給出支持評估的解釋.因此,我們需要通過敏感性分析來解決這個問題,以顯示隨機變量之間聯系的強度和敏感性.該實驗可以為影響農產品供應鏈的隨機變量的狀態提供參數,從而為本文模型評估市場結果提供合理解釋.實驗對其他供應鏈風險評估模型與本文模型進行了對比,本文使用了貝葉斯的條件依賴,它根據數據依賴生成關系,因而采用了基于場景的敏感性分析來解釋模型的合理評估.

我們使用最敏感的場景,“農產品供應鏈中的均衡狀態”.該事件發生的概率最低,但對評估的影響最大.根據農產品供應鏈的后驗概率可能受到生產能力、消費者偏好和市場價格的影響,我們假設基本情況對其隨機變量的狀態變化敏感.

利用敏感性分析根據未知變量的偏導數計算后驗概率分布,敏感性計算公式為:

(12)

式中,i是一個目標變量,對I=in的基本情況比較敏感,而u(in|e)是給定證據的基本情況的后驗分布.

以所有證據為條件的平均敏感性介于0和1之間.0表示農產品供應鏈形勢的變化導致后驗概率的絕對變化減少,在后驗分布計算中表現出魯棒性.敏感性分析可以測量農產品供應鏈形勢后驗敏感性的微小變化(即非平衡的原因).本質上,這種分析是基于農產品供應鏈形勢的不確定性,以專家推理的方式計算評估之間的敏感性.

龍卷風圖是風險定量分析中常用的一種敏感性分析工具,它將各敏感參數按其敏感性進行排序,可以形象地反映出各敏感參數對價值評估結果的影響程度.本文使用龍卷風圖表示,易于閱讀和解釋.圖6中的x軸表示農產品供應鏈的均衡狀態在0和1之間的敏感度.y軸是影響均衡條件的參數.隨機變量狀態有27個可能的參數,但只有5個最敏感的參數出現在圖6中.

圖6 本文模型和其他3種模型的龍卷風圖結果對比

圖6顯示了本文模型和文獻[23]模型、文獻[24]模型以及文獻[25]模型的敏感度水平,敏感度分別為0.068,0.072,0.075和0.081.

本文模型和其他對比模型之間的區別是影響農產品供應鏈敏感性的隨機變量的數量.本文模型對市場價格、生產能力和消費者偏好高度敏感,而其他對比模型分別對市場價格、交易量、空盤量、貨幣兌換敏感.變量的數量反映了資源和處理時間.本文模型的后驗分布對市場價格高度敏感.消費者和供應商的行為是影響農產品供應鏈的主要因素,本文模型可以幫助人們使用接近專家推理來評估供應鏈風險.

模型的前3個參數表明均衡狀態已經收斂到零.這意味著生產能力、消費者偏好和市場價格的變化導致農產品供應鏈形勢變得不平衡(短缺或過剩).本文模型和其他對比模型中的最后兩個參數也不同,相比本文模型,其他對比模型對交易量、空盤量、貨幣兌換高度敏感.然而,由于交易量、空盤量、貨幣兌換不能被用來評估農產品供應鏈風險情況,所以這些模型的評估結果并不合理.專家給予的解釋是這些隨機變量是影響農產品供應鏈的間接原因,其通常通過影響其他方式傳遞未來市場、出口成本和消費者偏好.實驗結果表明本文模型對生產能力、消費者偏好和市場價格的變化很敏感,符合領域專家的預測推理,為供應鏈管理提供了一個新的決策支持維度.

5 結論

由于全球人口不斷增加、氣候條件不斷變化以及自然界中占主導地位的其他因素,農業實踐變得越來越難以預測.此外,農作物的產量會直接影響農產品供應鏈的可持續性.因此,將新技術納入農業實踐是當務之急.本研究設計和開發了一個用于農產品供應鏈風險預測評估的決策樹模型.該模型應用貝葉斯決策樹算法對收集到的隨機變量進行分類,使用熵權法得到各隨機變量的權重并用于風險評估.最后將決策樹模型應用于農產品供應鏈(APSC),提出了一個APSC管理框架.通過與其他模型在預測性能測量上的對比,驗證了本文模型具有較高的預測準確性.同時,敏感度分析實驗結果證明本文模型具有較高的市場靈敏度,可以有效地評估供應鏈風險,幫助決策者更好地預測及應對市場變化.然而,基于專家知識的本文模型具有一定的主觀性.需要根據不同供應鏈特征的市場調整模型的預測假設,并根據不同的歷史數據重新調整參數.在未來的工作中,我們將研究其他更具客觀性的數據,用于不同供應鏈風險預測.

猜你喜歡
供應鏈農產品評估
農產品網店遭“打假”敲詐 價值19.9元農產品竟被敲詐千元
打通農產品出村“最先一公里”
海外并購績效及供應鏈整合案例研究
為什么美中供應鏈脫鉤雷聲大雨點小
各地農產品滯銷賣難信息(二)
益邦供應鏈酣戰“雙11”
益邦供應鏈 深耕大健康
評估依據
農產品爭奇斗艷
立法后評估:且行且盡善
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合