?

基于數據影響的業務流程一致性檢查方法

2024-03-05 09:58白少康方賢文錢陳婧
計算機應用研究 2024年2期
關鍵詞:業務流程

白少康 方賢文 錢陳婧

收稿日期:2023-06-09;修回日期:2023-07-27? 基金項目:國家自然科學基金資助項目(61572035,61402011);安徽省重點研究與開發計劃資助項目(2022a05020005);安徽省高校領軍骨干人才資助項目(2020-1-12)

作者簡介:白少康(1998—),男,河北邯鄲人,碩士研究生,主要研究方向為Petri網、業務流程管理;方賢文(1975—),男(通信作者),安徽淮南人,教授,博導,博士,主要研究方向為Petri網、可信軟件和業務流程變化域分析(280060673@qq.com);錢陳婧(1998—),女,江蘇南通人,碩士研究生,主要研究方向為Petri網、業務流程管理.

摘? 要:近年來,業務流程的精確管理受到越來越多的關注,作為業務流程管理內容之一的一致性檢查技術正變得越來越重要?,F有的一致性檢查技術主要從模型的控制流角度出發,并未考慮業務流程中的數據或數據的變化對業務流程產生的影響,為此提出了一種基于數據影響的業務流程一致性檢查方法。首先,通過業務流程建模符號(business process modeling notation,BPMN)模型中數據和行為之間的依賴關系來分析數據對偏差活動預期行為的影響,進而獲取偏差活動的預期行為集;其次,通過在BPMN模型中引入決策模型和符號(decision model and notation,DMN)決策表來充分捕獲當前實例執行的數據上下文與行為上下文之間的關系,以區分有效數據更改和異常數據更改,找到偏差活動的有效預期行為集。最后,通過設計數據對偏差活動影響的各類成本函數提出了有效一致性檢查方法。實驗結果表明,相比已有工作,該方法在進行業務流程一致性檢查時提高了業務流程的一致性,可以成功捕獲偏差活動作出反應的適應行為,使得業務流程在復雜多變的環境下表現得更加準確、合理。

關鍵詞:業務流程; 一致性檢查; 數據影響; 預期行為; 決策模型和符號(DMN); 有效數據更改

中圖分類號:TP391??? 文獻標志碼:A

文章編號:1001-3695(2024)02-033-0540-08

doi:10.19734/j.issn.1001-3695.2023.06.0252

Business process conformance checking method based on data impact

Bai Shaokanga,b, Fang Xianwenb,c, Qian Chenjingb,c

(a.School of Computer Science & Engineering,? b.Anhui Province Engineering Laboratory for Big Data Analysis & Early Warning Technology of Coal Mine Safety, c.School of Mathematics & Big Data, Anhui University of Science & Technology, Huainan Anhui 232001, China)

Abstract:In recent years, the accurate management of business processes has received more and more attention, so confor-mance checking technology as one of the business process management elements is becoming more and more essential. The existing conformance checking technology is mainly from the perspective of the control flow of the model, without considering the data in the business process or the impact of data changes on the business process. To solve above problems, this paper proposed a business process conformance checking method based on data impact. Firstly, the method analyzed the impact of data on the expected behavior of deviant activities through the dependency relationship between data and behavior in the business process modeling notation(BPMN) model, and obtained the expected behavior sets of deviant activities. Secondly, it introduced the decision model and notation(DMN) decision table into the BPMN model to fully capture the relationship between the data context and the behavior context of the current instance execution, so as to distinguish between valid data changes and abnormal data changes and found the effective expected behavior sets of deviation activities. Finally, this paper proposed an effective conformance checking method by designing various cost functions of the impact of data on deviation activities. Compared with existing work, the results show that the proposed method improves the conformance of business process. This method can successfully capture the adaptive behavior of responding to deviant activities, making business processes more accurate and reasonable in complex and changeable environments.

Key words:business process; conformance checking; data impact; expected behavior; DMN; valid data changes

0? 引言

大數據時代的到來,不僅改變了人們的生活方式與企業的運作模式,也讓業務流程管理得到了進一步的發展[1]。如今,業務流程的規模逐漸趨向于復雜化,傳統的嚴格約束的結構化業務流程已無法應對一些復雜的、任務執行需要依賴數據決策的應用場景[2],如工業互聯網當中的流程案例。近年來,過程挖掘技術被廣泛應用到各種新興領域中,其技術主要分為過程發現、一致性檢查和過程增強三個階段。其中,過程發現技術主要是提取日志中所記錄的行為并建立相應的過程模型[3],但在實際運行的過程中,任何一個基于系統日志所建立的模型都是不斷變化的,即當日志在模型上運行時可能會出現偏差,因此需要對模型進行一致性檢查,而一致性檢查的目的是測量真實發生的事件日志中的行為與原有的過程模型指定的預期行為的擬合度并確定偏差位置,進而分析發生偏差的原因,這在業務流程管理中尤為重要。

以往的一致性檢查技術大多只關注控制流方面[4],它們通常是以過程模型和系統日志作為輸入來量化兩者之間的一致性程度,只允許在模型表示的預期行為和日志捕獲的實際行為之間進行比較。然而當偏離預期的行為發生時,業務流程通常需要額外的操作來進行對偏差活動的補償并將流程恢復到正常狀態,但是因偏差活動所帶來的對業務流程的補償活動在業務流程中很難捕捉到,這將直接影響業務流程整體的一致性。換句話說,當使用現有的一致性檢查技術分析事件日志時,流程的執行看起來可能是偏離了預期的行為,但是在流程執行的實際過程中,它們是在為之前所發生的偏差活動進行補償以達到業務流程的正常狀態,這樣未完全并且適當地處理偏差活動的流程執行可能使業務流程具有更好的一致性。

為了解決這一問題,可以通過分析額外數據源中的數據更改的影響來識別偏差活動的預期執行行為,而DMN可以很好地判斷數據的有效更改。因此,本文提出了一種一致性檢查方法,通過利用DMN分析所涉及的數據更改及其對偏差活動預期行為的影響,并且考慮流程執行過程中對意外偏差的響應和恢復來提高業務流程的一致性。該方法主要是基于現有的基于控制流的一致性檢查技術以及數據影響分析技術實現。

本文集中的工作主要體現在兩個方面:數據感知流程建模及數據影響分析;多視角一致性檢查分析。在數據感知流程建模的上下文中,許多工作都試圖解決流程與數據之間的關系。在一些研究中,如文獻[5,6]提出了一個業務流程工作流的設計方法,這些方法可以幫助設計人員從數據角度設計流程模型,從而避免了業務流程中引入數據流的問題。文獻[7]為了驗證帶數據狀態注釋的業務流程并縮小數據模型與業務流程模型之間存在的差距,增強了業務流程中數據狀態的描述能力,并根據數據狀態與業務流程模型的關系驗證了數據狀態的完整性和一致性。文獻[8]解決了業務流程模型中控制流和對象生命周期一致性的問題,當對象的狀態發生改變時,將會在流程中變成顯式并檢查業務流程模型和業務對象生命周期之間的一致性,但是數據對象對進程的影響沒有被處理。文獻[9]中提出了一種對包含復雜數據依賴關系的流程建模的方法以及它們如何從流程模型中自動執行的問題。

上述研究都試圖解決流程模型和數據模型之間的關系,但提出的方法只是考慮了數據的局部變化,并沒有考慮數據變化的間接影響。而在另一些研究中,如文獻[10]提出了一種半自動化的數據影響分析方法,將業務流程模型轉換為關系數據庫進行標志,并根據活動、其他數據項和受影響的網關來分析數據更改的影響,文獻[11]將DMN決策表引入BPMN,通過考慮數據和決策的感知過程,將流程穩健性的經典概念提升到具有更加豐富的數據感知的設置中。

在業務流程一致性檢查分析的工作中,越來越多的工作者從僅基于控制流的一致性分析轉到基于額外視角的一致性分析,這些額外視角包括資源、時間和主要的數據。如文獻[12]介紹了一種多視角一致性檢查技術,將數據Petri網(DPN)模型轉換成Petri網模型,通過可達性圖計算了多視角在線一致性過程模型的結構,并且支持從多個角度對事件數據進行實時監控;文獻[13]針對事件流中的時間層面對業務流程進行一致性檢查,提出了一種在輸入過程模型中注入時間剖面的一致性檢驗中量化時間偏差的方法;文獻[14]分別從控制流、數據和資源這三個角度進行事件日志與過程模型的校準,但是該方法是先進行基于控制流的對齊,然后再進行基于數據和資源的對齊,這樣可能將控制流的偏差診斷為數據與資源的偏差,造成偏差的誤判;為此,文獻[15]提出一種同時考慮三種角度的一致性檢查的方法,并為這三種角度設置相同的權重,從而獲得更準確的對齊;文獻[16]提出了一種使用模糊集來評估基于數據角度的偏差程度,對數據角度進行了更加細粒度的分析,提高了對數據角度的偏差分析能力。

上述研究中雖然都在一致性分析的過程中引入了數據元素,但這些研究都沒有考慮數據的變化對業務流程的影響。以下的研究不僅在一致性檢查的過程中考慮了數據元素,并且也考慮了數據對業務流程的影響。如文獻[17]提出了一種一致性檢查的方法,通過分析所涉及的數據更新及其對流程行為的影響,并考慮了流程執行過程中數據的變化對意外偏差的響應;文獻[18]發現了在流程模型中數據被用作活動的輸入并嚴重影響了流程模型,因此引入了“數據影響分析”的概念,它可以分析數據元素對其他業務流程元素的影響,包括活動、路由約束和其他數據元素。

綜上所述,數據感知過程分析的相關文獻主要關注數據流的正確性以及控制流和數據流的一致性,而業務影響分析的文獻并沒有關注數據帶來的影響?;诖?,本文重點是在業務流程一致性檢查的過程中引入數據變化對流程的影響并進行分析。

1? 動機案例

隨著時間的推移,業務流程系統中可能會引入一些數據操作,如數據的修改和刪除等,這些數據操作或許會引起業務流程系統的行為發生變化。下面用一個簡單的例子,從流程模型的角度說明因數據的更改而發生當前實際系統日志與系統模型不一致性的問題。

如圖1所示,給定了一個“公司-顧客-物流”三方的多場景交互的BPMN模型。本文主要關注由人工執行的用戶活動(如顧客層面的收貨活動)以及與業務規則引擎交互的決策活動(如物流層面的計算運費活動)。圖1中的BPMN流程顯示了某一活動所產生的數據將會作為另一個活動的輸入或是將活動所產生的數據存儲到數據庫中,由于這些活動涉及到計劃執行、評估和其他決策密集型任務(如計算運費活動),所以這些活動很可能使用相關的上下文數據作為決策活動的輸入,但是現有的流程模型只是用于定義如何執行流程以達到特定的業務目標,而不考慮在運行時的實際情況。

為了描述方便起見,本文將圖1的BPMN模型轉換成Petri網模型,如圖2所示。假設三個顧客在付運費之后均要求增加訂單的類型或是數量,因此需要在付運費活動后重新輸入裝配加工等活動。下面分別考慮關于三個顧客的執行跡:

σMike=〈A,B,C,D,E,A,C,D,E,F,G〉

σSue=〈A,B,C,D,E,A,C,D,F,G〉

σTom=〈A,B,C,D,E,A,C,D,E,F,G〉

這三條執行跡都不能在圖2的模型中進行重放,即都發生了控制流偏差。計算出三條執行跡的適應度分別是0.64、0.7和0.64??梢杂^察到:a)顧客Mike和Tom的執行跡比顧客Sue的執行跡的偏差要更大,這樣的結果雖然符合現有的一致性檢查技術,但這并不符合實際情況,因為在付運費后,三個顧客均要求增加了訂單的數量或是類型,所以在發生第一次付運費(E)后,再次發生C、D、E等活動是合理的,顧客Mike和Tom的執行跡更符合業務術語;b)雖然看上去顧客Mike和Tom的執行跡的偏差程度是一樣的,但是更進一步地,需要根據顧客所增加的訂單類型及數量(即實際的數據影響)來判斷發生的偏差行為是否為有效預期行為,才能最終確定兩條執行跡的偏差程度。

基于以上問題,將現有的一致性檢查方法進行改進,對于每個被識別的偏差,考慮數據變化對其預期行為的影響,隨后通過在BPMN模型中引入DMN決策表充分捕獲當前實例執行的數據上下文與行為上下文之間的關系,判別偏離活動e的有效預期行為,以更好地模擬其真實的執行環境。

2? 基本知識

Petri網是一種可以表達離散事件動態系統的靜態結構和動態變化的分布式系統建模和分析的工具,不僅具有嚴格的數學表達方式,也有直觀的可視化圖形表示,同時還兼具了系統行為分析技術。本文選用標簽Petri網來建模業務過程并進行一系列研究。下文提到的Petri網均指標簽Petri網。

定義1? 標簽Petri網。一個流程模型Petri網系統N=(P,T,F,α,MI,MF)是一個六元組,其中:P是有限庫所集合,T是有限變遷集合;F(P×T)∪(T×P)是有向弧集合,稱為流關系;α:T→Aτ是一個函數,將變遷映射到活動集A,其中Aτ=A∪{τ}并且τA表示除活動集A外其他的活動;MI和MF分別是N的初始標識和結束標識。

定義2? 跡,事件日志。跡σ=〈e1,e2,…,en〉是由多個活動事件構成的有序序列,每條跡對應流程模型的一次完整執行,即流程實例。日志L={σ1,σ2,…,σn}是由所有跡構成的集合。

定義3[19]? 校準。設N是一個流程模型Petri網,σL∈L是流程模型中的一條日志跡,σM是系統網N產生的一組完整的發生序列。跡σ與網N之間的校準γ∈(A>>×T>>)是指一個成對的γ∈A*LM 投影在第一個元素上產生的σL(忽略>>),投影在第二個元素上產生的σM(忽略>>)。校準γ的第1行(a1,a2,…,an)是事件日志中的一條跡;校準γ的第2行(t1,t2,…,tn)是流程模型Petri網中的一組變遷序列。

對于校準中的所有元組(a,t)的定義如下:

a)若a∈A且t=>>,則為日志移動;

b)若a=>>且t∈T,則為模型移動;

c)若a∈A且t∈T,則為同步移動;

d)否則為非法移動。

3? 基于數據影響的預期行為分析

3.1? 數據依賴

在流程執行的過程中,將根據流程模型中控制流確定的順序關系及數據依賴關系和數據流依次激活其活動,且活動可以對數據項執行讀或寫操作,即活動可以訪問某個數據項的值或者創建和修改某個數據項。通常,活動和數據項之間的每個依賴項都表示該活動對數據項進行了更改,而相反方向的依賴項表示讀取操作?;顒涌梢栽诓蛔x取數據項的情況下寫入數據項,例如圖1中的模型,當顧客需要重新創建訂單時,提交訂單活動可以在不讀取現有值的情況下將一個新記錄插入數據庫。

因此,考慮數據對活動的兩種可能的影響:a)數據項的值作為活動的輸入時,可能會出現與控制流不一致的預期行為活動[10],例如在圖1中,當某個顧客在提交付款之后突然增加需求(即改變需求中數據項的值)時,可能會再次帶來裝配加工、計算運費等活動;b)數據項的值通過附加到控制流邊緣的路由約束設置了活動執行的先決條件[20],只有當路由約束被評估為true時,活動才被啟用,例如在圖1中,只有當評估生產能力和零件供應為true時,才可以執行裝配加工等活動。

將數據項的值與活動的依賴關系及數據對活動的第一種影響定義如下:

定義4[18]? 輸入數據-活動-輸出數據(IAO)。設M是一組活動(A)和一組數據項(D)上的過程模型,IAO={in,act,out}是一個三元組,其中in,out∈D∪{null},滿足in是活動act∈A的輸入數據,out是活動act∈A的輸出數據,并可以作為下一個活動或某一個后續活動的輸入數據。

例如在圖1中,需求(data)是提交訂單活動的輸入數據,而訂單(data)則是提交訂單活動的輸出數據,并作為下一個處理和評估活動的輸入數據,因此(需求(data),提交訂單,訂單(data))就是一個IAO三元組。

定義5? 數據影響DI。數據項d對跡σ的數據影響是σ中所有受數據項d影響的相關活動的事件集合。即DI(di,σ)={e∈σ|{di}i=2,…,nD∪{null},{ei}i=1,…,n-1σ-{e}}。

例如,DI(訂單類型或數量,〈A,B,C,D,E,F,G〉)={C,D,E}。

3.2? 服從性校準

綜上,一致性檢查是流程挖掘的主要領域之一,而對齊是過程模型和事件日志進行一致性檢查的一種方法,能夠根據給定的成本函數得到事件日志中跡與過程模型之間的擬合情況,從而確定偏差活動所在的位置,在此基礎上進一步分析導致偏差的原因。

圖3舉例說明了在第1章中提到的三條跡的對齊方式。其中,σMike和σTom都包含四個日志移動,而σSue包含兩個日志移動,因此,已有的一致性檢查技術認為σSue更符合過程模型,并且認為σMike和σTom中的擬合度是一致的,但這可能是不符合實際情況的,如前文所述:a)由于這三條跡最開始的偏差活動都是A(提出需求活動),而在顧客重新提出需求之后,重復出現C、D、E等活動可能是合理的,所以在實際情況中,σSue的擬合度不一定會比σMike和σTom的擬合度要高;b)由于數據項的值通過附加到控制流邊緣的路由約束設置了活動執行的先決條件,所以σMike和σTom在實際情況中的擬合度不一定一致。

1234567891011fitness

σMikeABCDEACDEFG

MABCDE>>>>>>>>FG0.64

σSueABCDEACDFG

MABCDE>>>>>>FG0.7

σTomABCDEACDEFG

MABCDE>>>>>>>>FG0.64

對于給定的同一條跡σ和一個過程模型M,它們之間可能會有不同的對齊方式。為了方便比較不同的對齊方式與過程模型之間的偏差大小,本文將成本函數分配給異步移動,即模型移動和日志移動,成本函數值為1;此外,將(>>,τ)的成本函數值設為0。一個跡的對齊γ的成本c(γ)為對齊中所有移動的成本函數值的總和。當c(γ)值最小時,稱此時的對齊為最優對齊。

定義6[21]? 最優對齊。給定一條跡σ和一個過程模型M,對于σ和M之間的所有對齊Γ,γ∈Γ,對γ′∈Γ,都有c(γ)≤c(γ′),則稱γ是σ和M之間的最優對齊。

現有的一致性檢查方法是基于控制流對齊檢查并進行擬合度計算,但是在業務流程中不可或缺地會包含一些數據,因此這些方法的適用性受到了限制?;谶@些觀察的結果,本文選擇增強控制流對齊檢查技術,考慮其每個偏差活動所受到的數據影響,而不僅僅考慮控制流。

3.3? 預期行為分析

在流程執行的過程中,一旦流程執行中發生了意外的更改(即發生了偏離過程模型的活動),它將作為模型移動或是日志移動出現在相應的對齊中。而在執行活動的偏離點上,因數據影響帶來的預期行為不再是過程模型所規定的行為,將這些偏離過程模型的預期行為視為因實際的數據變化帶來的額外補償活動,并將此活動形成一個新的符合一致性檢查的基礎。

預期行為分析是根據基于控制流的對齊方法所指示的偏差活動,將下列可能的活動響應作為偏差活動預期行為的一部分:a)對于在流程模型中跳過的活動(即發生了模型移動),該偏離活動的預期行為就是流程的后續執行,因為流程中仍然需要它;b)對于意外執行的活動(即發生了日志移動),如果該偏離活動涉及到之前執行活動的數據更新影響,那么它的預期行為就可能受到數據更新影響的活動,無論這些活動之前是否發生過。例如在運行示例中,顧客在付運費后又增加了需求(活動A),該流程就可能需要重新進行付款(活動C)、裝配加工(活動D)及支付運費(活動E)等活動,因此重新發生的C、D、E等活動就是偏離活動A的預期行為活動。如果該偏離活動不涉及之前執行活動的數據更新影響,那么此偏離活動不再產生預期行為。

在流程發生日志移動時,應考慮該流程偏離點更改的所有數據項,以識別可能受到這些數據項影響的所有活動的集合,并將其定義如下。定義7? 活動集。設σ是一條跡,e是在σ對齊當中發生日志移動的第一個偏離事件,σ′是σ在e之前的跡,D(e)是受e影響的所有數據項的集合,那么偏離活動e的預期行為集合為AT(e,σ′)=∪d∈D(e)DI(d,σ)。

例如在圖3的σMike中,流程模型在第6步發生日志移動,偏離活動為提出需求活動(A),該活動所包含的數據項包括更新訂單的類型或數量,其活動集應包括重新付款(C)、裝配加工(D)、支付運費(E)三個活動,其正式的表達為AT(A,〈A,B,C,D,E,F〉)={D,E,F}。

綜上,一條跡σ的日志移動、模型移動及同步移動產生的預期行為集如式(1)所示。

EB(m,σ′)=AT(e,σ′)? m是日志移動{a}m是模型移動m同步移動(1)

算法1展示了發生異步移動的偏差活動e的預期行為上下文檢索的過程。

算法1? 檢索偏差活動e的預期行為

輸入:過程模型Petri網N=(P,T,F,α,MI,MF),一個事件日志的跡σ。

輸出:偏差活動e的預期行為集EBS。

1? Pt={bi}; Tt={Pt·};EBS=; DataItemSet=;

2? while i≤|σ| do

3? for t∈Tt do

4??? if alignment(ti)=true then

5??? Tt←Tt-{ti};//從Tt集合中移除完全對齊的活動

6? return Tt;

7? for ei∈Tt do

8? DataItemSet←ImpactDataItemSet(ei); /*將影響偏差活動e的數據項的值分配給數據項集合*/

9? if DataItemSet= or Tt= then

10??? return {};/*如果沒有影響偏離活動e的數據或者如果σ完全對齊,則返回空*/

11? else

12??? for di∈DataItemSet do

13??? if m.e=>> then

14??? ?return {t.a};/*如果活動e是模型移動,則直接返回該活動*/

15??? else

16??? Π(di)=ei;

17??? EBS←EBS∪DI(di,σ); /*如果數據項di與異?;顒觘相關,則將異?;顒觘受數據影響的預期行為活動分配給EBS*/

18? return EBS.

算法中第1行分別初始化了庫所集合、變遷集合及預期行為集,分別使庫所集合Pt的初始元素為初始庫所bi,變遷集合Tt的初始元素為Pt的后集元素,預期行為集EBS為空集。算法第3~5行是判斷跡σ中的活動與過程模型是否對齊,即是否是同步移動,如果是,則將對齊的變遷t從Tt中刪除,并進行檢查下一下變遷是否對齊,最終返回偏差活動的集合Tt。如果影響偏差活動e的數據項的集合或者Tt是空集,則直接返回空值(第9,10行),否則,如果是模型移動,則直接返回該活動(第13,14行);如果是日志移動,則要找到偏差活動e受數據影響的預期行為并賦值給EBS(第16,17行)。

4? 預期行為有效性分析

關于數據變化的影響而產生偏離活動e的預期行為并不能保證是有效的預期行為,即這些數據的變化是否符合通過附加到控制流邊緣的路由約束設置的活動執行的先決條件。因此,在BPMN模型中引入DMN來考慮上述預期行為的有效性。

4.1? DMN決策表

為了說明BPMN模型中業務規則的底層決策邏輯,使用了DMN標準中的決策表,并且考慮了S-FEEL語言中制定的決策規則。DMN決策表由與輸入或輸出屬性相對應的列和與規則相對應的行組成,每一列都有一個類型,稱之為facet,在每一個決策表中可以通過facet條件進一步限制可能的值集。例如在圖4中,“生產能力”決策表中的訂單類型是字符串類型,它與facet條件相關聯,要求值為T1或T2。類似地,訂單數量是整數值,并且有一個相關條件,要求值為正值。在DMN標準中,facet和規則條件是用FEEL(friendly enough expression language)表示,其中S-FEEL是一個片段。帶有S-FEEL條件的決策表擴展了提及外部參數的能力,這些外部參數必須在調用決策表之前動態地綁定到實際的數據項的值。

定義8[11]? S-FEEL。具有外部參數X的S-FEEL語言形式化歸納如下:

〈condition〉::=〈disjCond〉|"not("〈disjCond〉")"

〈disjCond〉::=〈atomicCond〉|〈atomicCond〉","〈disjCond〉

〈atomicCond〉::="-"|k|〈compOp〉k|

〈openInt〉k1","k2〈closeInt〉

〈compOp〉::="〈"|"≤"|"〉"|"≥"

〈openInt〉::="["|"("

〈closeInt〉::="]"|")"

其中:引號("")用于隔離保留關鍵字;k、k1、k2是來自實數或參數X中的數字或常量;"-"表示對此條件不關心,可以對應于任何值;逗號(",")分隔的條件只要有一個滿足可將匹配此滿足值。

基于DMN標準,使用S-FEEL條件作為決策表的基本構建塊,定義如下決策表。

定義9[11]? DMN決策表。一個決策表DT=(I,O,X,InFacet,ORange,ODef,R,H)是一個八元組,其中:I和O分別是不相交的、有限有序的輸入和輸出屬性的集合;X是外部參數的集合;InFacet是一個facet函數,它將每個輸入屬性a∈I與帶有外部參數X的S-FEEL條件關聯起來,為a指定允許的輸入值;ORange是一個輸出屬性的范圍函數,它將每個輸出屬性b∈O與可能的輸出值關聯起來; ODef: O→R是一個輸出屬性默認的賦值函數,它將一些輸出屬性映射到相應的默認值; R是一個輸入和輸出的規則函數;H∈{U,A,P,F,O,C,R}為決策表的命中策略,分別是唯一策略、任意策略、優先策略、第一策略、收集策略、輸出順序策略和規則順序策略。

為了簡單起見,在本文其他部分只考慮唯一命中策略U,這不會影響本方法的通用性,因為任意命中策略可以轉換成唯一命中策略。

4.2? DBPMN決策模型

本節正式引入了DBPMN模型,它通過使用案例數據對象將BPMN和DMN S-FEEL決策規則結合起來。為了表示簡單,本節不討論數據對象和決策表屬性的數據類型化問題,假設它們都是實數,都配備了內置的二進制比較運算符“=”“<”“≤”和它們的反版本;同時假設值域除了實數之外還包括一個特殊的undef值,用來建模對象值未定義的情況。

下面將利用DBPMN來判斷BPMN中通過數據項值的改變是否會帶來偏離活動e的預期行為的發生。圖1BPMN模型中的決策活動的DBPMN模型的建模如圖4所示,為了簡單起見,圖4的DBPMN模型只考慮圖1的BPMN模型中的決策活動。

圖4直觀地描述了DBPMN的示例過程,以突出DBPMN模型的主要特點(需要注意的是該DMN決策表的創建需要依該領域實際情況構造)。當公司收到顧客的訂單需求時這個過程就開始了,訂單需求帶有其訂單類型及訂單數量的指示。為了獲得公司內部零件的供應量,執行一個專門的手動任務,將獲得的結果存儲到“供應量”數據對象中,當供應不足時,該流程會直接結束。為了確定公司是否有能力生產該訂單需求,流程使用了一個業務規則任務,在該任務“需求”和“供應量”兩個數據對象中計算是否具有生產能力。這個任務鏈接到一個DMN決策表中,在這個表中,“生產能力”由“需求”和“供應量”兩個數據對象共同決定。如果不具備生產能力,則直接結束該流程;當具備生產能力時,當前的流程中會生成貨物的具體信息(即“貨物”數據對象)傳輸給“計算運費”這一決策活動。該決策活動中又包括兩個子決策活動分別鏈接到DMN決策表上,需要注意的是,當訂單的數量超過2 500個時,在決策表中未定義,即超出了公司的配送能力,將不再配送,直接結束該流程。

為說明偏離活動e的有效預期行為,表1展示了動機案例中三個顧客的訂單細節。例如偏離活動A的預期行為EB={C,D,E},下面分別說明三個執行跡中偏離活動A的有效預期行為。

定義10? 有效預期行為。設σ是一條跡,e是σ對齊中發生日志移動的第一個偏離事件,σ′是σ在e之前的跡,D(e)是受e所影響的所有數據項的集合,R是DMN決策表中的業務規則,那么偏離活動e的預期行為集合為EEB(e,σ′)={e|e∈EB∩InFacet(r|d∈D(e)=true)}。

由表1可知,訂單Mike執行跡中的偏離活動A是由增加T2貨物類型800個所引起,由圖4中DBPMN模型的決策表可知,具備增加T2貨物類型800個的生產能力,由原來的送貨類型car轉為送貨類型truck并增加相應的運費,因此該偏離活動A的有效預期行為EEB(A,σ′)={C,D,E}。訂單Sue執行跡中的偏離活動A是由增加T3貨物類型400個所引起,由圖4中DBPMN模型的決策表可知,不具備增加T3貨物類型400個的生產能力,因此該偏離活動A的有效預期行為EEB(A,σ′)={}。訂單Tom執行跡中的偏離活動A是由增加T1貨物類型400個所引起,由圖4中DBPMN模型的決策表可知,具備增加T1貨物類型400個的生產能力,但此送貨類型沒有發生改變,無須重新支付其運費,因此該偏離活動A的有效預期行為EEB(A,σ′)={C,D}。

算法2展示了發生異步移動的偏差活動e的有效預期行為上下文檢索的過程。

算法2? 檢索偏差活動e的有效預期行為

輸入:過程模型Petri網N=(P,T,F,α,MI,MF),偏離活動e的預期行為EBS。

輸出:按流程發生順序排序的預期行為集EEBS。

EEBS=;i=1;

while i≤|EBS| do

for Π(EBS)=ei do//對于每個偏差活動e所對應的預期行為集

if InFacet(Rd∈DataItemSet(ei))=false then

EEBS←EBS-Π(EBS(ei)); /*如果異?;顒觘i的預期行為使網關決策為假,則從EBS中刪除該行為,并將其值分配給EEBS*/

return EEBS.

4.3? 有效一致性檢查方法

模型的有效一致性檢測方法是基于偏離活動e的有效預期行為集EEBS以及跡σ的對齊γ來修改最初的最優對齊。該方法在給定的對齊當中一步一步地執行,每當該方法發現與流程模型不一致的行為時,首先會去有效預期行為集中尋找是否有該活動,如果有,就將此活動標記為正常的活動,用ρ表示,并將該活動在EEBS中刪除;如果沒有,就利用算法1和2尋找該偏離活動的有效預期行為集。算法3展示了有效一致性檢測方法的一般過程。

算法3? 有效一致性檢查方法——有效對齊DICC

輸入:跡σ的對齊γ,偏離活動e的有效預期行為集EEBS。

輸出:跡σ的有效對齊γ′,未執行的有效預期活動NE。

NE=;γ′=γ;

while i≤|σ| do

if m.e=>> or m.a=>> do

EEBS←Π(EEBS(ei))

γ′[i]=ρ/*當出現對齊不一致的情況時,并且偏差活動e的有效行為集中包含這些偏差活動,那么就把該偏差活動標記成ρ*/? NE←EEBS-Π(EEBS(ei)) /*將有效預期行為集中已經執行過的行為刪除并將最集合賦值給NE*/

else

return {}

for m=(e,a)∈γ do

if m.e=m.a and m.a∈NE do

NE←NE-{m.a};/*當活動是同步移動時,將此活動從NE中刪除*/

return γ′, NE.

圖5展示了在圖3中三個顧客執行跡對齊的基礎上的有效對齊。其中,在跡σMike中,由于活動C、D、E是偏離活動A的有效預期行為,所以活動CDE被標記為正?;顒?;在跡σSue中,由于偏離活動A沒有有效預期行為,所以偏離的活動不做任何標記;在跡σTom中,由于偏離活動A的有效預期行為是CD,所以CD被標記為正?;顒?,而活動E則不作任何標記。在該例子中,沒有體現在實際執行活動中存在而不在跡σ中存在的活動,如果出現這樣的情況,要將其看成偏差,由此本文將EEBS中未執行的活動的成本函數值設為ζ。

由圖5可以得到,σMike的擬合度由原來的0.64提升到現在的0.91,σSue的擬合度保持不變,σTom的擬合度由原來的0.64提升到現在的0.82,這意味著不同于基于標準對齊的一致性檢查技術,因此該有效一致性檢查方法更符合實際情況。

1234567891011fitness

σMikeABCDEACDEFG

MABCDE>>ρρρFG0.91

σSueABCDEACDFG

MABCDE>>>>>>FG0.7

σTomABCDEACDEFG

MABCDE>>ρρ>>FG0.82

前文中提出了數據影響的行為集,為了量化擬合度計算公式,定義了以下三種數據對各種偏差影響的成本值:

a)數據對控制流的影響。流程模型中的數據更改可能會影響流程模型的后續行為,甚至會改變其預期行為的發生,因此本文定義了發生在控制流上的偏差成本值,如式(2)所示,其中tlog move和tmod move表示業務流程模型中發生的日志移動和模型移動的活動。

Costdata-control=∑tlog move+∑tmod move(2)

b)數據對數據流的影響。在流程模型中,數據和數據之間的依賴關系以及因偏差活動而產生的錯誤數據都會影響業務流程的執行,這類偏差的成本值如式(3)所示,其中tdatamis表示因錯誤數據而發生的偏差活動。

Costdata-data=∑tdatamis(3)

c)數據對網關決策的影響。在流程模型中因數據的變化可能會導致某些網關的決策受到影響,從而產生錯誤的活動,這類偏差的成本值如式(4)所示,其中tdecisionmis表示因決策錯誤而發生的偏差活動。

Costdata-decision=∑tdecisionmis(4)

綜上,業務流程中總偏差的成本值如式(5)所示,其中∑tdecisionmis表示在EEBS集合中被標記為正?;顒拥某杀局?。

CostDICC=Costdata-control+Costdata-data+Costdata-decision-CostEEBS-logmod move+2ζ(5)

因此,擬合度公式如式(6)所示,Costempty表示跡σ中的所有活動與空跡的對齊,即該跡的最大成本花費。

fitness=1-costDICCcostempty(6)

5? 實驗評估及分析

5.1? 實驗設置

由本文給出的算法以及給定事件日志中的跡與過程模型,尋找偏差活動的有效預期行為集是本文方法的核心思想。本節給出一些實驗結果來評價本文的方法(簡記DICC),并與已有的一致性檢查方法(簡記ME1[22]和ME2[23])進行比較。DICC方法的具體實現步驟包括:a)通過Inductive Miner挖掘算法從數據集中挖掘到合適的過程模型,該模型用Petri網表示;b)利用已有算法將過程模型和事件流作為輸入,得到基于控制流的最優對齊;c)將Petri網模型轉換為BPMN模型作為核心算法的輸入,并顯示對比結果。

本節進行了兩組實驗分析,第一組實驗使用人工事件日志模型進行仿真分析,以顯示本文方法的準確性和合理性以及比已有的一致性檢查方法的優越性;第二組實驗使用來自Conformance Checking Challenge 2019 (CCC19)[24]的真實案例數據集來評估本文方法,以顯示本文方法的可用性和適應性。為簡單起見,將在4.3節中定義的成本函數值都設為1。

5.2? 人工日志模型仿真實驗分析

本節使用PLG 2.0軟件生成的人工事件日志模型進行仿真分析。該人工日志模型是關于網上購物業務流程,總共包括22個變遷節點以及工作流網的四種基本結構,即順序結構、并行結構、循環結構及選擇結構,因此使用本文模型不會影響本文方法的通用性。

本實驗所使用的事件日志是PLG軟件隨機生成的事件日志,共15個事件日志。為了模擬該模型真實的業務流程實例異常情況的發生,本實驗將這15條日志分別注入不同百分比的不同噪聲(doubled event和integer data object change),即在log1~log5中分別注入5%、10%和15%的doubled event噪聲,共15個異常事件日志;在log6~log10中分別注入5%、10%和15%的integer data object change噪聲,共15個異常事件日志;在log11~log15中分別注入5%、10%和15%的doubled event噪聲及5%、10%和15%的integer data object change噪聲,共15個異常事件日志。一共45個事件日志,其具體信息如表2所示。

本實驗比較了DICC方法和ME1、ME2方法分別在log1~log15及噪聲程度為5%、10%及15%下的平均跡服從度。實驗統計結果分別如圖6~8所示。

從圖6中可以看到DICC方法與其他兩種方法的擬合度不相上下,甚至在有些日志規模下擬合度低于其他兩種方法,這是因為當DICC方法將偏差活動根據已有的數據生成了有效預期行為集,但是在最后進行標記的時候由于插入了重復活動事件,導致EEBS中的活動剩余過多,帶來了成本花費。從圖6中還可以看到ME2的方法比ME1的方法擬合度要高,但在圖7和8中,ME2的方法比ME1的方法擬合度要低,這可能是因為ME2對于數據錯誤的偏差可能更加敏感。觀察圖6(c)、圖7(c)及圖8(c),向日志中插入相同百分比的不同噪聲,可以看到當加入數據時,DICC方法比ME1和ME2方法擬合度表現得要好,這是因為當插入額外的數據元素時,DICC方法會根據額外的數據規定EEBS集合,將部分偏差活動標記為正常。

5.3? 真實實例日志模型實驗分析

一致性檢查是觀察已發生的行為和流程模型之間進行各種分析的基礎,而基于數據影響的一致性檢查分析能夠更好地將已發生的行為與流程模型之間進行校準。本節將使用來自CCC19[24]的真實數據集來驗證DICC方法在處理更為復雜的事件案例時所具有的可用性和適用性。經過預處理后,該數據集共包括29個活動、697個事件及20個事件跡。實驗結果如圖9所示。

通過圖9可以了解到在這20條事件序列中,其中有4條事件序列的擬合度幾乎一樣,這是因為這4條事件序列中的活動比較少,其中還有3條事件序列DICC方法檢測出來的擬合度比ME1和ME2方法要低,這是因為這3條事件序列中的重復事件太多,導致DICC方法中EEBS集合活動過剩。整體上,DICC的方法要比ME1和ME2有著更高的擬合度。

綜上表明,基于數據影響的一致性檢查方法具有較高的跡擬合度,因為在流程模型中不可或缺地會有數據的改變,這會影響后續行為的發生。本文方法將這些因為有效數據的更改將后續發生的行為納入有效預期行為集后再進行分析,就可以保證把那些符合實際情況的偏差行為標記成正常行為。

6? 結束語

一致性檢查可以分析流程模型中的預期行為與事件日志中記錄的實際行為之間的差異,因此在進行業務流程模型修復、精確度檢查、審計等方面具有重要作用。本文提出一種基于數據影響的一致性檢查技術,首先使用挖掘算法獲取BPMN模型,接著考慮模型中數據與數據、數據與活動之間的依賴關系,尋找因數據的改變而影響的行為集合,此后引入DMN決策表,并考慮數據與控制決策之間的關系,將先前生成的預期行為集進行篩選,得到用于進行一致性分析的有效數據預期行為集,這樣就可以在確保數據流正確的前提下,考慮數據對業務流程預期行為帶來的影響。實驗結果表明,本文方法具有一定的準確性、合理性、可用性和適應性。在未來的研究中,將進一步優化數據對不用種類偏差影響的花費成本,并將有效預期行為集中的活動進行更加細粒度的分析。

參考文獻:

[1]Van Der Aalst W M P, Stahl C. Modeling business processes: a Petri net-oriented approach[M]. Cambridge, MA: MIT Press, 2011.

[2]Reichert M, Weber B. Enabling flexibility in process-aware information systems: challenges, methods, technologies[M]. Berlin: Springer, 2012.

[3]Van Der Aalst W M P, Weijters T, Maruster L. Workflow mining: discovering process models from event logs[J]. IEEE Trans on Knowledge and Data Engineering, 2004,16(9):1128-1142.

[4]Dunzer S,Stierle M,Matzner M,et al. Conformance checking:a state-of-the-art literature review[C]//Proc of the 11th International Confe-rence on Subject-Oriented Business Process Management. New York: ACM Press, 2019: article No.4.

[5]Bhattacharya K, Hull R, Su J. A data-centric design methodology for business processes[M]//Handbook of Research on Business Process Modeling. Hershey: IGI Global, 2009: 503-531.

[6]Sadiq S, Orlowska M, Sadiq W, et al. Data flow and validation in workflow modelling[C]//Proc of the 15th Australasian Database Conference. Darlinghurst: Australian Computer Society Inc., 2004: 207-214.

[7]Pérez-álvarez J M, Gómez-López M T, Eshuis R, et al. Verifying the manipulation of data objects according to business process and data models[J]. Knowledge and Information Systems, 2020,62(7): 2653-2683.

[8]Bruno G. Business process models and entity life cycles[J]. International Journal of Information Systems and Project Management, 2019,7(3): article No.5.

[9]Meyer A, Pufahl L, Fahland D, et al. Modeling and enacting complex data dependencies in business processes[C]//Proc of the 11th International Conference on Business Process Management. Berlin: Springer, 2013: 171-186.

[10]Tsoury A, Soffer P, Reinhartz-Berger I. Data impact analysis in business processes: automatic support and practical implications[J]. Business & Information Systems Engineering, 2020,62(2):41-60.

[11]De Leoni M,Felli P,Montali M. Integrating BPMN and DMN:modeling and analysis[J]. Journal on Data Semantics, 2021,10(6):165-188.

[12]Nagy Z, Werner-Stark A. An alignment-based multi-perspective online conformance checking technique[J]. Acta Polytechnica Hungarica,2022,19(4):105-127.

[13]Richter F, Sontheim J, Zellner L, et al. TADE: stochastic confor-mance checking using temporal activity density estimation[C]//Proc of the 18th International Conference on Business Process Management. Berlin: Springer, 2020: 220-236.

[14]De Leoni M, Van Der Aalst W M P. Aligning event logs and process models for multi-perspective conformance checking: an approach based on integer linear programming[C]//Proc of the 11th International Conference on Business Process Management. Berlin: Sprin-ger, 2013: 113-129.

[15]Mannhardt F, De Leoni M, Reijers H A, et al. Balanced multi-perspective checking of process conformance[J]. Computing, 2016,98(4): 407-437.

[16]Zhang Sicui, Genga L, Dekker L, et al. Fuzzy multi-perspective conformance checking for business processes[J]. Applied Soft Computing, 2022,130(11): 109710.

[17]Tsoury A, Soffer P, Reinhartz-Berger I. How well did it recover? Impact-aware conformance checking[J]. Computing, 2021,103(1): 3-27.

[18]Tsoury A, Soffer P, Reinhartz-Berger I. Towards impact analysis of data in business processes[C]//Proc of the 17th International Confe-rence on Business-Process and Information Systems Modeling. Cham: Springer, 2016: 125-140.

[19]田銀花, 杜玉越, 韓咚, 等. 基于Petri網的批量跡與過程模型校準[J]. 計算機學報, 2018,41(3): 611-627. (Tian Yinhua, Du Yuyue, Han Dong, et al. Alignments between batch traces and process models based on Petri nets[J]. Chinese Journal of Computers, 2018,41(3): 611-627.)

[20]Agarwal P, Gao Buyu, Huo Siyu, et al. A process-aware decision support system for business processes[C]//Proc of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2022: 2673-2681.

[21]張力雯, 方賢文. 基于對齊處理與偏差檢測的業務流程適合度分析[J]. 計算機集成制造系統, 2020,26(6): 1573-1581. (Zhang Liwen, Fang Xianwen. Business process fitness analysis based on alignment processing and deviation detection[J]. Computer Integrated Manufacturing System, 2020,26(6): 1573-1581.)

[22]Lee W L J, Verbeek H M W, Munoz-Gama J, et al. Recomposing conformance: closing the circle on decomposed alignment-based conformance checking in process mining[J]. Information Sciences, 2018,466(10): 55-91.

[23]Bergami G, Maggi F M, Marrella A, et al. Aligning data-aware declarative process models and event logs[C]//Proc of the 19th International Conference on Business Process Management. Berlin: Springer, 2021: 235-251.

[24]Munoz-Gama J, De La Fuente R, Sepúlveda M, et al. Conformance checking challenge 2019 (CCC19)[DB/OL]. (2019-02-14). https://icpmconference.org/2019/icpm-2019/contests-challenges/1st-conformance-checking-challenge-2019-ccc19/.

猜你喜歡
業務流程
航天企業基于信息化的業務流程體系構建方法研究
ERP系統在企業財務管理和業務流程管理中的應用
高速公路智慧收費系統業務流程探討
RPA機器人助業務流程智能化
STK業務流程優化的探究
企業財務管理、業務流程管理中整合ERP之探索
互聯網+背景下物流公司的業務流程再造
建設項目全過程造價管理咨詢服務的業務流程分析
基于財務業務流程再造的ERP信息系統構建探析
淺述供電局營銷業務流程優化
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合