?

面向電力行業計劃需求商務信息的智能審核體系架構研究

2023-08-31 12:14劉嫣然汪亦星
大眾標準化 2023年16期
關鍵詞:真值邏輯規則

劉嫣然,汪亦星,倪 穎

(國網江蘇省電力有限公司物資分公司,江蘇 南京 210000)

1 項目背景與需求

隨著信息網絡的快速發展和深入變革,以及全球化市場的形成,能源企業在產業數字化的過程中既面臨著發展的機遇,也面臨著嚴峻的挑戰。在此背景下,作為智慧供應鏈場景建設的重要組成部分——計劃需求的智能化管理成為了能源企業數字化改革的重中之重。計劃需求的智能化是將計劃需求的審查要素、審查規則、審查過程等內容實現自動化、智能化的管理。

事實上,在電力行業,傳統的計劃管理手段與現代信息技術的融合度不高,僅在部分環節利用輔助工具。李振偉等人在對人工智能技術與智能電網綜合應用的展望中提到采用人工智能技術對電網進行管理,有利于大幅度提高電網的管理效率。王巖通過采集項目計劃儲備庫數據,借助全文檢索技術、分詞技術等技術,將待評價項目計劃與歷史數據進行智能分析與對比,構建了基于智能審核的電力建設項目評價模型。袁彰提出了一種基于自然語言處理技術及成票規則的智能配網工作票系統,實現了工作票工作指令及安全措施的術語標準性、完整性檢查,從而提升了配網運行工作效率及保障電網安全穩定運行。

本項目針對需求計劃組成部分中,審核要點多、出錯率高、但結構相對固定的商務信息部分開展智能審查技術應用研究。探索基于多層次規則集的智能研判技術手段,對當前電網企業需求計劃審查規則體系的適用性,運用該技術將現有商務審核要點中的復雜邏輯轉化為可以計算機邏輯的可行性進行研究,進而明確實現需求計劃商務信息智能化審查的有效路徑以及可擴展應用的場景,推動需求計劃管理向數智化方向轉型發展,助力提升需求計劃管理質效。

2 需求計劃的特征分析

需求計劃的智能化審核首先需要明確需求數據的特征。以下將分別從體量、質量、數據表達等角度對需求計劃的數據特征展開解析。

從體量角度看,據統計,2021 年國網江蘇物資公司全年共開展331 個物資(服務)批次計劃審查工作,計劃總條目共計47 292 條,而在工作量逐年攀增的同時,計劃審查工作模式并未取得顯著的智能化發展,仍停留在基本依賴人工審查的模式,這使得計劃審查工作的效率和質量難以提升。

從質量要求角度看,主要是由于以下兩點導致:一是計劃條目多,審查任務重,在有限的審查會工作時間中難以逐點細致分析判斷;二是計劃審查要點邏輯復雜,主觀判斷規則多,且“資深”專家的“經驗判斷”很難向新專家傳授。因此,亟待探索一種適用于需求計劃審查體系的信息化智能審查技術,利用機器學習與數據科學工具的應用,實現計劃信息的智能自動校驗,為專家的人工審查提供智能化輔助方案,提升審查質效。

從數據表達角度看,根據《工程、服務類計劃審核作業指導書》的要求,商務部分共定義了23 條規則,包括:計劃批次規則、采購申請號規則等。目前,商務信息審查字段雖然已經做了結構化處理,但是結構化程度相對較低,只有招標金額、最高限價、概(預)算價、授權限額(萬元)、線路長度(千米)、變電容量(兆伏安)、標段工期字段采用數值型信息表達,在計劃開工日期和計劃完工日期采用了日期型信息表達,與開展智能判定所需要的結構化數據要求差距較遠。

2.1 規則體系與分類

基于對上述數據特征的解析,接下來將通過規則的設計和制定將文本解譯成規則體系。依據計劃需求中23 條商務信息審核規則,可定義成符號規則、真值規則、數據規則和復合規則,具體分類如下:

(1)符號規則:指基于特定符號體系的規則,這里的符號體系可以是人類語言的基礎原始符號集合(如數字、字母、羅馬字等),也可以是固定符號組合的集合。

例如:計劃需求的商務信息中A01 計劃批次規則要求:批次編號采用字母排序,如第3 批公開競爭性談判,批次編號為10216C 中的C,該規則屬于符號規則,其形式化表示方式通常為:

注意:為了表達基于時間或空間排列順序關系的規則,通常依賴于某一種或多種具有特異排序特征表達的符號序列。例如,英文字符集ABC 也可以看作是對數序字符集0~9 的擴展。

(2)真值規則:指基于條件屬性進行真值判定的規則,與數據規則類似,符合該規則的數據滿足邏輯計算的規則,即滿足各種布爾運算的規則。

例如:商務信息中A06 電壓等級(4)規則要求:非電力工程項目及非電氣性能試驗檢測填寫無電壓等級。這里的“非電力工程項目”和“非電氣性能試驗檢測”即為真值規則,即:

若定義a=“電力工程項目”,則^a=“非電力工程項目”;同理,若定義b=“電氣性能試驗檢測”,則^b=“非電氣性能試驗檢測”;則電壓等級c 可以形式化表達為:

其中∧即為布爾運算中的“與”運算,因此可見真值規則兼容布爾運算的規則。

真值規則的基本操作符有:“非”(not)、“與”(∧)、“或”(∨)、“條件”(→)。其中,“非”是一個一元操作符,它只操作一項(not P)。剩下的是二元操作符,操作兩項來組成復雜語句(P ∧ Q,P ∨ Q, P → Q)。真值規則的邏輯真值表如表1 所示。表1 中的T 表示真,F 表示假,亦可以使用二進制的1 和0 來表示。以上操作兼容所有編程語言,只是在不同語言中使用的邏輯運算符號不同。

表1 真值規則的邏輯真值表

(3)數據規則:指基于數學符號體系能符合計算特征的規則,符合該規則的數據視為符合滿足數學計算的規則,即滿足各種算術運算的規則。

例如:A10 概預算價規則中約定:審核填報金額,計價單位是元,概預算價應準確,不得與招標金額相差過大,一般不得小于招標金額(考慮到稅率的招標金額可適當高出概預算金額相應的稅率百分點,一般6%左右)。

由上可知,若定義Vg 為概預算價,招標金額為Vz,則以上規則可形式化表達為一個數學計算式,此處可以利用不等式來表達,即:

此處的“>=”“<=”和“×”即為初等數學中定義的有理數域上的比較和求乘積運算。本研究中,不再對這些規則做額外詳細定義。

(4)復合規則:指利用以上符號、真值及數據規則的多個混合組合才能約定的規則,基本組合關系包括但不限于非、與、或、異或等規則邏輯。符號規則兼容regex 標準支持所有主流編程語言,真值規則支撐的布爾運算雖然采用不同的符號體系,但也可以使用所有編程語言,數據規則的數學運算亦可以進行編程,因此復合規則的編程可實現性即規則邏輯的可實現性。

本研究中定義了三種復合規則邏輯,基本復合規則、模糊復合規則和智能復合規則。

基本復合規則使用文法系統約定的基本推導規則,該文法系統可以使用基于上下文無關文法的下推自動機實現。

模糊復合規則采用基于模糊集的推理規則,適用于模糊判定可以做出基本判定的場合。模糊推理系統基于用戶自定義的模糊隸屬函數以及模糊規則,將清晰的非模糊的原始輸入映射為模糊輸出集,然后對該模糊輸出集使用去模糊化方法得出一個清晰非模糊的輸出變量,一般為一個數字?;谠摂底?,模糊推理系統可以獲得專家的意見或者是用戶的主觀喜好,從而做出相應的決策。

智能復合規則采用基于深度學習技術的推理規則,適用于基于模糊集的規則判定亦不能保證判定結果的場合。深度學習神經網絡是一類包含卷積計算、以多層感知機為基本結構的深層神經網絡,它能學習數據的局部特征。深度學習神經網絡的核心在于卷積層和池化層的結構與參數設計,從而增加整個網絡對規則判定的非線性能力,貼近人的智能判定結果。

2.2 需求計劃商務信息的智能規則推理模糊化

規則的模糊化比對是商務信息智能推理的一個重要部分。以規則A03 為例,在該形式化規則中要求“審核項目名稱是否包含公司名稱、項目內容,避免出現‘××費用’‘合同’及投標人名稱?!苯Y合專家對該規則的解釋“項目名稱、工程名稱和標段名稱三個字段完全不一致需報警提示?!?,即智能推理可以歸納為要求判斷“項目名稱”“工程名稱”以及“招標項目標段名稱”這三個字段是否具有一定的相似性,如果相似性較低,則需要報警提示。

基于上述對規則的理解,在對該規則進行預判時,可以綜合使用編輯距離和模糊匹配方法。編輯距離是一種計算兩個字符串間的差異程度的度量方法,即兩個字符串在相互轉換時所包含的修改、插入、刪除等字符編輯的最少次數,其數學公式如下所示。

在借助編輯距離完 成三個字段的差異程度之后,形式化方法設計了如下的判斷規則用于相似度的模糊匹配。具體為:①如果三個字段中兩個字符串的邏輯距離在(0.8,1],則認為這兩個字段具有較高的相似度;②如果三個字段中兩個字符串的邏輯距離在(0.4,0.8),則認為這兩個字段具有部分相似度;③如果三個字段中兩個字符串的邏輯距離在[0,0.4],則認為這兩個字段具有較低的相似度。具體如下:

通過邏輯距離計算和相似度的模糊判斷完成規則A03 中“項目名稱”“工程名稱”以及“招標項目標段名稱”三個字段的規則形式化后,即可根據實際結果給出預警提示。

2.3 需求計劃商務信息的規則智能匹配

由于商務信息內容往往涉及相關技術文檔內容(比如技術規范書、工程量清單等)的綜合研讀,因此智能化推理同樣是商務信息形式化的重要研究內容。

在規則A05“國網物料編碼、擴展編碼”中,要求“物料編碼、擴展編碼”的選擇應與招標項目實施內容相對應??捎藐P鍵詞在辭條庫的擴展描述、擴展范圍中檢索,根據項目實際招標內容細致判斷所選辭條及擴展是否合適、正確。專家對該規則的二次解讀為:“根據‘工程規模與概況’和‘招標范圍’兩個字段的內容,反推‘國網物料編碼’和‘擴展編碼’是否正確?!?/p>

針對規則A05 的智能審查,首先需要借助自然語言處理中的分詞算法,將文檔內容中的詞組進行分解。分詞算法根據其核心思想主要分為兩種:基于字典的分詞和基于字的分詞?;谧值涞姆衷~是按照字典中詞組的固定搭配方式把語句進行切分;效果較好的序列標注模型是BiLSTM+CRF。借助分詞算法提取出項目內容信息,然后比對所提取的項目內容信息與擴展描述對應內容以及物料編碼、擴展編碼所代表的內容是否一致,綜合計算出兩者的相似度,并給出預警信息。

3 系統架構設計

需求計劃商務信息智能審核根據商務規則的不同特性,可以將審核規則分為符號規則、真值規則和數據規則三個基本類和復合規則類。利用形式化方法建立的規則體系也因審核要求復雜度的不同分為命題和邏輯匹配規則、模糊規則和深度學習規則三大類,其中命題和邏輯匹配規則可以利用基于文法自動機的匹配方法進行匹配,模糊規則可以利用基于模糊判定的匹配方法進行匹配,而深度學習規則體系需要利用基于深度學習技術的匹配方法進行匹配。架構設計方案從需求分析出發,設計了一套適用于現有一體化平臺的架構方案,并提供了核心算法的初步設計。方案整體設計如圖1 所示。

圖1 需求計劃商務規則智能識別技術體系

根據以上方案,整體系統架構以需求計劃商務規則的形式化結果為起點。第一部分,將命題規則體系和邏輯規則體系的需求計劃商務規則利用基于文法自動機的匹配方向進行智能審核,對現有系統進行升級,包括多列數據比較、單列數據的唯一性驗證、數據字典創建導入等。第二部分,引入第三方智能方案提供商(如百度智能、科大訊飛等)進行基礎能力升級,開發實現需求計劃智能審核模塊的智能化升級。

升級后的智能審核模塊,核心為智能規則集管理子系統,它負責所有智能規則的管理運行與部署;智能規則元素表示子系統提供規則所需的數據元素的互聯互通與表示;規則匹配API 接口子系統賦能計劃一體化平臺的計劃提報、計劃審核、規則管理等功能單元,并提供必要的算力支撐。

4 應用設計

4.1 智能審查技術在需求計劃審核中的應用

全省需求計劃審核工作采用地市內審與省公司集中審查相結合的方式,需求計劃數量多、專業繁雜,且不同類型的需求計劃管理要求不同,加上計劃提報時效性和準確率要求高,計劃專職及審查專家面臨繁重的工作任務和壓力。智能審核模塊的部署可以將全人工審核升級為智能化審核,智能審核應用于審前、審中和審后環節,由單一的人工審核變為在審核各環節均由智能審核模塊參與的“審算一體”模式,提高審核效率。

4.2 智能審查技術在需求計劃提報中的應用

需求計劃提報系統向各專業單位提供了提報需求計劃的功能,在需求提報的功能中,需求信息包括項目單位等三十余填報項目,但提供弱類型驗證(如項目單位、項目類型等被設置為必填)、填寫限制(如電壓等級為下拉選項)、部分自動填寫(如服務主數據與物料描述、服務擴展編碼、擴展描述等之間的關聯)。智能審核模塊在提報環節的應用是智能審核“審前”應用的延伸,目的在于最小化項目計劃中不符合審核規則的填報項,減少需求計劃的審核工作量,提高需求計劃的流轉速度,實現智能物流。

猜你喜歡
真值邏輯規則
刑事印證證明準確達成的邏輯反思
撐竿跳規則的制定
邏輯
創新的邏輯
數獨的規則和演變
讓規則不規則
女人買買買的神邏輯
10kV組合互感器誤差偏真值原因分析
TPP反腐敗規則對我國的啟示
真值限定的語言真值直覺模糊推理
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合