?

基于貝葉斯網絡的老年綜合評估過程簡化方法

2022-12-24 12:37李關東鄒函怡王藝樺許楊孫怡寧馬祖長高理升
北京生物醫學工程 2022年6期
關鍵詞:題項結點貝葉斯

李關東 鄒函怡 王藝樺 許楊 孫怡寧 馬祖長 高理升

0 引言

當前,我國人口老齡化進程顯著加劇。第七次全國人口普查數據顯示,我國60歲及以上人口有26 402萬人,占總人口的18.70%,與第六次普查數據相比上升5.44%[1]。人口老齡化將增加家庭養老負擔,并帶來基本公共服務供給的壓力。為積極應對老齡化,2019年國務院頒發了《關于推進養老服務發展的意見》,文件中明確指出,通過政府購買服務,統一開展老年人能力綜合評估,并將評估結果作為領取補貼、接受養老服務的依據[2]。因此,發展適宜在社區大規模推廣開展的老年綜合評估方法具有緊迫而重要的實際意義。

老年綜合評估(comprehensive geriatric assessment,CGA)是指采用多學科方法評估老年人的軀體情況、功能狀態、心理健康和社會環境狀況等,并據此制訂以維持及改善老年人健康和功能狀態為目的的治療計劃,最大程度地提高老年人的生活質量[3]。目前CGA主要分為綜合評估測量和單項評估累計測量[4]。綜合評估工具內容繁雜,評估耗時耗力,難以普及使用。單項評估工具在單一維度評估中準確便捷,但累計多項工具評估同樣喪失其簡捷性。評估過程冗長繁瑣易引起老人的煩躁情緒,進而影響評估結果的準確性,難以在社區開展大面積篩查評估工作[5]。

為解決上述問題,學者們使用多種方法對問卷內容進行簡化。李苗苗等[5]通過文獻分析和專家會議法初步設計CGA指標體系框架和快速篩查條目,并采用Delphi專家函詢法進一步修訂,最終構建CGA快速篩查指標體系,相較傳統綜合評估量表,問題數明顯減少。Tai等[6]首先通過ROC曲線和約登指數確定軀體功能截斷值,再使用逐步logistic回歸篩選老年綜合征的危險因素,最后根據分析結果從常用CGA工具中篩選題項,最終形成簡明綜合評估工具。這些研究使用專家知識或者統計學方法,通過直接刪減部分問題達到了簡化量表的目的。然而,刪減問題將會影響量表的準確性[7]。評估過程中準確性和便捷性不可兼得的問題難以解決。

隨著計算機技術的發展,有學者嘗試使用智能化方法輔助簡化CGA流程。Daniel等[8]通過推導的分支規則構建了可應用于老年綜合評估的數據挖掘算法,但該方法僅適用于二元問題,具有較大局限性。Mo等[7]基于提出的影響力算法構建了快速前向問卷模型(fast preceding questionnaire model,FPQM),該模型對問卷問題進行預測與重排序。該方法在保證問卷結構完整的前提下減少了調查題項。但模型空間占用量巨大,不利于推廣使用;此外模型的準確性仍有提升空間。

貝葉斯網絡是一種表示不確定性信息的概率圖模型,它一方面直觀易懂[9],方便學者交流和建模,另一方面又具備嚴格的數學證明,適合計算機處理[10],被認為是人工智能領域最重要的研究成果之一。Aburai等[11]對富士商業街居民和游客的需求進行問卷調查,利用貝葉斯網絡獨特的可視化能力和概率推理能力,分析問卷題項之間的因果關系,并對潛在游客進行預測估計,為構建更有效實用的規劃建筑提供了參考依據。貝葉斯網絡可推理問卷問題的回答,基于此特性便可進一步實現簡化評估過程的目的。

本文利用貝葉斯網絡發掘問卷題項間的關聯,并提出一種用于CGA的問卷調查算法,以解決評估過程中準確性和便捷性不可兼得的問題,并與前文所述的FPQM進行比較分析,探究該方法在簡化CGA中的應用價值,為普及社區CGA工作提供一種可行的技術手段。

1 實驗數據與預處理

1.1 實驗數據

本研究數據來源于北京大學健康老齡與發展研究中心[12]組織的中國老年健康影響因素跟蹤調查(Chinese Longitudinal Healthy Longevity Survey,CLHLS),在全國23個省(自治區、直轄市)隨機抽取約一半的縣市,前后總共進行了8次跟蹤調查。該調查數據質量經過評估得到國內外學者普遍認可,已成為學界公認類似調研中數據信息十分豐富和研究潛力巨大的交叉學科研究項目。該調查對象為65歲及以上老人,調查內容包括了老人生理心理健康、認知功能、社會參與、社會經濟狀況、生活習慣等。

1.2 數據預處理

本研究采用2018年橫斷面調查數據,該數據包含15 874例數據。以CGA中國專家共識[3]和民政部2013年頒布的老年人能力評估標準[13]為指導,CGA主要包含日常生活活動能力、精神狀態、心理健康、感知覺等維度,本研究據此篩選數據集中與CGA內容相關的49項題目,并對回答缺失或無效的樣本進行剔除,最后隨機抽取其中958例數據用于構建模型和性能測試。認知功能題項中的反應能力、計算能力、記憶力和語言理解中題目有順序要求,應分別當作整體進行評估,因此分別對相應題目進行計分并作為單變量輸入,最終輸入屬性為38個,詳細內容如表1所示。

表1 問卷題項內容Table 1 Questionnaire items

2 算法設計及評價方法

2.1 問卷模型構建

本研究首先通過貝葉斯網絡發掘并計算問卷題項之間的關系,并以此構建問卷模型。其中度量問卷題項間的關系對應結構學習過程,計算屬性間關聯強度對應參數學習過程。

基于評分搜索的結構學習[14]將在所有可能存在的結構Gn中尋找一個評分最高的結構G*,評分函數用以度量搜索空間中每個結構與樣本數據的擬合程度。以BIC評分函數為例,其評分函數主要基于信息論的最小描述長度(minimum description length,MDL)原理實現,該評分準則將在網絡精度與復雜度之間尋找一個平衡點。

基于貝葉斯估計的參數學習[15]先將待估條件概率表參數Θ視為隨機變量,并將關于Θ的先驗知識表示為先驗概率分布,在觀測到前l個樣本的完整數據后,計算Θ的后驗概率分布以及下一個樣本Dl+1的概率分布。

2.2 問卷調查算法

本研究提出一種基于貝葉斯網絡的問卷調查算法,其可抽象為遍歷網絡結構G,通過實際問詢或者推理計算獲取每個屬性的取值。算法的流程如圖 1所示,主要步驟如下。

(1) 對于貝葉斯網絡結構G= (V,E),首先對V按入度從小到大進行排序,優先選擇從入度較小的結點開始遍歷。

(2) 已遍歷結點取值作為證據集,推理當前訪問結點的所有取值的概率P,選取其中最大值與輸入的超參數閾值σ進行比較,如果P≥σ,則該結點通過推理計算預測取值,否則通過實際問詢老人得到回答,同時將取值加入證據集。

(3) 繼續遍歷剩余結點并執行步驟(2),直到所有結點訪問完畢,獲得最終調查結果。

由于貝葉斯網絡支持多種推理類型,因此結構G的遍歷可以選擇如下4種方式。

(1) 單向深度優先搜索(DFS):從一個結點V0開始,先訪問其中一個子結點V1,再從V1開始訪問它的子結點,重復上述過程直到結點全部被訪問。

(2) 單向廣度優先搜索(BFS):從一個結點V0開始,先訪問它所有的子結點{Vchild},之后再依次訪問{Vchild}的子結點,重復上述過程,直到結點全部被訪問。

(3) 雙向DFS:從一個結點V0開始,先訪問其中一個子結點或父結點V1,再從V1開始訪問它的子結點或父結點,重復上述過程直到結點全部被訪問。

(4) 雙向BFS:從一個結點V0開始,先訪問它所有的子結點和父結點{Vchild,Vparent},之后再依次訪問{Vchild,Vparent}的父子結點,重復上述過程,直到結點全部被訪問。

圖1 算法流程圖Figure 1 Flowchart of the algorithm

2.3 算法評價指標

本算法目的為同時保證評估過程的準確性和簡捷性,因此評價指標主要由準確率和簡化率構成。涉及的定義如下:個體準確率表示正確預測的問題在所有預測問題中的占比,平均準確率(average accuracy rate,AAR)是數據集中所有個體準確率的算術平均數,評價算法整體準確率。

(1)

式中:m表示測試集樣本容量;Cij為第i個個體的第j個問題的預測正誤標記,預測正確為1,否則為0;Iij為第i個個體的第j個問題的預測標記,成功預測為1,否則為0。

個體簡化率表示預測的問題在問卷中的占比,平均簡化率(average reduction rate,ARR)是數據集中所有個體簡化率的算術平均數,評價算法整體簡化率。

(2)

式中:n表示問卷問題數。

AFβ綜合考慮平均準確率和平均簡化率兩個指標,用于評價算法的性能。

(3)

式中:β為設定參數,可根據實際需要對準確率和簡化率的權重進行調整。AFβ越大表示算法的性能越高。當Iij= 0時,ARR=0,AAR=1恒成立;則AFβ=0。當Iij= 1時,ARR=1恒成立;則AFβ和ARR都會很低。因此需要選取合適的Iij使AFβ最大,Iij取決于閾值σ與遍歷模式。

2.4 試驗流程

將抽取的958例數據按7:3的比例劃分訓練集和測試集,其中訓練集用于構建貝葉斯網絡,測試集用于評價算法性能。貝葉斯網絡基于Python的pgmpy庫實現,pgmpy庫完全使用Python語言實現貝葉斯網絡,支持多種結構學習、參數學習和推理算法。

3 實驗結果

3.1 實驗環境及參數設計

本實驗在PyCharm 2021.2.1中編寫程序并運行。試驗硬件配置:CPU為AMD Ryzen 5 3500U @ 2.10 GHz,內存為20.0 GB,操作系統為Windows 10。

本實驗使用爬山法對貝葉斯網絡結構進行搜索,并通過BIC評分函數篩選最優網絡結構。采用貝葉斯估計進行模型參數學習,使用變量消元法對屬性進行精確推理。在評價指標中,設置AFβ的β=0.5,表示準確率重要程度為簡化率的2倍。調查算法中的超參數閾值σ從0.95開始以0.05為單位依次減小進行試驗,每種閾值條件下分別進行4次不同遍歷模式的試驗,最終選取AFβ最高的參數組合作為最優參數。

3.2 貝葉斯網絡結構

通過訓練集學習得到的貝葉斯網絡結構,使用Netica軟件對其進行可視化展示,由于網絡結構復雜,本文僅以部分結點為示例,如圖 2所示。每個結點即一個問題,網絡同時存儲每個選項出現的概率,結點之間通過有向邊連接,表示存在依賴關系。調查開始時,算法從上到下依次執行搜索策略,當任意一個問題的回答確定后,網絡將及時自動更新其他問題選項的概率。在積累足夠信息后,算法便可推斷一些問題的回答,否則繼續直接問詢獲取回答。

3.3 算法驗證分析

在958例數據中隨機選取30%的數據即288例構建測試集,對設計的算法進行驗證分析。對比輸入不同的閾值σ和遍歷模式下的評價指標,分別選取單項指標最高的參數組合進行展示,如表 2所示。結果顯示,當閾值σ≤0.2時,無論何種遍歷模式,都能獲得最高的平均簡化率,可達0.92,但準確性較差;當閾值σ取最高的0.95時,單雙向BFS遍歷模式都能獲得最高的平均準確率,可達0.98,但簡化率很低。這符合認知,當閾值過低時,即使出現概率較低也會被直接預測,因此大部分問題都不會被問詢,但這樣的預測結果并不可信;當閾值很高時,預測的問題可信度很高,但大部分問題都不會被預測。因此,考慮算法的綜合性能,應該在這兩個數值之間尋找平衡,本試驗的結果是σ= 0.7時,無論何種遍歷模式,都能獲得最高的AFβ,可達0.85,此時綜合性能最佳。遍歷模式在相同閾值的條件下對試驗結果影響不大,說明無論模型采用何種推理方式,均能得到較一致的結果。

圖2 貝葉斯網絡結構示意圖Figure 2 Structure diagram of Bayesian network structure

表2 不同參數組合的性能Table 2 Performance of different parameter combinations

進一步,算法性能隨閾值σ的變化如圖 3所示,平均簡化率從閾值σ= 0.4開始,隨閾值σ的增加快速下降,相反,平均準確率從閾值σ= 0.4開始,隨閾值σ的增加快速上升,而AFβ從σ= 0.4開始先是不斷上升,在σ= 0.7達到最高點,之后開始下降,整體波動幅度較小。因此,權衡準確率和簡化率后,σ= 0.7可作為本實驗的最優參數。

圖3 算法性能隨閾值σ增加的變化Figure 3 Performance with increasing threshold σ

3.4 算法性能比較

為進一步驗證本研究算法的性能,將與其他算法進行對比。調研發現,現有公開報道中有關老年綜合能力評估的智能算法較少,本文采用其中較有代表性的FPQM[7]作為對比。與本研究算法類似,FPQM同樣需要輸入一個閾值參數σ對性能進行調試,因此對閾值σ從0.95開始以0.05為單位依次減小進行實驗。各項指標峰值及模型存儲大小對比結果如表3所示。結果表明,本研究算法在最高準確率和綜合性能上明顯高于FPQM,同時在空間占用上大幅減小,在最高簡化率上雖低于FPQM但差距不大。

表3 不同算法的性能比較Table 3 Performance comparison of different algorithms

4 討論

本研究表明,基于貝葉斯網絡的老年綜合評估過程簡化方法相較先前的FPQM綜合性能更好,準確率更高,同時節省數萬倍的存儲空間,在運行時能更加高效地加載訓練好的模型到內存中,適合大面積綜合評估的應用場景。

目前CGA普遍采用量表、問卷調查的方式進行評估[4],量表題項都是經過復雜流程挑選得到的,題項之間既存在關聯,也存在獨立的情況[16]。因此,通過刪減題項的方式將會降低評估的準確性。量表的題項以單選題為主[17],少部分多選題可以通過計分方式轉化為單選題,這些題項均可作為離散屬性變量輸入計算機處理。通過部分問題回答去預測其他問題回答,屬于多維分類問題,與傳統分類問題不同,這是一個前沿課題[18]。

FPQM基于一階依賴的假設,解釋了部分屬性間的真實關系。一階依賴假設過于理想,本研究考慮基于高階依賴的思想可以更完整地解釋屬性間關系,進一步提升算法的泛化性能[19]。真實問卷中題項間會呈現網狀關系,以圖結構表示題項之間的關系更加貼近實際。貝葉斯網絡以圖為基礎結構表達屬性間的關聯,并通過概率計算具體量化屬性間的關聯強度。表 4列出了貝葉斯網絡與FPQM原理的比較?;谪惾~斯網絡的問卷調查算法通過預測部分回答的方式在不刪減題項的前提下減少了問詢問題數,達到了簡化評估過程的目的。

CGA主要通過問卷得分劃分老人能力等級,因此只要最終得分在同一等級范圍內,即使該算法不能達到100%的準確率,個別問題的失真對最后分級結果的影響也在可控范圍內,因此本研究提出的算法能夠在保證結果準確的同時實現簡化評估的效果。CGA分級結果的驗證將在后續研究中進一步實現。在本研究結果中,最優參數組合的平均簡化率達0.75以上,這表示問卷調查的工作量可以節省到原先的25%,具有顯著的簡化效果。

表4 不同模型的原理比較Table 4 Comparison of principles between different models

本研究通過訓練數據集得到的貝葉斯網絡,提出了一種老年綜合評估過程簡化方法,經測試集驗證該方法優于其他類似應用的算法。該方法同樣可應用于任何不同的問卷評估流程,解決調查過程中全面準確和簡捷不可兼得的問題。此外,也可基于該方法設計老人自助評估流程;數據分析者也可利用該方法對缺失數據進行補全。本研究后續將考慮納入個人基本信息、各項客觀指標等更多元的屬性變量,并嘗試更多的建模方法對性能進行測試,對算法綜合性能進行進一步優化。同時,以本算法為核心開發的智能化老年綜合評估系統終端設備目前正在研制過程中。

5 結論

本研究針對CGA準確性與便捷性不可兼得的問題,基于貝葉斯網絡提出了一種老年綜合評估過程簡化方法,通過測試數據集初步驗證,平均準確率為0.983 6,AFβ為0.849 9,占用空間23 kB,均明顯優于已報道的簡化算法。在當前老齡化日益嚴峻背景下,該方法對于基層社區和養老機構提升CGA工作效率具有重要應用價值。

猜你喜歡
題項結點貝葉斯
LEACH 算法應用于礦井無線通信的路由算法研究
基于八數碼問題的搜索算法的研究
基于貝葉斯解釋回應被告人講述的故事
高職學生價值觀調查的研究變量的項目分析
基于貝葉斯估計的軌道占用識別方法
基于互信息的貝葉斯網絡結構學習
12題項一般健康問卷(GHQ-12)結構的多樣本分析
血管性認知功能障礙自我辨識篩查方案臨床驗證研究
IIRCT下負二項分布參數多變點的貝葉斯估計
社會體育需求自編問卷的項目分析及信效度檢驗
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合