?

基于深度學習的電子病歷醫療命名實體識別

2020-09-28 07:05阿依圖爾蓀·喀迪爾
電腦知識與技術 2020年16期
關鍵詞:電子病歷深度學習

阿依圖爾蓀·喀迪爾

摘要:電子病歷不僅對門診、住院患者治療具有指導與干預作用,更能以數字化形式呈現當前醫療服務內容與記錄,為患者提供更為高效的醫療服務。為進一步強化深度學習能力,提取有效醫療信息?;诖?,結合深度學習計算方式,對電子病歷醫療命名實體的識別工作進行分析,借助BP網絡構建基本數據模型,希望借助已標注病歷數據進行再次訓練與測試,強化電子病歷命名實體識別工作開展,為現代醫療服務提供精準服務。

關鍵詞:深度學習;電子病歷;命名實體識別

中圖分類號:TP393? ? ? 文獻標識碼:A

文章編號:1009-3044(2020)16-0195-03

隨著科技水準不斷攀升,醫療行業獲得全新發展契機,在醫療行業中,傳統病歷模式逐漸被優化為電子病歷。電子病歷集合計算機技術、智能產品,含有大量患者信息與專業醫療知識。對疾病治療與疾病分析具有重要關聯,對國內醫療水準提升具有積極作用。對命名實體識別進行分析,國外命名實體識別出現較早、相對成熟,具有良好監督與學習效果。對國內命名實體識別進行分析,國內起步相對較晚。但是,在科技迅速發展過程中,命名實體識別取得較好成果。為進一步提升命名實體識別能力,充分發揮電子病歷價值,本文結合深度學習中的LSTM與MLP對電子病歷進行基本識別,希望能夠進一步提升深度學習電子病歷識別有效性,為現代醫療服務發展做出重要貢獻。

1電子病歷醫療命名實體識別以及深度學習基本概述

1.1命名實體識別基本概述

對命名實體識別進行分析,命名實體識別具有信息提取、機器翻譯、句法分析作用,是現代應用領域重要部分。將其與電子病歷相結合,不僅能容納大量的人名、時間、地點與日期、百分比等,更能明確實體類別,解決醫院傳統病歷應用存在的問題。相對于英語的識別方式,在國內醫療電子病歷識別過程中,漢語識別難度更大。因此,應結合深度學習計算方式,構建專屬國內電子病歷實體識別方式,應用不同模型,提升電子病歷醫療命名實體識別能力,進一步推動現代醫療服務工作開展。

1.2深度學習基本概述

對深度學習進行分析,深度學習為一種機器學習方式,此種學習方式,在實際應用過程中,主要通過神經網絡加以實現,對“深度”一詞的解釋,可以將“深度”理解為不同的神經網絡分層,傳統的機器學習深度網絡多為2-3層,而深度學習網絡輻射廣,甚至可以達到成百上千層。深度學習方式,相對于單一的計算方式,此種計算方式更為準確、迅速,能夠在極短時間內處理大量數據信息,并得到精準數據結果。究其原因,主要源于深度學習集合大數據、強大的計算資源以及訓練模式。而CNN[1]作為深度學習中的基本圖像處理方式,也是較為常見的神經網絡,此種神經網絡具有較強的提取與分層能力,能夠進行重復提取,從而針對想要解決的問題,進行多次實驗。只要具有充分訓練時間,就能夠解決復雜問題,將邏輯不清晰、關系不明確問題進行分化,最終得到精準數據結果,為結論研究提供強有力數據支持。

2命名實體識別所應用的MLP、LSTM神經網絡計算方式

2.1 MLP神經網絡計算方式

MLP[2]為多層神經網絡簡稱,亦被稱之為人工神經網絡。MLP神經網絡包含多個節點,其中,以ANN結構為例,每個節點之間相互銜接。在不同階段的銜接部分,這些節點根據不同關系與全新,對偏置處加以關聯,從而解決一些特定問題。在此種應用過程中,應給予偏置開展特定訓練,并借助多個輸入與輸出層,構建完善神經網絡,從而對神經網絡內部多層信息以及隱藏內容加以識別。

2.2 LMTS神經網絡計算方式

對LMTS進行分析,此種方式,更是適合處理間隔時間較長的問題。在短期記憶網絡中,R為輸入層、輸出層以及隱藏層。其中,隱藏層主要借助RNN隱藏處理方式,對不同結構進行計算,并將得到的結果與新的數值一起作用于隱藏層,從而形成最終的輸出結構。在此項計算方式中,既能展現基本的RNN結構,又能對RNN結構進行改進。LSTM優化RNN結構,解決RNN依賴的問題,將歷史信息作為不同介質進行傳遞,確保數據傳遞過程不受任何因素影響,這也是LSTM計算重要內容。

3電子病歷醫療實體是被模型構建

對最初序列標注進行分析,最初的序列需要動手進行標注,不僅需要投入大量人力資源、投入較高成本,整體標注效率較低。因此,在不斷發展過程中,電子病歷中的標注工作逐漸引入神經網絡,對不同的特征進行選取,并將其作為輸入框架,構建基本識別模型。其中,輸入層最主要作用,就是將不同患者名稱、疾病名稱以及治療記錄輸入其中,與此同時,在輸入完成后,將每個輸入轉換為所對應的序號。而查找層可以通過ID轉換多為向量,在這一層進行查找工作,將每個索引作為多維向量。為了獲得更多上下關聯信息,應在字前以及字后,對不同向量進行拼接,從而為網絡層輸入工作奠定良好基礎。對命名實體識別網絡層加以分析,在命名實體識別網絡層中,主要應用LSTM與MLPS[3]神經網絡計算特征,輸入相關向量,并在不斷轉換過程中,對每一個輸出的內容進行標準與分類,從而實現電子病歷命名實體識別工作,在不同的計算方式與控制網格中,能夠根據維特比計算方式,得到最佳識別方式,獲得最終明確標注序列,并借助網絡層所提供的數據內容,獲得更為精準序列過程,獲得精準識別方式。

4基于深度學習的命名實體識別實驗

4.1訓練集

在命名實體識別中,所采取的方式主要為隔準訓練方法,為了進一步降低最小化帶來的函數損失,因此,在命名實體識別實驗中,應當結合最新計算方式,結合優化AdaGrad[4]算法,充分運用minibathc傳播方式,對傳播算法進行深入研究,獲得最終的bathc數值。

4.2實驗評價指標

要想更好地發揮命名實體識別效果,在實際工作中,應當以醫院內部病歷為主,對這些電子病歷進行實名標注,將其中的150分電子病歷作為訓練集,將50分作為測試級,并在實際的測試過程中,選擇適合本次測試框架結構,本文選擇谷歌提供的TensorFlow為主,選擇Python此類開發軟件,并選用Windows系統。在此次實驗中,以三個指標為衡量標準,分別為準確率、召回率以及F1數值,作為重要的衡量實體識別標志指標,實驗公式如下所示:

猜你喜歡
電子病歷深度學習
有體驗的學習才是有意義的學習
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合