?

基于深度學習的電子病歷醫療命名實體識別

2020-09-28 07:05阿依圖爾蓀·喀迪爾

電腦知識與技術 2020年16期

關鍵詞：電子病歷深度學習

阿依圖爾蓀·喀迪爾

摘要：電子病歷不僅對門診、住院患者治療具有指導與干預作用，更能以數字化形式呈現當前醫療服務內容與記錄，為患者提供更為高效的醫療服務。為進一步強化深度學習能力，提取有效醫療信息?；诖?，結合深度學習計算方式，對電子病歷醫療命名實體的識別工作進行分析，借助BP網絡構建基本數據模型，希望借助已標注病歷數據進行再次訓練與測試，強化電子病歷命名實體識別工作開展，為現代醫療服務提供精準服務。

關鍵詞：深度學習;電子病歷;命名實體識別

中圖分類號：TP393? ? ? 文獻標識碼：A

文章編號：1009-3044（2020）16-0195-03

隨著科技水準不斷攀升，醫療行業獲得全新發展契機，在醫療行業中，傳統病歷模式逐漸被優化為電子病歷。電子病歷集合計算機技術、智能產品，含有大量患者信息與專業醫療知識。對疾病治療與疾病分析具有重要關聯，對國內醫療水準提升具有積極作用。對命名實體識別進行分析，國外命名實體識別出現較早、相對成熟，具有良好監督與學習效果。對國內命名實體識別進行分析，國內起步相對較晚。但是，在科技迅速發展過程中，命名實體識別取得較好成果。為進一步提升命名實體識別能力，充分發揮電子病歷價值，本文結合深度學習中的LSTM與MLP對電子病歷進行基本識別，希望能夠進一步提升深度學習電子病歷識別有效性，為現代醫療服務發展做出重要貢獻。

1電子病歷醫療命名實體識別以及深度學習基本概述

1.1命名實體識別基本概述

對命名實體識別進行分析，命名實體識別具有信息提取、機器翻譯、句法分析作用，是現代應用領域重要部分。將其與電子病歷相結合，不僅能容納大量的人名、時間、地點與日期、百分比等，更能明確實體類別，解決醫院傳統病歷應用存在的問題。相對于英語的識別方式，在國內醫療電子病歷識別過程中，漢語識別難度更大。因此，應結合深度學習計算方式，構建專屬國內電子病歷實體識別方式，應用不同模型，提升電子病歷醫療命名實體識別能力，進一步推動現代醫療服務工作開展。

1.2深度學習基本概述

對深度學習進行分析，深度學習為一種機器學習方式，此種學習方式，在實際應用過程中，主要通過神經網絡加以實現，對“深度”一詞的解釋，可以將“深度”理解為不同的神經網絡分層，傳統的機器學習深度網絡多為2-3層，而深度學習網絡輻射廣，甚至可以達到成百上千層。深度學習方式，相對于單一的計算方式，此種計算方式更為準確、迅速，能夠在極短時間內處理大量數據信息，并得到精準數據結果。究其原因，主要源于深度學習集合大數據、強大的計算資源以及訓練模式。而CNN[1]作為深度學習中的基本圖像處理方式，也是較為常見的神經網絡，此種神經網絡具有較強的提取與分層能力，能夠進行重復提取，從而針對想要解決的問題，進行多次實驗。只要具有充分訓練時間，就能夠解決復雜問題，將邏輯不清晰、關系不明確問題進行分化，最終得到精準數據結果，為結論研究提供強有力數據支持。

2命名實體識別所應用的MLP、LSTM神經網絡計算方式

2.1 MLP神經網絡計算方式

MLP[2]為多層神經網絡簡稱，亦被稱之為人工神經網絡。MLP神經網絡包含多個節點，其中，以ANN結構為例，每個節點之間相互銜接。在不同階段的銜接部分，這些節點根據不同關系與全新，對偏置處加以關聯，從而解決一些特定問題。在此種應用過程中，應給予偏置開展特定訓練，并借助多個輸入與輸出層，構建完善神經網絡，從而對神經網絡內部多層信息以及隱藏內容加以識別。

2.2 LMTS神經網絡計算方式

對LMTS進行分析，此種方式，更是適合處理間隔時間較長的問題。在短期記憶網絡中，R為輸入層、輸出層以及隱藏層。其中，隱藏層主要借助RNN隱藏處理方式，對不同結構進行計算，并將得到的結果與新的數值一起作用于隱藏層，從而形成最終的輸出結構。在此項計算方式中，既能展現基本的RNN結構，又能對RNN結構進行改進。LSTM優化RNN結構，解決RNN依賴的問題，將歷史信息作為不同介質進行傳遞，確保數據傳遞過程不受任何因素影響，這也是LSTM計算重要內容。

3電子病歷醫療實體是被模型構建

對最初序列標注進行分析，最初的序列需要動手進行標注，不僅需要投入大量人力資源、投入較高成本，整體標注效率較低。因此，在不斷發展過程中，電子病歷中的標注工作逐漸引入神經網絡，對不同的特征進行選取，并將其作為輸入框架，構建基本識別模型。其中，輸入層最主要作用，就是將不同患者名稱、疾病名稱以及治療記錄輸入其中，與此同時，在輸入完成后，將每個輸入轉換為所對應的序號。而查找層可以通過ID轉換多為向量，在這一層進行查找工作，將每個索引作為多維向量。為了獲得更多上下關聯信息，應在字前以及字后，對不同向量進行拼接，從而為網絡層輸入工作奠定良好基礎。對命名實體識別網絡層加以分析，在命名實體識別網絡層中，主要應用LSTM與MLPS[3]神經網絡計算特征，輸入相關向量，并在不斷轉換過程中，對每一個輸出的內容進行標準與分類，從而實現電子病歷命名實體識別工作，在不同的計算方式與控制網格中，能夠根據維特比計算方式，得到最佳識別方式，獲得最終明確標注序列，并借助網絡層所提供的數據內容，獲得更為精準序列過程，獲得精準識別方式。

4基于深度學習的命名實體識別實驗

4.1訓練集

在命名實體識別中，所采取的方式主要為隔準訓練方法，為了進一步降低最小化帶來的函數損失，因此，在命名實體識別實驗中，應當結合最新計算方式，結合優化AdaGrad[4]算法，充分運用minibathc傳播方式，對傳播算法進行深入研究，獲得最終的bathc數值。

4.2實驗評價指標

要想更好地發揮命名實體識別效果，在實際工作中，應當以醫院內部病歷為主，對這些電子病歷進行實名標注，將其中的150分電子病歷作為訓練集，將50分作為測試級，并在實際的測試過程中，選擇適合本次測試框架結構，本文選擇谷歌提供的TensorFlow為主，選擇Python此類開發軟件，并選用Windows系統。在此次實驗中，以三個指標為衡量標準，分別為準確率、召回率以及F1數值，作為重要的衡量實體識別標志指標，實驗公式如下所示：

猜你喜歡

電子病歷深度學習

有體驗的學習才是有意義的學習

江蘇教育·中學教學版(2016年11期)2016-12-21

MOOC與翻轉課堂融合的深度學習場域建構

新教育時代·教師版(2016年23期)2016-12-06

大數據技術在反恐怖主義中的應用展望

法制與社會(2016年32期)2016-12-01

電腦知識與技術2020年16期

電腦知識與技術的其它文章: 基于前景理論的多屬性決策方法研究; 無線傳感網中基于特征點集的虛擬力覆蓋優化; 基于手勢識別的智能控制系統的設計與實現; 基于SVD填充和用戶特征屬性聚類的混合推薦算法; 響應式網頁設計中移動設備的適配研究; 基于卷積神經網絡的人臉表情識別

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合