?

數據挖掘技術及其在醫學信息領域的應用

2016-12-27 15:08劉妍
科技傳播 2016年19期
關鍵詞:數據挖掘技術

劉妍

摘 要 本文簡單介紹了數據挖掘技術,分析了數據挖掘技在醫學信息領域的重要意義,闡明醫學數據挖掘的主要應用,并對數據挖掘技術在醫療管理、疾病診斷和醫學科研方面的具體應用進行了分析研究,肯定了數據挖掘技術在醫學信息領域的價值和廣闊的應用前景。

關鍵詞 數據挖掘技術;醫學信息;醫學應用

中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2016)172-0132-01

數據挖掘技術自20世紀90年代開始興起,隨著信息時代的到來,數據挖掘技術受到越來越多的關注。數據挖掘技術在眾多不同領域正發揮著重要作用,和其他領域一樣,數據挖掘技術在醫學信息領域也具有廣泛應用。數據挖掘技術有助于醫院管理者做出民智決策、醫生做出正確診斷、醫學研究者做出有效分析和預測。

1 數據挖掘技術

數據挖掘(Data mining)是指從大型數據中通過算法發現或提取有意義、有潛在價值、新穎的信息與規律等知識。Shapiro在1989年8月舉行的第11屆國際聯合人工智能學術會議上,首次提出數據庫中知識發現一詞——數據挖掘技術。隨后,很快吸引了大量數據庫工作者轉向數據挖掘的研究。

經歷了20余年的發展,數據挖掘的算法日趨成熟,融合了模式識別、數字圖像處理、數據庫技術、信息檢索、數理統計等眾多技術。數據挖掘是一個復雜的過程,它是由多個流程組成的,隨不同領域的應用這些流程會有所變化,一般的流程為問題定義、數據準備、數據轉換、數據挖掘、結果評估、知識的發現和應用。這些流程的順序并不是線性的,而且為了取得好的數據挖掘結果常常需要反復。數據挖掘的方法主要有概念描述、關聯分析、分類、聚類分析、異常檢測等。

2 數據挖掘在醫學信息領域的重要意義

醫學信息的形式多樣,包括文字、圖像、聲音、視頻等形式,它涵蓋了生物信息學、藥物信息學、醫學圖形信息學等學科,同時,具有隱私性、冗余性、不完整性、模糊性且帶有噪聲等特點。數據挖掘作為一種數據處理技術,從醫學數據信息中尋找潛在的關系或規律,從而獲得有效的對病人進行診斷、治療,增加對疾病的預測準確性,實現疾病的早期發現,提高治愈率,為醫學信息領域提供了新的方法[ 1 ]。

1)醫學數據挖掘技術有助于提高數據分析效率,增加產生新知識的速度。醫學數據庫是一個龐大的信息庫,有海量的數據,而且數據的形式多樣,要在這樣的數據信息中找到有價值的信息,采用傳統的方法需要花費更多的時間。利用數據挖掘技術,可以分析數據的趨勢變化和規律,減少數據冗余和重復性的影響,減少數據量,選擇合適的算法制定規則還可以實現自動化分析。如數據挖掘技術分析電子病歷中分散、非結構化數據,進行自動化的數據采集[ 2 ]。

2)醫學數據挖掘技術可以提供知識的準確性和可靠性,提高疾病的治愈率。日常醫療中通常采用抽樣的方法獲取樣本,結果導致往往只有一部分符合特定要求,存在樣本的局部性并影響真實性。數據挖掘技術從數據的整體性出發,通過概率抽樣、評估、假設驗證等過程提取信息中的共性特征和個性差異,彌補了隨機對照實驗的不足。理論上還能夠根據病人的個體差異,給出個性化治療方案。如通過整合系統生物學與電子病歷數據,醫學數據挖掘技術為個性化醫療計劃轉變為臨床實踐提供機會。

3)醫學數據挖掘技術可以用于預測建模,輔助臨床診斷和推薦治療措施。大量的研究和大數據的到來,使得大部分臨床醫生的知識轉化變得非常困難,難以跟上最新的知識來指導臨床診斷。數據挖掘預測建模,根據特定信息對離散數據進行預測。谷歌公司利用人們在網上檢索的與流感相關的記錄建立了數學模型,成功的預測流感傳播和發生的地點。又如癌癥早期診斷中,利用數據挖掘技術對癌癥患者做出診斷和提出治療方案。

3 數據挖掘在醫學信息領域的應用

醫學信息與數據挖掘都是快速發展的前沿研究,復雜多變的需求分析及醫學信息數據的特點,使醫學信息的數據分析迫切需要數據挖掘技術的支持。醫學信息中的很多內容,如在醫療管理、疾病診斷和醫學科研方面,都在數據庫技術中找到了支持。

1)醫療管理。目前,隨著數字化的普及,很多醫院都建立了龐大的數據庫,目前主要有醫院信息系統(hospital information system,HIS),它分為管理信息系統和臨床信息系統,管理信息系統主要處理諸如人事、財務和設備管理等醫院內部管理方面的信息,臨床信息系統主要處理患者相關信息。從數據庫中運用數據挖掘技術,來分析和發現數據的各種信息,可以幫助醫院決策者更好的制定管理策略[3]。按照數據挖掘的需求,進行關聯分析、分類分析、聚類分析等挖掘算法,可進行醫院費用分析、醫療質量管理、醫用耗材管理、住院患者人群分類等。

2)疾病診斷。面對日益龐大的病案數據,僅依靠臨床經驗,容易出現診斷錯誤,針對臨床數據庫、醫學圖像等,數據庫挖掘技術也發揮著重要的作用。

決策樹算法幫助醫生從大量數據中尋找規律,提高準確率。應用聚類算法、關聯規則等還可以進行疾病診斷因素和疾病關聯等方面的分析,如實現癌癥的早期診斷和預防等。

醫學圖像隨著醫療設備的發展,種類都越來越多,醫學圖像中蘊含這豐富的圖像特征和規則信息,使用決策樹、神經網絡和關聯規則等數據挖掘算法,可以輔助醫生對病變區域進行分析,提高醫學診斷的準確性和正確性。

3)醫學科研?;蜓芯浚簲祿诰蚣夹g與傳統的統計分析,在數據分析的效率上有明顯的優勢。利用關聯規則、聚類分析等有助于發現一組序列的差異及相似性,闡明多個序列間的關系,確定基因種類。

蛋白質結構預測:許多國家組建了蛋白質結構和功能數據庫,為科研工作這提供豐富信息的同時,由于數據分散、存儲媒介多、數據冗余等復雜性,使用數據庫技術進行數據清理,追蹤蛋白質數據序列,為蛋白質結構預測提供便利。

藥物發現及設計:數據挖掘技術有助于增加新藥發現和設計中的主動性并避免盲目性。利用數據挖掘技術對從龐大的化合物數據庫中發現藥物靶分子,對藥物進行篩選、藥物毒理學、藥物副作用分析,從而降低藥物開發的時間和成本[4]。

4 結論

醫療信息的數字化發展和醫學研究工作者對高校處理和分析大數據的渴望為數據挖掘提供了廣闊的研究空間,也顯示了數據挖掘在醫學信息領域的發展潛力。利用數據挖掘技術,將幫助醫療管理、臨床疾病診斷和醫學科研等。相信在不久的將來,數據挖掘在醫學信息領域將取得突破性進展。

參考文獻

[1]石曉敬.數據挖掘及其在醫學信息中的應用[J].醫學信息學雜志,2013(34):2-6.

[2]秦文哲,陳進,董力.大數據背景下醫學數據挖掘的研究進展及應用[J].中國胸心血管外科臨床雜志,2016(1):55-60.

[3]陳郁韓.數據挖掘技術在醫院管理中的應用.中國醫學裝備,2014(1):62-65.

[4]楊春華,李春華,王桂枝,等.數據挖掘技術在藥物研究與發現中的應用[J].醫藥導報,2005,24(12):1143-1145.

猜你喜歡
數據挖掘技術
數據挖掘在計算機網絡病毒防御中的應用
基于Web的數據挖掘技術與相關研究
應用型本科數據挖掘技術課程教學探討與實踐
探討高校教育教學中數據挖掘技術的有效運用
數據挖掘技術識別可疑洗錢交易行為模式研究
財務報表內外數據挖掘技術的運用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合