?

計算智能算法在肺癌研究中的應用

2023-04-27 13:49李尚軒孫晴許張美戴付晗毛璐怡樸雪
電腦知識與技術 2023年8期
關鍵詞:智能算法機器學習肺癌

李尚軒 孫晴 許張美 戴付晗 毛璐怡 樸雪

關鍵詞:肺癌;智能算法;人工智能;機器學習;文獻調研

中圖分類號:TP311 文獻標識碼:A

文章編號:1009-3044(2023)08-0105-05

近年來,人工智能在各行各業已成為人們廣泛關注的焦點,在醫學領域更是得到了廣泛的應用。通過二十多年醫療大數據的深厚沉淀,中國已經有了龐大的醫療數據,但是其醫療數據質量低下。而計算智能算法可通過算法使機器從海量的數據中學習規律并建立相關模型,通過確定正確的概率分布來推斷最可能成功的決策。與傳統醫生相比,計算智能算法在復雜疾病的預測與診斷中擁有更高的效率及準確率,且隨著計算智能算法的不斷完善及硬件性能的提升,已逐步展現其在醫學圖像處理上的優勢[1]。醫學影像人工智能檢測系統即通過對醫學圖像的原始像素進行挖掘從而發現圖像的有效特征,學習并模擬醫生的診斷技術,進而認識特征、重新組合、完成判斷[2]。隨著影像數據不斷增長,以及患者對影像診斷精準度的追求不斷增高的背景下,影像科的工作量明顯增大,急需可以快速并精準診斷疾病的工具。因此,人工智能等計算智能算法在醫學圖像上的應用將成為解決主要矛盾的關鍵。肺癌是中國最常見的惡性腫瘤,可分為小細胞肺癌(Small cell lung cancer,SCLC) 和非小細胞肺癌(Non-small cell lung cancer,NSCLC) ,約85%的肺癌患者屬NSCLC。我國每天近罹患癌癥,平均每8秒就有1人被確診為癌癥[3]。據估計,中國人的患癌風險高達25%。世界衛生組織提出,約一半的癌癥可以通過早期篩查達到預防的目的,進而使患者康復。因此,對腫瘤的科學的預防及篩查具有臨床意義。在大數據的時代背景下,利用計算機輔助診斷(CAD) 分析和研究癌癥的癌癥醫學圖像日漸成為主流,對輔助醫生診斷起至關重要的作用,目前我國正努力推進精準醫療及轉化醫學模式趨向成熟[4]。然而,國內仍缺少對該方面的重視,尚未建立足夠成熟的綜合性數據庫等導致國內外研究差距巨大。因此,本文通過檢索2011—2021年近10年間萬方數據庫以及Web of Sci?ence數據庫的相關學科文獻,從國內外文獻數量、期刊來源、被引頻次等角度進行對計算機智能算法在肺癌中的應用進行統計學分析,進而綜合了解國外計算智能算法在肺癌中應用的科研進展,這對我國相關研究的發展十分重要。

1 國內計算智能算法在肺癌研究中的應用的文獻計量分析

1.1 數據來源與檢索

在進行國內文獻統計分析時,本研究選用萬方數據平臺下的中文數據庫作為數據來源,采用高級檢索方法,檢索時間設置為2011—2021 年,選取檢索主題“肺癌”and“算法”查找,得到國內相關文獻820篇,經人工篩選得到有統計意義的文獻781篇。

1.2 結果與分析

對檢索到的數據按發表年份進行數量統計。由圖1可看出,2011-2018年相關文獻量逐年增多且于2018年達到峰值后(120篇,15.4%) 稍有下降。對于我國來說,從2009年開始,國務院逐步頒布深化醫療衛生體制改革的若干意見,同時各地積極探索建立區域醫療衛生信息平臺,信息化建設受到國家和社會的持續關注,故從2009 年以后,國內對計算智能算法在肺癌的應用研究進入新階段,相關文獻出現了大幅增加,研究工作進入一個高潮。在此時代背景下,利用計算機輔助診斷來解決影像科工作量巨大、醫生易漏診錯診等傳統問題漸漸成為熱點,其中卷積神經網絡便是最具代表性且發展最為迅猛的一種計算智能算法,它能通過自動提取影像特征,從而快速找尋影像的定性特征,這解決了影像科工作量巨大、影像科醫生易錯診等問題,也說明了卷積神經網絡等一系列計算智能算法在識別分析并輔助醫生診斷肺癌中起到重要的作用[5]。但是從2018年開始,相關文獻量持續下降,這與全球新冠疫情的流行、國內相關研究未引起足夠重視等因素有關。隨著醫改政策的不斷完善,國家對計算智能算法在肺癌中研究的投入和扶持力度不斷增大,科研成果將不斷涌現。

2011-2021 年781 篇文章中,東北大學35 篇(4.48%) ,南方醫科大學32篇(4.1%) ,中國科學院大學24篇(3.07%) ,山東大學24篇(3.07%) ,浙江大學23篇(2.94%) ,太原理工大學22篇(2.81%) ,鄭州大學17篇(2.18%) ,哈爾濱工業大學16篇(2.04%) ,華中科技大學15篇(1.92%) ,見表1。這說明綜合性大學的醫工交叉研究優勢突出,純醫學院校的理工類應用偏弱。2011-2021年781篇計算智能算法在肺癌中的應用的文章中,按發表的文獻量從高到低排列為楊銘11篇,焦麗靜8篇,肖明勇7篇,張煜6篇,李嘉旗6篇,王培6篇,黎杰6篇,廖雄飛5篇,許玲5篇,詳見表2。其中發表文獻量前十位的作者主要來自上海中醫藥大學附屬龍華醫院與四川省腫瘤醫院,這說明計算智能算法在肺癌中的應用這一研究區域分布不均,主要受上海醫學類高校及四川省高等研究所的關注,這與上海及四川當地對該研究的支持以及醫學類院校的支撐作用相關。

在文獻的來源期刊統計中,我們發現《中國醫學物理學雜志》《中華放射腫瘤學雜志》《生物醫學工程學雜志》《中國生物醫學工程學報》雜志為相關發文量排名前4位的中文期刊,這說明我國智能算法在肺癌中的應用研究多集中在醫學物理與生物醫學工程領域,此外這一分析有助于研究人員確定其領域的核心期刊,指引其投稿方向,詳見表3。在基金支持方面,國家自然科學基金、國家重點研發計劃項目成為計算智能算法在肺癌研究中的主要資助基金,這說明了國家對該研究領域的重視,同時我們也看到內蒙古、廣東、上海及北京在國內率先重視計算智能算法在肺癌中的應用這一研究方向,見表4。

在萬方數據庫781篇計算智能算法在肺癌中應用的中文文章中,關鍵詞出現頻次排行前8位的是:肺癌、肺結節、非小細胞肺癌、計算機輔助診斷、CT圖像、特征提取、卷積神經網絡、圖像分割。進一步進行學科分析發現,計算機輔助診斷肺癌與相關算法對肺癌CT圖像的特征提取是中國2011-2021年計算智能算法在肺癌研究中的研究熱點。劉曉鵬等人通過對5000例T1期肺癌患者胸部CT片進行計算機神經網絡學習,形成肺部結節的相關算法,測試500例T1期肺癌患者胸部CT片,并同專家讀片進行比較,結果顯示在1 mm層厚的CT片測試中人工智能與人工讀片對于肺癌結節和陰性對照讀片的檢測率相似,無顯著差異。而在5 mm層厚的相同驗證集CT片比較中,人工智能對肺癌結節的檢出數優于人工讀片,敏感性更高,但誤報數增多,特異性稍差[6]。這說明通過人工智能自動學習早期肺癌胸部CT圖像,可以達到較高的早期肺癌識別的敏感性及特異性,見表5。文獻的引用情況是目前評價文獻質量的重要指標,被引頻次不僅可以反映論文研究成果的學術水平,同時也能反映作者的科研成果被國際同行關注的程度,論文被引次數越多,尤其是去除自引后的被引次數(他引次數)越多,說明其在該研究領域的影響越大,見表6。通過進一步的分析發現,計算智能算法分析肺癌的CT圖像是當前國內的研究熱點。

2 國外計算智能算法在肺癌中的應用的文獻計量分析

2.1 數據來源與檢索

在對國外文獻統計分析時,本研究以Web of Sci?ence數據庫作為數據來源,檢索時間跨度限定為2011—2021 年,采用通用檢索方法“GeneralSearch”,進行“(lung cancer) AND (algorithm)”主題檢索,得到6991篇文獻,經人工篩選到有統計學意義的相關文獻6661篇。

2.2 結果與分析

統計2011—2021 年Web of Science數據庫索引出的國外計算智能算法在肺癌中的應用的文獻量,并分析得出文獻增長規律。通過折線圖,可以清晰看出雖然國外2011—2021 年計算智能算法與肺癌文獻量在2013與2016年減少,但十年間總體文獻數量持續增加,于2021年增長至峰值956篇;這也表明國外將關注點放在對計算智能算法在肺癌研究中的應用上,推動其不斷發展;國外2015 年1 月20 日,奧巴馬提出“精準醫學計劃”,期望利用基因組學、信息學和衛生信息技術來加速生物醫學新發現,其中列舉的就是肺癌的精準治[7],這對認識肺癌腫瘤機制也提出更高層次的要求。因此2011—2021年國外計算智能算法與肺癌文獻數量總體上呈遞增趨勢,在2019年后相關文獻在增長數量上未減少,這說明計算智能算法在肺癌中的應用具有研究價值,這為人類戰勝疫情提供支持。

以Web of Science數據庫為數據來源,通過2.1的檢索方法進行檢索并對結果分析,我們發現“MEDICAL PHYSICS”“INTERNATIONAL JOURNALOF RADIATION ONCOLOGY BIOLOGY PHYSICS”“PHYSICS IN MEDICINE AND BIOLOGY”和“PLOSONE”是國外計算智能算法在肺癌中應用這一研究方向發文量最多的四種雜志,通過對國外計算智能算法在肺癌中應用的文獻主要來源期刊進行分析,有助于中國的研究人員確定其投稿及未來研究方向。文獻的研究方向代表了國外學者的最新學術研究動向。在所得檢索結果中選取“研究方向”字段分析發現:“RADIOLOGY NUCLEAR MEDICINE MEDICALIMAGING”綜合比例高,說明醫學影像學與計算智能算法的聯系最為緊密,這提示國內科學家應關注醫學影像學與計算智能算法的發展。Setio等利用美國國家肺癌篩查試驗計劃中[8]的4萬多張CT圖像數據,訓練了一個基于三維卷積神經網絡的網絡結構,研究人員在測試集上獲得了高達94.4%的可信區間[9]。通過安排多名擁有多年臨床經驗的放射科診斷醫生作為對比,讓他們對同一數據進行肺癌患病風險評估。結果顯示醫生的表現均差于深度學習網絡算法。因此,通過大數據訓練的人工智能模型在預測早期肺癌風險這一任務上表現出了優于醫生專家的性能,也證實了神經網絡對早期肺癌預測結果的穩健性。

“被引用量”常被當作是衡量論文質量的指標,一篇論文被后續發表的論文引用次數越多,其“被引用量”及研究質量也就越高,對該領域的影響力越大。通過對國外計算智能算法在肺癌中的應用的文獻引用次數分析,可以發現國外已開始應用機器學習在肺結節的輔助診斷、肺癌的分析表型以及肺癌成像模型分析等臨床研究中,與國外相關文獻的被引用量進行對比,可發現國內文獻的“被引用量”遠低于國外的“被引用量”,這說明國外計算智能算法在復雜疾病的預測與診斷中論文的影響力更大,見表8。通過對2011-2021年國外計算智能算法在肺癌中應用的相關6661篇文獻的研究方向進行分析,發現腫瘤學、呼吸系統、放射學核醫學成像是主要研究方向,這說明國外研究的重點方向是如何使用計算智能算法來更好地服務肺癌的診斷,這為國內尚處于萌芽的研究團隊提供了未來研究方向,見表9。

3 國內外研究發展對比分析

從國內外期刊收錄文獻可以看出,國內傾向于應用計算智能算法在大數據、基因表達等計算機與生物科學領域上的具體問題。放射組學通過計算機高通量提取醫學數字影像中蘊含的大量不能被常規肉眼閱片識別高維信息,并通過對放射組學特征分析和處理,建立腫瘤放射組學特征與基因表型的相關性,為臨床開展精準醫療提供決策支持。機器學習使計算機像人腦一樣學習,不需要明確的程序,通過從數據中學習和訓練,并能進行識別和分類。再加上人工智能近年來高速發展,它解決了放射組學特征龐大計算量的問題,使得放射組學有望成為放射學和精準醫學的橋梁,從而讓放射診斷醫師更多地參與到疾病的精準診斷和個性化治療當中去。因此,胡麗霞指出基于機器學習的放射組學模型能夠用于預測NSCLC 的EGFR的突變,為臨床醫生術前治療方案的選擇提供決策支持[10]。張飛創新性地將計算智能算法用于非小細胞肺癌癌癥階段分類,雖然在驗證數據集中的分類結果并不理想,但為新靶向藥物的研發以及個性化治療的發展提供了重要的理論依據[11]。

與國內相比,國外學者更著重于利用先進的計算智能算法應用對肺癌的臨床治療上。Nicolas從癌癥基因組圖譜獲得的全玻片圖像訓練了一個深度卷積神經網絡,可以從病理圖像中預測出來STK11、EGFR、FAT1、SETBP1、KRAS和TP53六種在LUAD中最常見的突變基因[12]。癌癥的早發現早治療特別重要,該研究提供了強有力的證據,證明人工智能方法能夠幫助病理學家檢測癌癥亞型或基因突變,從而使患者能夠盡早接受靶向治療。

綜合國內外文獻,發現計算智能算法在肺癌中的應用以直線增長趨勢不斷向前發展,雖然國內學者不斷學習和借鑒國外先進經驗,取得了一定的進展,但國內的相關研究仍落后于國外,國外相關文獻量多于國內近七倍,且國外將先進的理論研究用于肺癌的治療上遠超國內,這與我國科技發展水平、教育普及程度和基金支持力度有一定聯系,同時也側面說明在我國對計算智能算法與肺癌的研究尚未得到各研究院、高校的充分重視,國內相關發展基礎條件有待加強。目前國內和國外研究領域均圍繞計算機科學、醫療保健科學與服務、數據挖掘、圖像分割與處理等方面,這將促進國內和國外學者的科研合作與深層次學術交流,共同攻堅克難。國內研究者仍要不斷努力以加強學科領域的實踐探索與理論研究,增強國際影響力。

4 未來展望

綜合國內外文獻,計算智能算法發展日益迅速,國外治療肺癌的研究起步較早,發表文獻較多,文獻增長速度較快,研究方向更偏向使用人工智能服務醫藥衛生,而國內研究更偏重應用人工智能解決生物科學上的具體問題。在人工智能廣泛應用于各領域的背景下,我們應重視自身創新性發展,同時也要分析認清國內與國外的發展差距,努力改善自身不足之處,加強理論方面的深入研究,同時政府部門應加大對計算智能算法治療肺癌的支持力度,保障我國相關研究水平逐步跟上并超越發達國家,力求從全球各國家、研究中心整合優勢資源、促進研究相關機構密切交流合作,實現優勢互補,資源共享,有望實現兩學科高水平的突破。

猜你喜歡
智能算法機器學習肺癌
中醫防治肺癌術后并發癥
對比增強磁敏感加權成像對肺癌腦轉移瘤檢出的研究
神經網絡智能算法在發電機主絕緣狀態評估領域的應用
基于超像素的圖像智能算法在礦物顆粒分割中的應用
從雞群算法看群體智能算法的發展趨勢
前綴字母為特征在維吾爾語文本情感分類中的研究
基于支持向量機的金融數據分析研究
microRNA-205在人非小細胞肺癌中的表達及臨床意義
基于肺癌CT的決策樹模型在肺癌診斷中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合