吳玉琳
(棗莊職業學院 山東 棗莊 277800)
隨著我國經濟水平的高速發展,脊髓損傷發病率呈逐年升高趨勢[1]。脊髓損傷不僅會給患者本人帶來身體和心理的嚴重傷害,還會對整個社會造成巨大的經濟負擔。在脊髓損傷之后,因肢體感覺和運動功能障礙缺乏自主運動能力導致長時間單一姿勢臥床是發生褥瘡的主要原因。因此,快速、準確分析脊髓損傷者臥床姿態并及時提醒,對預防褥瘡等并發癥和現代化醫療有重大意義。
本文利用脊髓損傷者臥位時足底圖像作為特征圖像,提出一種基于卷積神經網絡的臥姿狀態識別算法。首先,獲取特征圖像并進行預處理。其次,利用卷積神經網絡對特征圖像進行分類進而獲知臥姿狀態。
為降低成本,使用視頻傳感器拍攝的臥位圖像作為特征圖像。人體臥位時,兩腳處于自然擺位狀態且足底的形狀為長方形,有良好的方向區分性。因脊髓損傷者肢體運動功能障礙,在某一臥位姿態時足部無自主運動,采集到的足底圖像就比較穩定。此外,在患者翻身時,因肢體是被動擺位,能保證足部姿態與臥位姿態強相關性。因此,本文提出利用足底圖像作為特征圖像,根據足底圖像方向變化得知脊髓損傷者當前臥位姿態。
原始圖像由視頻傳感器直接獲取,其中包含噪聲和部分人為干擾,預處理可以使圖像標準化,減少之后分類的難度。
2.1.1 圖像去噪
通過視頻傳感器獲取的數字圖像,常常因設備和外部環境因素而含有噪音。因此,在對圖像處理之前需要對原始圖像進行數字去噪,降低對后續圖像處理的不良影響。
中值濾波器是一種非線性數字濾波器,主要原理是設置一個大小為N的觀察窗口并對窗口內的N個數進行排序,若N為奇數,輸出取中間值,否則輸出取中間兩個值的平均。每次丟掉最前面的一個數,取一個新采樣重復計算來濾除圖像中的斑點噪音和椒鹽噪音。
2.1.2 圖像光平衡
利用圖像傳感器獲取數字圖像時,往往會受到外界光照因素的影響,采集的足底彩色圖像常常會有偏色現象或者不同程度的高光和陰影。本文將Gray World[2]色彩均衡方法融入圖像預處理過程中,消除待處理圖像的偏色問題,為提高姿態識別提供了保障。
本文所用GrayWorld色彩均衡具體方法如下:
(1)在RGB色彩空間中計算有顏色偏差圖像的R,G,B分量和,分別記為:sR,sG,sB
(2)計算顏色均衡調整參數:
(3)利用色彩均衡調整色彩分量:
本文定義了四種基本臥位姿態:仰臥、俯臥、左側臥和右側臥。采用的人體睡姿識別方法就是利用計算機視覺來識別靜態圖像中的睡姿,識別的結果是四種基本睡姿中的一種。
卷積神經網絡(ConvolutionalNeuralNetwork,CNN)是神經網絡的一種,但其微觀結構與其他神經網絡有很大不同,它的每一層數據由若干矩陣數據節點構成,而不是由若干向量節點構成。在計算過程中采用卷積模式,因此被稱為卷積神經網絡。
卷積神經網絡對圖像的旋轉、平移或縮放具有高度不變性。卷積神經網絡的一個很大的亮點是其使用的下采樣算法,減少了運算復雜度,并且能夠隨著模型網絡層數的增加,提取出更為抽象的信息。圖1A和圖1B分別顯示了一個典型的用于識別的卷積神經網絡——LeNet-5[2]和一個用于人臉識別的卷積神經網絡[3]。
圖1 卷積神經網絡
本文采用了與LeNet-5類似但又更為復雜映射關系的卷積神經網絡,此網絡規模大提升了脊髓損傷者臥位姿態的識別率。
經多次迭代學習后,可計算一個平均矩陣。
本文使用的卷積神經網絡設定5個隱含層,第一隱含層設定1000個神經元,第二隱含層和第三隱含層均設定500個神經元,第四隱含層和第五隱含層均設定200個神經元。當訓練樣本較大時,需要相應減少神經元個數。
卷積神經網絡的輸出的臥位姿態如下表所定義:
表1 卷積神經網絡輸出定義
本實驗采用已標注的300張正常光照情況下脊髓損傷者各種臥位姿態下足底正面拍攝圖像作為數據集,隨機選擇此數據集的70%(210張)用于訓練卷積神經網絡,剩余20%(90張)用于驗證結果。
實驗結果如下表2所示:
表2 實驗結果
本實驗將210張脊髓損傷者各種臥位姿態下足底正面拍攝圖像直接作為卷積神經網絡的輸入進行訓練,得益于卷積神經網絡具有提取目標深層信息的能力,并不需要提取特征。訓練后的卷積神經網絡用于識別臥位姿態,識別效果非常好(準確率為98.9%)。
本文綜合分析了脊髓損傷者臥位時的多種圖像,確定使用足底圖像作為特征圖像,隨后引入卷積神經網絡將足底圖像進行分類,進而識別臥位姿態。通過實驗表明,選擇脊髓損傷者臥位時足底圖像作為特征圖像有較好的區分度,使用卷積神經網絡識別足底圖像進而確定臥位姿態有較高的準確率。下一步,需要獲取更大的數據集,測試算法的穩定性并繼續優化算法,保證準確率的前提下減少隱含層數量。