?

最大誤差壓縮下的腦電微狀態模板差異研究

2024-01-05 06:07史玉盼馬少辰馮春雨
河北省科學院學報 2023年6期
關鍵詞:腦電小波均值

史玉盼, 馬少辰, 馮春雨

(1. 河北省科學院應用數學研究所, 河北省信息安全認證技術創新中心,河北 石家莊 050081;2.河北醫科大學第一醫院神經內科,河北 石家莊 050031;3.河北省腦老化與認知神經科學重點實驗室,河北 石家莊 050031)

0 引言

近年來,隨著醫療設備的創新發展, 醫療數據呈現爆發式增長。為了解決大體量數據的傳輸、存儲和快速分析處理問題, 數據壓縮技術被越來越多的應用到健康醫療領域?;趬嚎s的數據處理流程通常是先將數據壓縮, 之后進行傳輸/存儲, 而在需要分析時再將壓縮數據解壓縮。如果能在壓縮數據(壓縮概要)上不進行解壓縮操作, 而直接進行目標結果計算將很大程度上提升整體處理效率, 這種方式被稱為基于壓縮概要的查詢[1]。

腦電圖(electroencephalogram, EEG)可在毫秒級時間尺度上描述整個大腦神經網絡的協調動態, 近年來被廣泛應用于神經類和精神類疾病診斷。腦電分析方法眾多, 常用的有時域分析、頻域分析、時頻分析、非線性分析(包括獨立成分分析、復雜性分析、功能連接)等。腦電微狀態使用多通道電極的地形圖拓撲結構定義狀態, 反映了EEG中占主導地位的大腦網絡的同步活動產生的瞬態腦狀態, 代表了自發的、時間同步和大空間尺度的皮層神經元活動。微狀態特征的改變反映了疾病引起的神經活動, 可作為篩查神經精神類疾病的生理指標[2]。然而, 臨床腦電數據具有多電極、高采樣率及采集時間長的特性, 這導致腦電特征提取的效率低下。因此, 研究如何利用數據壓縮技術提高微狀態特征提取很有意義。

本文旨在探索使用層次化的最大誤差保障的壓縮算法FShift在微狀態計算上的應用, 比較原始數據、FShift保質壓縮/解壓縮數據以及壓縮概要上得到的微狀態模版的差異, 以確定當存在微小誤差時, 微狀態計算是否滿足實際計算精度需求。

1 相關研究概述

1.1 最大誤差壓縮

由傳感器獲取的腦電數據是典型的會受到噪聲干擾的流數據, 它們普遍存在誤差, 但對于應用來說, 數據精度保證在一定范圍內即可用, 因此適合采用有損壓縮來處理。

目前國際上流行的數據流壓縮算法可分為定量壓縮和定質壓縮。定量壓縮是把數據壓縮到事先給定的量值(如:給定的壓縮率),定質壓縮要求壓縮后的數據估計值與原始數據值的誤差小于(在給定的度量空間上)給定的數值。根據度量空間的不同,定質壓縮又可以分為均值誤差壓縮和最大誤差壓縮兩類算法。對于定量壓縮中的量值和均值誤差壓縮的平均誤差是針對數據的整體特性,用戶不能控制每個數據點的誤差, 與數據流的持續、無限的特性不符, 因此從理論上來說是不適合對數據流進行壓縮。這是因為最大誤差壓縮算法所要求的是重構的每一點的誤差都小于給定的臨界值, 而均值誤差壓縮所遵循的是所有點的誤差平方和的均值要小于臨界值。所有點平均誤差一定不大于最大誤差, 因此只要最大誤差壓縮結果成立, 則均值誤差壓縮結果也一定成立, 但反之不成立。

FShift壓縮算法[3], 可以視作Haar小波閾值化, 歸類于層次的、最大誤差壓縮。它在為每個數據點給出一個誤差界限(以下簡稱界限)的情況下, 確定大綱中要保留的小波系數, 即壓縮概要, 保留的系數越少壓縮效率越高。當界限為0時, FShift變換就是Haar小波變換。

1.2 腦電圖的微狀態

腦電圖微狀態是多通道腦電圖中地形拓撲結構的準穩定時期。對于多通道腦電數據,任意時刻都能得到相應的地形拓撲結構,但由于噪聲的存在,使得某些時刻的腦電具有較低的信噪比。全局場功率(global field power, GFP)指某一時刻所有電極通道的電壓的標準差,用f(t)表示,計算由公式(1)給出,其峰值處對應的腦電具有相對較高的信噪比,它的腦電拓撲結構也更加穩定,因此經常使用這些腦電拓撲結構進行聚類分析,以獲得腦電微狀態[4]。靜息態腦電圖由少數交替的微狀態所主導, 每種微狀態在60~120 ms內保持穩定。

(1)

腦電微狀態已用于不同患病人群的診斷/分類[5-7]。對不同的人群, 可以使用這些人群的腦電所計算的GFP峰值時刻點所對應的腦電數據進行聚類, 形成微狀態模板, 如對于AD(老年癡呆)人群, MCI(輕度認知障礙, 正常人和老年癡呆的中間狀態)人群, 分別計算出AD組、MCI組的微狀態聚類結果, 稱微狀態模板(圖1)。靜息態腦電圖有四個典型微狀態[6]: 右額-左后部(A)、左額-右后部(B)、中額-枕葉(C)和中額(D)地形圖,分別對應于語音加工、視覺網絡、凸顯網絡、注意網絡相關的靜息態網絡。

圖1 AD組和MCI組的組微狀態模板

使用未知分類人群腦電每個時間點的數據基于最大Pearson相關性去匹配組微狀態模板, 可確定每個時間點的具體的微狀態, 進而獲取數據的微狀態序列及與微狀態相關的參數, 如微狀態A的平均持續時間, 微狀態A到B的轉換概率等特征。使用這些計算出的特征可進行其他的諸多計算。由此可見, 微狀態模板是一個非常重要的基礎, 影響后續的一系列計算。在使用壓縮概要進行微狀態相關計算時, 一方面期望節省數據的存儲空間, 另一方面又期望能在誤差的壓縮概要上進行計算獲得可接受的結果, 為此研究微小誤差對模板的影響尤為重要。

2 原理與方法

本研究期望直接在壓縮數據上計算微狀態模版, 而不需要解壓縮數據。但非層次壓縮方法, 如PLA[8, 9],需要將壓縮數據完全解壓后才能計算微狀態模版。因此本文選擇層次的壓縮方法FShift作為壓縮工具。

由小波的計算原理可知, 在進行第一次Haar小波分解時, 需要對原始數據計算兩兩數據的均值和兩兩數據的差值。每個均值和差值都是單一固定的, 其中均值可以認為是2個點的出發的位置, 差值是2個點分別相悖而行移動的距離。進行第二次分解時, 再對上一次的均值進行分解。一直迭代計算, 直到只剩下1個均值和1個差值。

進行FShift運算時,需為每個數據點指定一個界限, 將每個數據點都擴展為一個區間, 因此兩兩數據得到均值也是一個數值區間。這樣當進行 “小波分解”時, 我們可以尋找數值區間的交集, 當交集存在時表明不需要移動, 這樣產生了0值; 如果沒有交集, 就需要將兩個區間向相對的方向移動, 直到兩個區間中點重合。移動的距離就是需要存儲的系數。因0值不需存儲僅需標記, 從而節省存儲小波系數也就實現了壓縮。一般說來, 我們以新產生的0的個數來衡量壓縮效率。經過FShift壓縮后形成壓縮概要, 對壓縮概要解壓縮則恢復數據, 而所恢復的數據與原始數據的差異一定被界限所限定。

小波分解提供了非常有效的數據簡化工具, 用于數據挖掘, 選擇性估計以及近似和聚合查詢處理大量關系表和數據流。簡單地說, 通過將小波分解應用于輸入集合(被認為是一個序列), 然后通過只保留生成的小波系數的一個選定子集對其進行匯總, 從而提取出小波概要, 原始數據可以基于這個簡潔的概要進行重建。以往的研究已經證實, 僅在這種簡潔的小波概要上就可以進行可靠的、特別的近似查詢處理。對于FShift來說, 同理。

由Haar小波/FShift計算可得, 對數據進行一次變換后, 數據均值長度部分為原來的數據總長的一半。如果這一數據為500 Hz采樣率腦電數據, 則FShift進行一次變換后, 均值部分的數據可視為250 Hz采樣的腦電數據, 即通過FShift實現了有損的降采樣,且保持了數據的形態。該過程可視為在壓縮過程中就已經實現了降采樣; 另一方面, 如果從一個完全壓縮的數據概要中, 不需要完全解壓縮, 僅計算到“250 Hz”停止, 也可實現降采樣,如圖2所示。

圖2 數據及FShift一級壓縮概要

常用的腦電設備采樣率常高于微狀態計算所需采樣率, 為此在這種情況下可通過FShift實現數據的壓縮與模板的制作。

由傳感器采集的腦電圖信號因外界干擾、人的頭部活動、交流電信號干擾、出汗導致的干擾會導致數據一定存在誤差。為評估有損壓縮帶來的影響, 我們先視原始采集的腦電為“干凈的”。比較原始腦電(O)制作的微狀態模板, 經FShift壓縮, 解壓縮后的數據(F), 用FShift降采樣后的數據(R)制作的微狀態模板以及給原始腦電添加噪聲后的數據(N)制作的微狀態模板的差異。N數據計算見公式(2)。將因有損保質壓縮而引入的噪聲同人工加入的噪聲數據相比, 若有顯著優勢, 那么有損保質壓縮可以應用于腦電微狀態的計算。

d′(i)=d(i)+Uunifrnd(-Bbound,Bbound)

(2)

其中,d(i)為原始數據,d′(i)為新生成的含噪聲數據,Uunifrnd為隨機數產生函數,Bbound為預先指定的界限值, 定了d(i)的范圍。為對比F數據與N數據, 需要為FShift制定相同的界限。

對獲取的AD, MCI各30份腦電數據(500 Hz采樣率)采取如下處理過程:

1)對采集的腦電圖數據/保質壓縮后的數據進行2~20 Hz的帶通濾波;

2)以250 Hz對濾波后的數據進行重采樣, 并按2 s一段進行分割, 形成Trials序列;

3)去除電極電壓幅度大于100 μv的片段, 以避免諸如眼睛和肌肉偽影之類的偽影;

4)使用AAHC(atomize and agglomerate hierarchical clustering)[4]分別對AD組數據和MCI組Trials序列數據的全體進行聚類, 設定聚類個數為4, 之后分別得到AD組和MCI組的組模板, 每組模板分別包含4個微狀態: A、B、C和D。

5)用某份數據匹配AD組模板, MCI組模板, 記錄匹配情況。

在步驟3)中,采取4種策略進行對比。①直接進行重采樣;②對重采樣后數據進行壓縮/解壓縮;③采用FShift進行降采樣;④按照公式(2)在重采樣后的數據中添加噪聲。FShift壓縮的界限和噪聲數據界限均指定1個相同的值0.1。由此產生4種模板進行對比。

3 實驗結果

60份腦電數據經FShift壓縮產生的0平均為4.93%, 最小1.15%, 最大7.49%; 而經FShift降采樣產生的0平均為7.58%, 最小1.59%, 最大11.55%。需要說明的是, FShift壓縮的對象是250 Hz的數據, 而FShift降采樣的對象是500 Hz的數據。圖3給出了F, R, N數據與O數據的差異(導聯1前100個點的數據)。

圖3 F,R,N數據與O數據的差異

如圖3所示, F數據與O數據的差異最小, 且每個點的值被限定在指定的參數0.1范圍內; R數據與O數據的差異中的幅值差異最大, 超過了參數0.1范圍, 這是由于降采樣過程導致誤差的疊加; N數據與O數據的差異點個數最多, 但每個點的值依然被限定在指定的參數0.1范圍內。

將O數據制作的微狀態模板視為標準模板, 則F數據、R數據、N數據制作的微狀態模板, 與O數據制作的模板的相似度見表1, 其中相似度計算方法為Pearson相關系數。

表1 不同數據制作的模板相似度對比

表1中, RA(RB, RC, RD)為R數據與O數據制作的模板在狀態A(B, C, D)下的相似度。NA(NB,NC,ND)為N數據與O數據制作的模板在狀態A(B, C, D)的相似度, 最后1列FX為F數據與O數據在所有4個狀態下的相似度均為1。AD的組模板中, RA, RB小于對應的NA, NB; MCI的組模板中, RA小于對應的RA, 而其他的5個則R數據優于N數據, 顯示出F數據一定得到優勢, 但是最好的結果是F數據, 它與O數據的模板無差異。

作為對比, 表2給出了O數據制作的組微狀態模板四個狀態之間的差異。 其中,AD-AB(AC, AD)為AD組中, 狀態A和B(A和C, A和D)的差異, MCI-AB, MCI-AC, MCI-AD則為MCI組中的差異。從表2中可知, AD組狀態B, C, D與狀態A的差異分別為0.729 1,-0.191 7,-0.739 2; MCI組的值分別為0.687 0,-0.044 5,-0.721 0。對比不同數據制作的模板相似度差異, 同組狀態間的顯然是巨大的。

表2 同組模板不同狀態相似度對比

4 結論

對于腦電這種由傳感器獲取的流數據, 使用FShift對數據進行壓縮, 可以保證每個數據點在壓縮/解壓縮后的值均限定在設定的范圍內。在給定小的界限下, 可以實現在微狀態模板制作上的無差異性, 即在給定小的誤差下, 存在壓縮處理的數據對模板制作沒有影響的情況。而在壓縮概要上直接進行模板的制作, 不如F數據上制作, 但也顯示出了比添加隨機干擾數據的優勢。

制作微狀態模版后需要進行數據與微狀態模版的匹配、特征提取等計算[10], 不同處理參數下的數據與模版匹配度是否存在可接受的差異是未來研究需要解決的問題。此外, 在本研究中, 因篩選掉干擾較大的數據后, 可用的AD病例、MCI數據數較少, 僅有各30例,今后還需更大范圍數據的計算分析。

猜你喜歡
腦電小波均值
構造Daubechies小波的一些注記
基于MATLAB的小波降噪研究
基于改進的G-SVS LMS 與冗余提升小波的滾動軸承故障診斷
現代實用腦電地形圖學(續)
現代實用腦電地形圖學(續)
現代實用腦電地形圖學(續) 第五章 腦電地形圖的臨床中的應用
均值不等式失效時的解決方法
均值與方差在生活中的應用
現代實用腦電地形圖學(續) 第五章 腦電地形圖在臨床中的應用
關于均值有界變差函數的重要不等式
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合