?

基于數據挖掘的圖像分類算法

2017-03-04 08:04唐普霞石麗怡
現代電子技術 2017年3期
關鍵詞:圖像分類特征提取數據挖掘

唐普霞 石麗怡

摘 要: 針對傳統圖像方法的分類精度難題,提出基于數據挖掘的圖像分類算法。首先構建多媒體數據庫中的圖像檢索信道模型,并進行向量量化編碼,然后采用Harris角點檢測算法提取圖像特征點,并采用模糊C均值聚類算法實現圖像分類。實驗結果表明,該算法可以對圖像內容信息進行準確的表達,提高了圖像分類的精度,具有較強的魯棒性。

關鍵詞: 數據挖掘; 圖像分類; 特征提??; 模糊C均值聚類

中圖分類號: TN911.73?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2017)03?0054?04

Image classification algorithm based on data mining

TANG Puxia, SHI Liyi

(Department of Public Safety Technology, Hainan Vocational College of Political Science and Law, Haikou 571100, China)

Abstract: Aiming at the classification accuracy of the traditional image method, an image classification algorithm based on data mining is put forward. The image retrieval channel model of the multimedia database was constructed. The image was performed with vector quantization coding. The Harris corner detection algorithm is used to extract the feature points of the image. The fuzzy C?means clustering algorithm is adopted to classify the image. The experimental results show that the algorithm can express the image content information accurately, improve the accuracy of the image classification, and has strong robustness.

Keywords: data mining; image classification; feature extraction; fuzzy C?means clustering

0 引 言

隨著數字圖像處理技術的發展,各行各業均構建了圖像數據庫,尤其對于大型多媒體圖像數據庫,對圖像進行分類和檢索可以幫助用戶找到需要的圖像,因此研究圖像分類算法在多媒體信息訪問和數據挖掘中具有重要意義。

圖像分類的關鍵是關鍵特征點的準確挖掘和特征提取,傳統方法主要有模糊C均值聚類、邊緣輪廓融合濾波檢測法、Harris角點檢測法、高階累積量特征檢測算法等[1?3],它們通過特征點提取和信息分析實現圖像分類,并取得了一定的研究成果。文獻[4]提出基于邊緣輪廓特征點自相關匹配檢測的圖像分類算法,并應用在大型多媒體網絡數據庫圖像分類中,取得了較好的分類效果,但計算開銷較大,實時性差;文獻[5]提出SIFT(Scale?Invariant Feature Transform)角點檢測的視頻輸出圖像分類算法,通過對角點掃描確定圖像分類主方向和生成特征點,以此為基礎進行圖像的分類識別,提高圖像分類的實時性,但由于結合語義特征提取,受到擾動影響大,圖像分類準確度低[6?8]。

針對上述問題,本文提出數據挖掘的圖像分類算法,構建多媒體數據庫中的圖像檢索信道模型,對采集的圖像進行向量量化編碼,采用Harris角點檢測算法進行圖像的特征點提取挖掘,以提取的特征點為數據輸入,采用模糊C均值聚類算法實現數據挖掘和圖像分類,最后通過仿真實驗進行圖像分類算法的性能測試和驗證,從分類的準確性和輸出峰值信噪比方面進行性能分析,得到有效性結論。

1 圖像采集及預處理

1.1 圖像采集

為了實現對圖像的分類和檢索,需要進行圖像采集和信道模型構建,首先把圖像存儲檢索信道分成[3×3]拓撲結構,設置4個圖像檢索信道模型,分別為水平方向、垂直方向、左對角線方向以及右對角線方向,具體如圖1所示。

在圖1中,[p1,][p2]和[p3]分別代表圖像在仿射不變區域的邊緣像素特征點,把四個多媒體數據庫圖像采集通道的信息特征進行數據結構分解,提取圖像在四個檢索信道的向量量化參量為[x1,][x2,][x3,][x4,]表示為:

[x1=p1-mx2=p2-mx3=p3-mx4=m] (1)

式中[m]為圖像檢索的嵌入維數。

設[A]為論域[U]上的模糊集,構建圖像像素特征分布的模糊規則集合,則圖像像素特征模糊隸屬度函數為[A=x,SA(x)x∈U,]在有限圖[G=(V,E)]中,圖像的灰度值[SA]是論域[U]到實數閉區間[0,1]的映射,即[U→[0,1]],并稱[SA]為尺度中心,[SA(x)]為大型多媒體數據庫圖像像素點[A]中元素[x]的隸屬度,構建多媒體數據庫存儲圖像的采集和圖像檢索信道模型。

1.2 圖像向量量化編碼預處理

在圖像采集和圖像檢索的基礎上,通過圖像向量量化編碼處理,實現對多媒體數據庫的圖像存儲特征優化聚類,圖像向量量化矩陣描述為:

[H=Lxx(x,σ)Lxy(x,σ)Lxy(x,σ)Lyy(x,σ)] (2)

式中:[Lxx(x,σ)]為圖像像素旋轉不變矩;[Lxy]和[Lyy]分別為二值化的尺度空間向量量化系數。

對圖像中的像素特征點進行歸一化特征分解,得到信息點的碼書[x(P(An))={x(sj)}, j=1,2,…,N,]對圖像邊緣輪廓進行向量量化特征聚類空間劃分,得到圖像檢索信道中的圖像[S]在網格點[(x,y)]處的壓縮編碼輸出特征參量滿足[minc∈r,g,bminy∈Ω(x)Ic(y)A→1,]此時連通區域滿足[t(x)→0,]構建仿射不變的尺度空間,由于圖像的像素幅值[A>0,]所以對每個尺度[σ(n)]的角點進行圖像向量量化編碼,輸出編碼結果為:

[R(k1,k2)=F(k1,k2)G(k1,k2)F(k1,k2)G(k1,k2)=ejθ(k1,k2)] (3)

式中[ejθF(k1,k2)]和[ejθG(k1,k2)]為相位分量。

在多媒體數據庫中,兩幅大小為[N1×N2]的位圖圖片[f(n1,n2)]和[g(n1,n2),]圖像向量量化編碼的每個像素點的均方誤差[x(sj)]通過二維函數擬合得到向量空間圖像信息的指向性聚類中心,表示為:

[x(sj)=1sjxi∈sjxi] (4)

式中[sj]表示[sj]中圖像的相似度。

建立層級匹配量化編碼模型,得到向量信息融合中心輸出的特征信息為:

[F(k1,k2)=n1n2f(n1,n2)wk1n1N1wk2n2N2=AF(k1,k2)ejθF(k1,k2)] (5)

[G(k1,k2)=n1n2g(n1,n2)wk1n1N1wk2n2N2=AG(k1,k2)ejθG(k1,k2)] (6)

式中:[AF(k1,k2)]和[AG(k1,k2)]是圖像的互相位相關函數。

在多媒體數據庫中,圖像檢索的區域分布函數為:

[Ecv(c1,c2)=μ?Length(C)+ν?Area(inside(C))+λ1inside(C)I-c12dxdy+λ2outside(C)I-c22dxdy] (7)

式中:[c1]和[c2]為亞像素偏移特征系數;[Length(C)]為待匹配窗口的歸一化長度;[Area(inside(C))]為輪廓參考點和匹配點的梯度模;[μ,ν,λ1]和[λ2]為向量量化編碼的修正權重系數。

2 數據挖掘的圖像分類算法

2.1 圖像量化融合特征點數據挖掘

傳統的圖像分類方法采用圖像邊緣輪廓分割方法,結合語義特征提取實現圖像聚類檢索,在受到較大的擾動作用下圖像分類的準確度不高。為了克服傳統方法的弊端,提出數據挖掘的圖像分類算法,采用Harris角點檢測算法進行圖像的特征點提取挖掘[9],圖像Harris角點檢測模型如圖2所示。

對圖2中對角點周圍的像素點子集進行歸一化分割,得到圖像邊緣輪廓直線段的尺度值為:

[s(k)=??s(k-1)+w(k)] (8)

其中:

[?=1000001100001000001100001,w(k)=N(0,σθ(k))0N(0,σx(k))0N(0,σy(k))] (9)

采用中值濾波器進行角點檢測,初始化角點匹配濾波器,定義[K=0,]求解得圖像的第[t]幀中點的變化分量,采用數據挖掘方法進行圖像的角點篩選,得到特征點匹配函數為:

[skk-1=??sk-1k-1] (10)

對圖像進行量化融合,求得相應時刻子塊內的圖像角點[x,y]的像素空間特征軌跡,因[s(k)=θ(k),Δx(k),][Δy(k),]對圖像灰度化輸出數據信息進行特征匹配,得到圖像量化融合的迭代過程描述為:

[t(x)=1-minc∈r,g,bminy∈Ω(x)Ic(y)A] (11)

[U(x)=1-t(x)=minc∈r,g,bminy∈Ω(x)Ic(y)A] (12)

式中:[Ic(y)]為圖像角點的關聯特征值;[A]為幅度;[Ω(x)]為直方圖灰度圖像的鄰域空間。

通過圖像量化融合特征點數據挖掘,以提取的特征點為數據輸入進行圖像分類處理。

2.2 圖像分類算法

采用模糊C均值聚類算法進行圖像特征分類檢索,假設圖像量化融合特征點的數據時間序列為[x(t),][t=0,1,2,…,n-1],模糊C均值聚類的初始窗口定義為:

[u=[u1,u2,…,uN]∈RmN] (13)

求得圖像分類特征點的參考點搜索匹配點時的最大梯度差像素為:

[AVGX=1m×nx=1ny=1mGX(x,y)] (14)

式中:[m,n]分別是窗口最大級數和時間窗口的寬度。

提取圖像分類特征點的波束指向性信息,根據待匹配圖像的亞像素偏移信息進行自適應加權,得到輸出的加權向量為:

[x(t)=(x0(t),x1(t),…,xk-1(t))T] (15)

采用一個[1×N]的窗口進行圖像分類的聚類中心搜索,確定圖像Harris角點的大小[N,]計算其Harris角點的加權向量[ωj]的空間距離,表示為:

[dj=i=0k-1(xi(t)-ωij(t))2, j=0,1,2,…,N-1] (16)

以提取的特征點為數據輸入,采用LGB向量量化編碼進行圖像的聚類中心劃分[10],[lmax]級匹配窗口表示為:

[U={μiki=1,2,…,c,k=1,2,…,n}] (17)

計算兩個匹配窗口間的先驗知識篩選模型,圖像檢索的初始狀態為[xi(0)=xi(0)],通過模糊C均值聚類得到圖像優化分類的目標函數為:

[Jm(U,V)=k=1ni=1cμmik(dik)2] (18)

根據數據挖掘模型提取特征點,求像素樣本[Vi]的測度距離[(dik)2=xk-Vi2,]當聚類中心滿足:

[i=1cμik=1, k=1,2,…,n] (19)

此時,在多媒體信息數據庫中,圖像優化分類的檢索目標函數的極值為:

[μik=1j=1cdikdjk2m-1] (20)

[Vi=k=1m(μik)mxkk=1n(μik)m] (21)

通過上述算法設計,以提取的特征點為數據輸入,采用模糊C均值聚類算法實現數據挖掘和圖像分類。

3 實驗與結果分析

為了測試本文算法的圖像分類性能,實驗環境為:Intel[?] 2.3 GHz CPU,2 GB內存,32位Windows 7系統的PC機,利用Matlab 2014實驗平臺進行測試實驗。待分類的圖像如圖3所示,圖像的第[t]幀中點的變化分量[D=12,]嵌入維數[m=2,]角點篩選的失真閾值[ε]=0.24,尺度[σ(n)(1,2,…,n)=0.235,]待分類圖像的初始分辨率為520×38,滑動窗口歸一化時間寬度為1.4 s。

對圖3中的圖像進行Harris角點檢測,檢測結果如圖4所示。對圖像中的信息特征點進行提取挖掘,以提取的特征點為數據輸入,采用模糊C均值聚類算法實現數據挖掘和圖像分類,得到圖像中的信息特征分類提取輸出結果如圖5所示。

從圖5可知,本文算法可以準確實現圖像中信息特征的分類識別,為了定量對比性能,采用本文方法和傳統方法進行對比實驗,以分類精度為測試指標,結果如圖6所示,執行時間和輸出峰值信噪比的對比結果見表1,從圖6和表1可知,本文方法的圖像分類精度和圖像峰值信噪比均要高于傳統方法,圖像分類效果好,執行時間短,說明圖像分類的實時性較好,結果驗證了本文算法的優越性。

4 結 語

本文研究了多媒體信息數據庫中的圖像優化分類問題,提出數據挖掘的圖像分類算法,結果表明,采用該算法進行大型多媒體信息數據庫的圖像分類,對圖像中特征點的檢測準確度較高,輸出峰值信噪比提升,提高了圖像分類的準確性和魯棒性。

參考文獻

[1] 陶淑蘋,張續嚴,金光,等.基于方向WPS改進TDI CCD遙感圖像清晰度評價函數[J].紅外與激光工程,2013,42(8):2080?2084.

[2] 顧淑紅,花均南,呂濤.激光主動探測成像中拼接算法設計與仿真研究[J].激光雜志,2016,37(2):30?33.

[3] 代具亭,湯心溢,王世勇,等.掃描型紅外焦平面探測器圖像實時傳輸系統[J].激光與紅外,2016,46(4):476?480.

[4] 王小玉,張亞洲,陳德運.基于多塊局部二值模式特征和人眼定位的人臉檢測[J].儀器儀表學報,2014,35(12):2739?2745.

[5] 朱賀,李臣明,張麗麗,等.聯合灰度閾值分割及輪廓形態識別的河道提取[J].電子測量與儀器學報,2014,28(11):1288?1296.

[6] 李武周,余鋒,王冰,等.基于形態學濾波的紅外圖像背景補償[J].紅外技術,2016,38(4):333?336.

[7] 施曉東,劉格.一種光學遙感圖像海陸分割方法[J].國外電子測量技術,2014,33(11):29?32.

[8] 羅澤峰,單廣超.基于網絡和虛擬多媒體技術的海戰平臺視景仿真實現[J].物聯網技術,2015,5(3):91?92.

[9] 陸興華,張曉軍.人員圖像跟蹤過程中多人交叉區域防丟失方法[J].計算機仿真,2014,31(9):243?246.

[10] 張曉戎,王程成,胡光波,等.混沌差分優化數據聚類及在故障診斷中的應用[J].壓縮機技術,2013(6):16?21.

猜你喜歡
圖像分類特征提取數據挖掘
探討人工智能與數據挖掘發展趨勢
基于Daubechies(dbN)的飛行器音頻特征提取
基于并行計算的大數據挖掘在電網中的應用
Bagging RCSP腦電特征提取算法
一種基于引導濾波和MNF的高光譜遙感圖像分類方法
一種基于Hadoop的大數據挖掘云服務及應用
基于MED和循環域解調的多故障特征提取
基于GPGPU的離散數據挖掘研究
Walsh變換在滾動軸承早期故障特征提取中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合