?

基于鄰域粗集神經網絡的大數據特征分類系統

2024-04-13 06:54朱磊凌嘉敏
電子設計工程 2024年7期
關鍵詞:鄰域元件神經網絡

朱磊,凌嘉敏

(1.浙江理工大學,浙江 杭州 310000;2.浙江外國語學院,浙江 杭州 310000)

大數據特征分類是指在互聯網手段的作用下,按照數據樣本表現形式所建立的數據信息特征提取與類別劃分過程[1]。一般來說,數據樣本類型越多,特征分類原則也就越復雜。然而隨著大數據樣本的不斷累積,主機元件對這些信息參量的準確分類能力明顯下降,這不僅會導致數據誤傳,還會使主機運行速率受到影響。

常規的k-prototypes 聚類算法通過求解相異度系數來確定大數據的熵權分類標準,又利用經典kprototypes 算法分類處理大數據樣本特征[2]。然而利用此方法所得大數據的單位召回率水平相對較低,主機元件難以實現對大數據的精準分類。

粗糙集可以在不應用集合外先驗信息的同時,處理各項不完全、不確定、不精確的數據對象。粗糙集理論可以在保持網絡系統對數據樣本分類能力的同時,刪除初始數據中的冗余信息,使得網絡主機能夠準確推斷出初始分類規則[3]。鄰域粗集神經網絡是在粗糙集理論基礎上發展而來的一種可以實現數據區分的結構。在特征參數難以被準確測量出來的情況下,鄰域粗集神經網絡會篩選待訓練樣本,以供其他設備元件的裁決與判定。由于整個處理過程中無需其他元件的配合,故而其分類準確性相對較高[4]。

隨著電商領域的發展及其所應用技術的升級,電商大數據的累積量也在不斷增大,導致在既定時間范圍內,應用常規工作軟件能捕捉到的電商大數據特征集合。為此,該文以鄰域粗集神經網絡為基礎,設計了一種新的數據特征分類系統。

1 調制信息選取

在大數據特征分類系統中,調制信息的選取過程應建立在鄰域粗集神經網絡的基礎上,對所選數據樣本進行逼近處理。

1.1 鄰域粗集原理

鄰域粗集的定義包含鄰域?;幚?、鄰域粗糙集逼近兩部分,具體研究方法如下。

1)鄰域?;幚?。鄰域?;幚砭褪菍⒁讯x鄰域節點聚合在一起,再通過突出優化的方式,使得原有粗糙集合對于數據樣本的承載能力大幅提升,從而使得網絡主機能夠準確辨別出?;濣c所處的位置,從而增強大數據分類行為的執行準確性[5]。

假設en表示n個不重合的鄰域節點定義參量,其求解過程如下:

其中,wn表示n個粗糙度向量,δn表示n個大數據樣本取值系數。在式(1)的基礎上,假設Δe表示鄰域節點的單位變量,β表示鄰域標記系數,αi表示?;葪l件,α0為其初始賦值,聯立上述物理量,可將鄰域?;幚肀磉_式定義為:

?;葪l件越小表示鄰域節點的聚合能力越弱。在實施?;幚頃r,所需消耗的鄰域節點參量也就越少。

2)鄰域粗糙集的逼近。鄰域粗糙集逼近是在已知領域節點所處位置的基礎上,通過逼近處理的方式,確保邊緣節點與中心節點之間的距離始終處在可控范圍之內,從而使得鄰域粗集神經網絡對于數據樣本的承載能力得到提升。

一般情況下,粗糙度較高側鄰域節點的分布數量較多,而粗糙度較低側鄰域節點的分布數量較少[6-7]。在實施逼近處理時,將鄰域節點劃分在同一平面內,且規定粗糙度平均值能夠描述該平面內鄰域節點的具體分布狀態。假設r表示逼近參量的初始賦值,χ表示鄰域節點排列系數,ymax表示粗糙度指標的最大賦值結果,ymin表示粗糙度指標的最小賦值結果,yˉ表示系數ymax與系數ymin的平均值,φ表示邊緣化逼近向量。在上述物理量的支持下,聯立式(2),可將鄰域粗糙集逼近原則定義為如下形式:

由于鄰域節點劃分平面不具備絕對性,所以鄰域粗糙集逼近表達式的作用只具有參考價值,并不能直接影響鄰域節點在神經網絡模型內的排列與分布形式。

1.2 神經網絡模型

神經網絡模型是在鄰域粗集原則基礎上構建的網絡結構,由輸入節點、篩選節點、聚合節點、輸出節點四部分組成。其中,輸入節點直接接觸數據,負責錄入樣本信息[8-9];篩選節點與輸入節點按照鄰域粗集原則,挑選處理待分類的大數據特征參量,再將這些信息樣本反饋回系統數據庫主機;聚合節點對已篩選出來的大數據特征參量再次聚合,使分類主機能夠準確分類數據樣本;輸出節點只負責顯示樣本信息,不能改變數據的排列形式[10]。鄰域粗集神經網絡結構如圖1 所示。

圖1 神經網絡模型結構

2 大數據特征分類系統設計

利用鄰域粗集神經網絡選取調制信息樣本后,按照調制識別器設置、大數據特征導出、多標合并的處理流程,實現大數據特征分類系統的設計與應用。

2.1 調制識別器

調制識別器負責提取鄰域粗集神經網絡中存儲的數據樣本,利用傳輸信道將信息樣本反饋至底層調制芯片與Map 識別元件中,并于其中生成長期文本記憶,以供系統分類主機的直接調取與利用[11-12]。調制識別器結構的連接簡圖如圖2 所示。

圖2 調制識別器結構簡圖

鄰域粗集神經網絡輸出的大數據樣本保持并序排列的分布狀態,隨著網絡覆蓋區域的增大,其排布形式卻并不會發生改變。作為調制識別器的核心處理設備,數據調制芯片、Map 識別元件對于數據樣本的存儲能力并無明顯差別,但前者對于數據信息排列標準的要求相對較高,其內部存儲對象必須保持為順序排列狀態,而后者對于數據信息的排列標準無嚴格要求[13]。

2.2 大數據特征導出

大數據特征導出過程就是將大數據樣本由鄰域粗集神經網絡導出至分類系統運行主機的過程。由于調制識別器設備的存在,大數據樣本的單位輸出量并不會無限增大,故而在系統運行過程中,當已導出特征參量達到既定數值水平后,神經網絡體系會自動判定系統網絡主機已達到最大運行速率[14-15]。假設u表示基于鄰域粗集神經網絡的大數據分類指標,其求解表達式如下:

其中,γ表示鄰域粗集神經網絡中的數據樣本識別權限,ε表示數據樣本度量值,Iε表示基于系數ε的大數據查詢條件。在此基礎上,令ι、κ表示兩個隨機選取的大數據樣本傳輸量,Aι表示基于ι的分類特征,Aκ表示基于κ的分類特征,φ表示大數據樣本的分配權重值,聯立上述物理量,可將大數據特征導出結果表示為:

若ι與κ的差值較小,則表示待分類的大數據特征指標相對較少;反之,則表示特征指標相對較多,鄰域粗集神經網絡所需承擔的數據處理指令相對較為復雜。

2.3 多標合并

多標合并是設計大數據特征分類系統的關鍵處理環節,可以將已導出的大數據特征串聯在一起,以供鄰域粗集神經網絡的自主選擇[16]。由于鄰域粗集神經網絡中同時運行的大數據總量相對較多,所以在求解多標合并規則時,應確定當前情況下待分類大數據特征參量的具體數值水平。假設kn表示n個待運行的大數據樣本,λn分別表示與n個大數據樣本匹配的特征參量合并處理系數,h表示基于鄰域粗集神經網絡的大數據標定參量,且其取值恒大于自然數1。大數據特征分類系統多標合并原則的推導條件滿足式(6):

按照多標合并原則,調節相關硬件設備的運行狀態,實現基于鄰域粗集神經網絡的大數據特征分類系統的順利應用。

3 實例分析

3.1 實驗流程與數據處理

為驗證上述分類系統的執行能力,設計對比實驗,具體實驗流程如下:

1)將基于鄰域粗集神經網絡的大數據特征分類系統作為實驗組,控制主機元件,并記錄相關指標參量的數值變化情況;

2)閉合相關控制按鈕,使實驗組系統進入自主運行狀態后,關閉控制按鈕,調節相關設備元件至初始狀態;

3)將傳統的k-prototypes 聚類算法作為對照組,控制主機元件,記錄相關指標參量的數值變化情況;

4)閉合相關控制按鈕,使對照組系統進入自主運行狀態;

5)對比實驗組、對照組記錄數值,總結實驗規律。

主機元件對大數據樣本的分類準確性可以反映出所選系統對大數據的傳輸能力。主機元件對大數據樣本的分類準確性越高,系統對大數據的傳輸能力就越強,即數據誤傳行為的出現可能性越小。該指標的計算過程為:

其中,η表示主機元件對大數據樣本的分類準確性,ξ表示實驗數據樣本的單位召回率,ω表示收斂分類容差。根據式(7)可知,實驗數據樣本的單位召回率越高、收斂分類容差越大,表示主機元件對大數據樣本的分類準確性越高。

3.2 結果與分析

圖3 反映了實驗組、對照組實驗數據樣本單位召回率指標的數值變化情況。

圖3 實驗數據樣本單位召回率

分析圖3 可知,實驗組數據樣本單位召回率指標保持先上升、再波動、最后基本趨于穩定的數值變化狀態,在15 min時,單位召回率指標達到最大,數值為65%;對照組數據樣本單位召回率指標則呈現出先上升、再下降的數值變化態勢,在20 min時,單位召回率指標取得最大值32%,低于實驗組最大數值。由此可知,實驗組系統可將大數據的單位召回率提升至65%,明顯優于對照組,說明實驗組系統主機元件對大數據樣本的分類準確性也更高。表1 統計了收斂分類容差的變化情況。

表1 收斂分類容差指標

由表1 可知,隨著實驗時間的增加,實驗組、對照組的收斂分類容差指標均不斷增大,但實驗組容差指標均值略高于對照組。在整個實驗過程中,實驗組收斂分類容差指標最大值1.20,與對照組最大值1.10 相比,增大了0.10。

為確定系統對于大數據特征的最強分類能力,求解準確性指標。選取樣本單位召回率指標、收斂分類容差指標的最大值,計算實驗組、對照組分類準確性,具體計算過程如下:

其中,C、Cmax分別表示樣本單位召回率指標及其最大值,D、Dmax分別表示收斂分類容差指標及其最大值,ω1、ω2分別表示召回率和分類容差的權重。經式(8)的計算,統計實驗組、對照組的分類準確性,結果如表2 所示。

表2 分類準確性

分析表2 可知,實驗組、對照組的分類準確性呈現上升態勢,經多次測試后,實驗組的分類準確性達到94.55%,明顯高于對照組。

綜上可知,應用傳統系統后,實驗數據樣本單位召回率指標的數值水平相對較低,故而該系統并不能完全滿足主機元件對大數據樣本進行精準分類的需求;基于鄰域粗集神經網絡的系統能夠有效提升數據樣本的單位召回率水平,在解決大數據誤傳問題、提升主機元件對大數據分類準確性方面具有更強的實用性價值。

4 結束語

以鄰域粗集神經網絡為基礎,大數據特征分類系統設置了調制識別器結構,又通過推導大數據特征導出條件的方式,定義多標合并表達式。與常規的k-prototypes 聚類算法相比,這種新型分類系統從提升主機元件對大數據分類準確性的角度著手,能夠在解決數據誤傳問題的同時,聯合相關應用設備,調整鄰域粗集神經網絡的實際覆蓋面積,不僅實現了對相關特征分類節點的鄰域?;幚?,也使得鄰域粗糙集結果能夠更加逼近實際約束標準。

猜你喜歡
鄰域元件神經網絡
稀疏圖平方圖的染色數上界
神經網絡抑制無線通信干擾探究
基于鄰域競賽的多目標優化算法
關于-型鄰域空間
QFN元件的返工指南
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
在新興產業看小元件如何發揮大作用
寶馬i3高電壓元件介紹(上)
基于支持向量機回歸和RBF神經網絡的PID整定
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合