?

超融合存儲控制器數據分布與捕獲技術

2024-01-02 13:11程瑞鵬
山西電子技術 2023年6期
關鍵詞:高階數據挖掘調度

程瑞鵬

(山西潞安礦業(集團)有限責任公司信息科技分公司,山西 長治 046204)

0 引言

隨著計算機技術的飛速發展,DDR存儲器性能也隨之提高,這也意味著存儲控制器工作頻率也越快,而這則導致存儲控制器有效數據窗口變得越來越小。數據捕獲技術可以通過大數據挖掘和資源優化配置,實現數據優化挖掘和自主控制,提高數據分類管理能力。因此優化數據捕獲技術,實現數據高效準確捕獲對提高數據信息融合和挖掘等方面的能力具有重要意義。

1 存儲控制器數據結構和提取

1.1 存儲控制器數據結構

目前,計算機系統常見存儲器數據寬度為64位,而大部分數據存儲器具備ECC功能,在數據存儲過程中就有72位來自不同SDRAM、DDR存儲器數據,再加上傳輸長度、阻抗等參數影響,進一步增加了數據到達存儲控制器的離散,導致數據同步困難,甚至可導致數據窗口消失[1]。為減少數據離散程度,實現數據的有效捕獲,同時提高存儲器控制器存儲服務效能,建立以分布式結構為主的結構模型,并融合ACSESS存儲和云存儲結構,實現存儲數據的信息調度和分區融合。該存儲器結構模型集成了映射關系分析和數據融合兩種功能,根據數據動態標簽實現數據快速檢測和鏈路設計,即將作為數據檢測序列模型,利用超融合架構模型對存儲控制器數據進行挖掘和分析,進而獲取數據關聯向量。在該結構模型下,根據Map/Reduce編程計算方法得到非結構數據庫時態集合E=U/RC={Ei|i=1,2,…,n}和聚類分布模型。

(1)

式中:z為數據訪問比特率,z=[z1,z2,…,zn]∈Pmn(其中zn為存儲控制器數據分布狀態集)。

(2)

式中:τ為數據捕獲延遲;d為時間;x(t)為存儲控制器數據時間序列。

為準確表達超融合存儲控制器數據多樣性特征,重構數據庫信息流特征,進而得到數據輸出控制函數l(t):

(3)

式中:vn為數據傳輸速率;f為數據采樣頻率;un為數據獲取時間窗口寬度。

根據上述數據訪問模型,利用數據挖掘和數據頻譜分析方法可以實現數據的快速、有效捕獲[2]。

1.2 數據特征提取

存儲控制器數據捕捉存在不確定延時影響因素和輸入延時因素,并且數據傳輸至存儲控制器寄存器的時間與核心時鐘的相位關系為非固定狀態,而存儲控制器數據捕獲需要精準的時間和有效窗口。為提高超融合存儲控制器數據捕獲能力,借助超融合架構建立數據特征信息流[3]。由于超融合存儲控制器本身存在鄰階向量等影響因素,為消除以上干擾,利用波束冗余濾波法濾除數據傳輸過程中存在的干擾,進而達到提高數據分析和辨識能力的目的,超融合存儲控制器數據濾波函數為:

(4)

為進一步提高有效數據挖掘效率和質量,采用相位差分識別法計算數據融合誤差平方,如式(5):

ε2(k)=d2(k)-2d(k)XT(k)W+
WTX(k)XT(k)W.

(5)

式中:d(k)為數據迭代次數;W為比特序列識別率。

根據式(5)建立多重假設判斷標準,深入挖掘超融合存儲控制器數據信息。對于數據融合和跟蹤處理,采用混合差分進化法建立不同尺度下的存儲控制器數據分布關聯維x(t)=λRe{an(t)e-j2πfcτn(t)sl(t-τn(t))e-j2πfc},其中λ=LEQKL/LEQw+pL是頻數特征值。在確定數據挖掘頻數特征值和待捕獲數據特征量的情況下,利用超融合方法計算存儲控制器數據增益特征值:

(6)

存儲控制器數據融合過程中,為進一步提高數據挖掘速度和質量,建立數據融合函數:

(7)

式中:A為聚類幅值;ρ為加權系數;m為濾波器階數;ejφ為期望值;z為隨機變量zφ(0,1)。

2 超融合存儲控制器數據捕獲優化

2.1 技術優化

根據超融合存儲控制器數據模糊調度和分布結構模型,對數據捕獲技術進行優化,進一步提高數據捕獲精度和數據挖掘精度[6]。根據數據挖掘過程中存在的干擾信息特征,對存儲控制器中的數據進行模糊調度處理,充分挖掘存儲控制器中有效數據和干擾數據的信息特征和關聯關系,然后按照數據序列對數據重新排序。采用數據統計融合方法,對數據進行處理,假設數據采樣寬度為Tc=1/Re,則存儲控制器數據高階統計量為:

(8)

式中:cn為數據捕獲過程中優化分類尺度,cn取值為1或-1;gc為數據特征值。

為簡化分析過程,基于存儲控制器高階統計量,將數據挖掘問題轉換為假設檢驗問題,如下所示:

(9)

式中:r(t)為數據指數分布;n(t)為平均統計信息量;g(t)為數據聚類中心矢量。

2.2 數據捕獲

根據數據模糊分區調度和高階統計量,計算存儲控制器數據采樣時間,假設采樣時間間隔,結合時間開銷算法計算出存儲控制器數據分塊匹配函數為:

(10)

在存儲控制器中,采用逆向檢索方式獲取有效數據,并獲取數據輸出狀態矢量x(t)=R(a(t)eiθ(t)=a(t)cos(t)),根據該矢量算法對存儲控制器中的相同信息屬性和語義的數據分類,進而獲得數據挖掘分類屬性和特征辨識函數:

(11)

(12)

根據存儲控制器數據特征、模糊分區調度和高階統計量分析結果,得到經過優化后的存儲控制器數據挖掘結果輸出相頻特性:

φl(f)=-[π(f-f0)2]/k+arctan[s(v2)+
s(v2)/c(v1)+c(v2)].

(13)

對超融合存儲控制器數據捕獲優化后,可以實現存儲控制器的自我學習,并根據數據關聯特征,結合數據模糊分區調度和高階統計量分析結果,快速捕獲有效數據。

3 仿真分析

為測試超融合存儲控制器數據捕獲效果,搭建計算機仿真平臺展開測試分析,仿真平臺配置包括兩臺10M存儲控制器、云平臺組件、Intel Core i5處理器等。存儲控制器為Eucalyputs結構模型,通過云平臺對存儲控制器數據進行挖掘和捕獲。數據捕獲過程中,設置數據采樣時間間隔為0.1 s,干擾強度為-10 dB,帶寬為120 Buad。分別選取不同數量的數據塊與未優化的數據捕獲技術進行對比分析,以此來驗證優化后的數據捕獲技術的高效性和準確性。本文分別對深度學習算法標簽生成方法、空間學習語義標簽生成方法和本文提出大數據用戶畫像標簽生成方法進行仿真測試。

3.1 數據辨識系數測試

表1所示存儲控制器捕獲技術優化前后數據辨識測試結果,從表中可以看出,采用數據模糊分區調度和高階統計量方法對數據捕獲技術進行優化后,數據辨識系數較高,并且隨著數據塊識別數量增加,優化后的數據辨識系數也有一定程度提升,相較于優化前的數據捕獲技術,優化后的數據捕獲技術在數據辨識方面的優勢明顯,由此可見優化后的數據捕獲技術可以準確識別數據類型。

表1 存儲控制器數據辨識系數測試結果

3.2 數據辨識可靠性測試

表2所示優化前后可靠性測試結果,從表中可以看出,經過優化后數據捕獲技術辨識準確性明顯高于優化前的數據捕獲技術。本文提取了存儲控制器同類數據標簽特征共性,并根據提取結果對數據模糊分區調度和高階統計量分析,實現了數據有效識別,因此經過優化后的數據捕獲技術在數據辨識方面的可信度得到了一定程度的提升。

表2 數據辨識可靠性測試結果

3.3 數據捕獲精度測試

表3所示數據捕獲精度測試結果,從表中可以看出,經過優化后的數據捕獲精度得到了一定程度的提升,并且隨著數據塊數量的增加,測試結果精度也有所提升。由此可見,經過優化后的數據捕獲技術在數據辨識度和捕獲精度方面具有較高的可靠性。

表3 數據捕獲精度測試結果

4 結語

綜上所述,本文研究了以超融合架構為基礎的存儲控制器數據分布與捕獲技術,基于超融合架構建立了存儲控制器數據分布結構模型,并提取了存儲控制器數據特征量,根據數據特征提取結果對數據進行模糊分區調度和高階統計量分析。為進一步提高數據捕獲辨識精度和捕獲精度,對干擾因素進行濾除,進而實現數據高效、準確捕獲。

猜你喜歡
高階數據挖掘調度
有限圖上高階Yamabe型方程的非平凡解
探討人工智能與數據挖掘發展趨勢
高階各向異性Cahn-Hilliard-Navier-Stokes系統的弱解
滾動軸承壽命高階計算與應用
《調度集中系統(CTC)/列車調度指揮系統(TDCS)維護手冊》正式出版
一種基于負載均衡的Kubernetes調度改進算法
虛擬機實時遷移調度算法
一類完整Coriolis力作用下的高階非線性Schr?dinger方程的推導
基于并行計算的大數據挖掘在電網中的應用
一種基于Hadoop的大數據挖掘云服務及應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合