?

數據恢復技術在計算機數據處理中的運用研究

2024-02-03 08:52余琳睆
信息記錄材料 2024年1期
關鍵詞:副本拷貝服務質量

余琳睆

(江西制造職業技術學院 江西 南昌 330095)

0 引言

在互聯網技術飛速發展的背景下,應用與用戶交互產生的數據量也隨之增大,計算機作為現階段采用的一種應用組件,其為個性化推薦、實施交互等提供了運行環境,但是計算機磁盤損壞、數據丟失等情況也層出不窮,對數據恢復技術進行研究迫在眉睫[1]。 有關研究顯示,磁盤損壞導致數據丟失概率為80%[2]。 為實現丟失數據的恢復,相關研究人員提出C?Algorithm 和U?Algoithm 兩種數據恢復算法,這兩種算法可實現數據恢復時的負載均衡[3]。 部分研究人員通過BP 方案實現丟失數據的恢復,但是此種方案的數據恢復時間相對較長[4]。 基于此,本文提出一種基于稀有度感知的分階段數據恢復算法,在現有數據的分布情況與利用情況的基礎上,通過分段恢復的方式,實現丟失數據的有效恢復。

1 計算機數據丟失、恢復問題分析

1.1 計算機數據中心架構

假設云系統計算機數據中心架構為3 層樹狀結構(如圖1 所示),主要由交換機與物理服務器組成,交換機作用在于連接物理機,物理機中包含大量原始數據。

圖1 計算機系統中心架構

若計算機數據中心中物理機數量為N物理機、原始數據數量為N原始,此時計算機數據中心可表示為式(1)所示。

1.2 數據中心服務和數據

對于計算機數據中心而言,其主要是根據數據分析結果,通過消耗相應的帶寬實現與用戶之間的交互,以此來為用戶提供相應的服務[5]。 因此,計算機數據中心所提供的服務可表示為式(2)所示。

式(2)中,Sj為第j個數據副本;Di為帶寬資源的需求。

對于計算機數據中心中的數據而言,其主要是以不同的形式存儲,故服務對Sj的依賴主要是對某一數據進行分析。

假設Bjk為數據Sj的第k個數據,此時計算機中心所提供的服務可進一步表示為式(3)所示。

式(3)中,Bjk為數據在Sj在Pk中的數據副本,Pk為物理機。 此時可通過公式(4)表示服務Fi訪問的數據副本,即:

則服務與數據副本兩者之間的關系可表示為式(5)所示。

由此可看出,服務主要由數據副本、物理機、帶寬資源等部分組成,服務主要是由相應的數據副本提供支持,數據副本可為多個服務提供支持。 對于數據副本而言,其在計算機系統中的重要性與對服務的支持程度,可在服務對帶寬資源需求的基礎上,定義其負載,即式(6)所示。

式(6)中,NF為數據中心服務數量。 因此,為有效提升數據安全質量,數據需遵循相應的安全分布原則,各組數據至少需有兩個副本分布在不同的機架中,當機架失效后,剩余副本仍能提供相應的服務。 對于數據副本的分布情況而言,可通過物理機對數據副本的承載關系以及物理機的位置關系進行表示,即式(7)、式(8)所示。

此時Sj在計算機系統中的副本數量可表示為式(9)所示。

在上述系統架構的基礎上,若出現磁盤失效導致數據副本丟失時,系統將自動恢復數據,也就是將源物理機中相應的數據副本拷貝到目標物理機中[6]。 在數據恢復過程中,數據的拷貝量對目標物理機造成一定的影響。 若系統中未做相應的數據拷貝,則服務質量最佳,將其記為1;若系統中數據拷貝難以滿足帶寬資源需求時,則可根據資源平均利用規則,將資源分配量進行轉變,此時物理機上應用的服務質量Q(Pi)可表示為式(10)所示。

式(10)中,1/(k+1)為轉變后的資源分配量。

此時,系統的整體服務質量QoS可表示為式(11)所示。

對數據的恢復而言,其主要是為了實現QoS的最大化。

1.3 計算機數據副本恢復問題

通過上述分析得知,在磁盤失效導致計算機系統中樣本數據丟失的情況下,可在確定數據恢復數量的基礎上,選擇適量的目標物理服務器。 由于目標物理機在安全規則的基礎上只能夠接收部分拷貝數據樣本,并且數據副本拷貝過程中會嚴重影響服務質量。 因此,在數據恢復過程中,需選擇能夠恢復所有預數據副本的物理機,進而降低服務質量的損耗[7]。

通過上述分析得知,數據副本的恢復問題屬于集合覆蓋的問題,也就是說需從相應的集合中,選擇若干個集合,這些集合中包含所有基本元素,且每個集合中都存在相應的選擇成本,這樣可將選中集合中的成本之和降低至最小。 對于數據副本恢復選中的目標服務器可接收副本集合(記為set(Pi))、 服務質量的損耗(記為cost(Pj)) 而言,其實質與集合覆蓋問題中的基本集合、成本相對應。因此,為有效降低數據拷貝對服務質量造成的影響,需從時間、數量等方面降低數據拷貝的數量。

2 基于稀有度感知的分階段數據恢復算法

2.1 算法分析

對于分階段數據副本恢復算法而言,其主要是將需要恢復的數據副本劃分成不同恢復階段,進而降低數據副本恢復過程中的鏈路資源開銷。 基于此,本文通過稀有度模型來描述數據中心中數據的冷熱程度。 對于稀有度而言,其主要是根據數據負載以及數據副本的個數進行確定,在通常情況下,確定數據負載主要表示該數據的副本負載之和,可表示為式(12)所示。

式(12)中,Ljk為Cjk的負載,NP為數據中心物理機個數。

則數據的稀有度可表示為式(13)所示。

式(13)中,β主要根據Hj的大小以及式中其他變量進行調節。 在數據稀有度RTj小于0 的情況下,說明數據活躍度相對較高,則數據稀有度較低,需進行恢復。 反之,數據為冷數據,稀有度較高,無須修復,但是這部分數據需遵循相應的安全規則。

2.2 算法實施過程

在進行數據稀有度感知分階段數據恢復時,首先需要確定恢復集合setA、setB,在這兩個集合中,setA中的數據不滿足安全規則,需要對其中的數據進行恢復,而setB中的數據滿足安全規則,但是該集合中數據的負載相對較高,需對其中的數據副本進行恢復處理;其次,在setA、setB集合的基礎上,采用分階段數據副本恢復算法,根據相應的安全等級,對副本進行安全恢復處理(優先恢復安全等級高的數據副本),在恢復過程中,需選擇負載相對較小的物理機,在最小負載機的物理機不滿足要求時,選擇小負載物理機。

3 算法測試分析

3.1 測試環境

為驗證本文提出算法的可行性,對其數據恢復效果進行測試。 測試環境參數為:在機架內增設4 臺物理機、2臺交換機,1 個交換機連接1 個機架中的2 臺物理機,通過路由器實現交換機之間的連接,鏈路帶寬定為1 000 Mb/s。 對于其中所使用的物理機而言,其可存儲1 000 個數據,且物理機中包含的數據副本初始數量在2 ~5 個范圍內,符合正態分布,并且滿足相應的安全規則。 當數據處理為初始條件下時,系統中會出現相應的服務,其中的每個服務與數據副本相對應,且服務負載為50 ~200 的正態分布。 為提升數據處理效果,試驗采用配置為Inteli7 處理器、8 GB 內存的計算機,通過該計算機模擬物理機的失效過程,并分析文獻[1]算法與本文算法數據恢復效果。

為測試不同負載下各算法數據恢復效率,測試過程中將服務的總帶寬需求作為衡量系統負載u的指標,具體表示為式(14)所示:

式中,F平為平均負載,等于每臺物理機上服務負載之和的平均值;L鏈路為鏈路帶寬。

通過計算得知,系統負載在40%~80%之間。

3.2 測試結果分析

(1)不同算法數據恢復平均服務質量評估對比分析

根據測試環境,對系統中磁盤失效時數據副本的恢復平均服務質量進行評估,評估結果詳見表1。

表1 系統中磁盤失效時數據副本的恢復平均服務質量評估結果

通過分析表1 中的數據得知,本文算法平均服務質量相對較高,由此表明本文提出算法在服務治療保證方面效果顯著。 除此之外,系統負載不斷增加的情況下,同一算法的服務質量變化量不大,究其原因主要是由于數據拷貝過程中,拷貝仍占用大量的帶寬資源,當原有服務負載小于100%時,其資源搶占能力大致相同。

(2)不同算法數據恢復時間評估度對比分析

對于數據副本恢復而言,其主要目的在于提升服務質量,數據恢復時間作為衡量數據恢復效果一個重要指標,系統恢復時間越長,表明系統再次失效的概率大。 針對此種情況,需在上述測試環境的基礎上,對不同算法數據的恢復時間進行評估,評估結果詳見表2。

表2 不同算法數據恢復時間評估度結果

對系統負載而言,其主要體現當前環境下服務自身的帶寬需求,同時也對數據恢復過程中可用帶寬資源造成一定影響,導致數據恢復過程中的帶寬資源受到影響。 從表2 中可看出,文獻[4]數據恢復時間相對較短,造成此種情況的原因在于文獻[4]中的算法直接將所有數據恢復,在數據恢復過程中產生的數據拷貝任務相對較多,進而搶占了大部分帶寬資源,促使其數據恢復時間縮短。 雖然本文算法的數據恢復時間相比較文獻[4]算法長,但是仍處于可接受范圍內。 但是,在本文算法數據恢復過程中,首先對不符合安全規則的數據進行恢復,且恢復時間遠小于總恢復時間。 在恢復不符合安全規則的數據后,系統便具備了應對磁盤再次失效的能力。

4 結語

針對計算機系統中的數據副本丟失問題,本文提出一種基于稀有度感知的分階段數據副本恢復算法,并以提升應用服務質量為目標,模擬測試了該算法在應用服務質量保障方面的效率。 測試結果表明,本文算法的數據恢復時間雖然長,但是仍處于可接受范圍內。

猜你喜歡
副本拷貝服務質量
論如何提升博物館人性化公共服務質量
面向流媒體基于蟻群的副本選擇算法①
唐氏綜合征是因為“拷貝”走樣了
副本放置中的更新策略及算法*
傾聽患者心聲 提高服務質量
堅持履職盡責 提升服務質量
Windows系統下強化容錯拷貝命令的實現
以創建青年文明號為抓手提升服務質量
基于硬盤還原卡的數據傳送技術在高校網絡機房中的應用
《口袋西游—藍龍》新副本“幽冥界”五大萌點
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合