?

“大數據”時代背景下計算機信息處理技術研究

2018-11-07 03:06張書月
電子測試 2018年19期
關鍵詞:計算機信息數據挖掘大數據

張書月

(廣州工商學院電子信息工程系,廣東廣州,510850)

1 基本概念分析

1.1 大數據

大數據,指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。關于大數據,麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征[1]。了解大數據的具體定義,認識大數據的價值,在當前的社會背景下有重要的意義。

1.2 計算機信息處理技術

圖1 計算機信息處理技術的基本操作原理結構

計算機信息處理技術具體指的是利用計算機對信息做處理的技術。對此種技術做具體的分類發現其主要有三類:其一是信息系統技術。信息系統技術是以計算機為中心,以數據庫和通信網絡技術為依托實現對信息處理的技術。其二是數據庫技術,將信息進行整序是數據庫技術的核心內容,它能將相關的信息集合,實現信息的有序存儲和有效利用。其三是檢索技術,檢索技術的利用使得信息數據的查詢與利用更加的便捷。具體來講,計算機信息處理技術的利用極大的便捷了信息的處理,實現了信息數據利用的價值提升。

2 大數據研究的意義以及機遇和挑戰

2.1 大數據研究的意義

大數據在當前的時代背景下具有重要的利用價值,具體研究大數據有三方面的重要意義:首先,大數據是一個國家的信息戰略資源,其研究的深度對于國家信息安全的競爭力提升而言具有重要的幫助。其次,大數據的研究可以加速大數據的利用,而在大數據的利用背景下,產業發展的分析會更加的準確,這對于我國的產業升級和經濟發展結構調整來講有重要的意義。也就是說大數據的分析研究可以推進我國產業進步。最后是大數據引發了科學思維革命,所以研究大數據可以更好的實現科學研究。

2.2 大數據研究的機遇和挑戰

大數據研究在當前的社會既有挑戰也有機遇,從目前的分析來看,機遇主要表現在三個方面:其一是數據的發掘和應用能夠產生更為顯著的產業價值;其二是大數據時代帶來了信息安全、云計算以及物聯網的新形勢;其三是大數據對信息安全的要求帶來了信息安全的進一步發展[2]。有機遇自然也有挑戰,具體的挑戰體現在兩方面:首先是大數據時代對數據挖掘的要求有了明顯的提升。其次是大數據時代下的信息安全要求更高。

3 大數據時代下的計算機處理技術

計算機處理技術在社會不斷進步的基礎上其內容在不斷的豐富。就大數據時代的計算即處理技術分析來看,其包含的內容更加的復雜,以下是技術的具體分析。

3.1 DEEP WEB數據感知與獲取技術

首先,大數據時代下的計算機處理技術,比較重要的一項內容是DEEP WEB數據感知與獲取技術。所謂的DEEP WEB技術實際上就是網絡深層空間技術,此技術的數據量信息規模比較大,信息的動態變化、分布性和訪問方式都比較的特殊。具體分析DEEP WEB技術的利用,其主要是對數據做充分的利用,然后將其進行高質量的集成,由此達到數據的抽取和整合。從具體的利用分析來看,DEEP WEB技術的使用可以將有用信息數據從大量的數據中進行抽取,實現對其的利用,所以此種技術的使用對于數據的準確利用具有重要的幫助。

3.2 分布式數據存儲

其次,分布式數據存儲是大數據時代下計算機處理技術的重要利用。從目前的分布式數據存儲技術利用分析來看,其現實價值的發揮基于谷歌公司的GPS技術,此技術在IBM以及百度等企業中進行著大量的應用并獲得了迅速的發展。具體分析分布式存儲,其主要利用的是列存儲的概念,而所謂的列存儲,具體指以列為單位的存儲形式,和行存儲進行比較,這種存儲方式在數據壓縮方面的優勢顯著,循環更加的迅速。觀察該技術在實踐中的應用效果,發現其在海量數據的加載和磁盤空間的高效利用方面表現出了明顯優勢。

3.3 數據高效索引

其三,大數據時代下的計算機處理技術中,數據高效索引也是重要的一項。就當前的主流索引技術分析來看是谷歌公司提出的BIGTABLE技術。分析當前的索引技術,集中的焦點主要有兩個:其一是聚簇索引,此種索引方式可以同時按照索引的順序對全部的數據結構進行存儲。其二是互補式聚簇索引。此種索引方式主要是利用副本為索引列進行互為補充的索引表創建。在此種索引方式的具體利用中,其還會與查詢結果估算進行結合,從而實現最優的數據查詢計劃。

3.4 基于內容信息的數據挖掘

計算機處理技術在大數據時代的第四種重要利用是基于內容信息的數據挖掘。所謂的基于內容信息的數據挖掘,具體指的是網絡搜索技術和實體關聯的分析。研究當今的互聯網現狀發現排序學習算法是互聯網信息搜索的熱點,而此種算法的具體提出主要針對的是大規模的社會媒體信息量具有短文本的特征?;诖颂卣?,利用排序學習算法可以很好的處理和分析數據信息。而對排序學習算法做具體討論,其主要包含了逐點、逐對和逐列三項內容。

3.5 遺傳算法和神經網絡

遺傳算法和神經網絡也是大數據時代下計算機處理技術的重要技術內容。從具體的分析來看,遺傳算法的提出主要借鑒的內容是生物界的進化規律演化的隨機化搜索方法,而要利用遺傳辦法進行尋優,需要采用概率化方法,因為其能夠對搜索的方向做自動調整。目前,遺傳算法已經得到了普遍性的應用,具體表現在機器的學習、信號的處理等方面。模擬神經算法,其主要是在模擬動物運行神經的基礎上形成的網絡行為,是一種可以利用分布式并行信息處理的數學算法。

3.6 分類分析和聚類分析

在大數據時代,計算機信息處理技術的第六項應用體現在分類分析和聚類分析方面。所謂的分類分析,具體指的是對數據點進行分類,然后再做新的數據點確立,所以其具體的使用可以在明確假設和客觀結構的前提基礎上進行,從而對客戶的行為做預測。聚類分析,其具體指在不明確限制的基礎上對對象組做集合,然后對對象組進行分析的方法。具體討論分類分析和聚類分析,其在數據挖掘方面的作用表現十分的突出。

3.7 數據分析技術

在大數據時代背景下,計算機信息處理技術還包括數據分析技術。做數據分析技術的研究發現其主要包括了情感分析、網絡分析、時域序列分析以及回歸分析四方面的內容。在具體分析中,情感分析主要是對自然語言做主觀的判斷,而網絡分析則是基于網絡特點的判斷??臻g分析主要是做點集拓撲的了解??傮w來講,在計算機信息處理技術的具體利用中,最為重要的便是對數據進行利用,而數據處理技術便是對具體數據的利用。

4 大數據時代下計算機信息處理技術的發展方向

大數據時代在當前社會的表現越來越強烈,在這樣的大環境下,計算機信息處理技術的發展傾向也更加的明顯??偨Y當前的技術利用實踐和研究實踐,發現技術進步再往三個方向發展:其一是計算機網絡在向著云計算的方向發展,而且這種趨勢在逐漸的增強。其二是計算機技術在向開放式網絡傳輸發展。出于社會公共網絡應用的要求,開放式網絡的規模在不斷的擴大。其三是計算機和計算機網絡的融合性發展更加的顯著,而這種融合性發展對于滿足社會需要來講意義顯著。

5 結語

大數據時代背景下的計算機信息處理技術在不斷的豐富和發展,具體的討論相關技術內容并就大數據時代下的計算機信息處理技術具體利用做分析,這可以更好的認識技術,從而在實踐中強化對其的應用。

猜你喜歡
計算機信息數據挖掘大數據
BIM時代計算機信息技術在建筑工程中的應用
探討人工智能與數據挖掘發展趨勢
上海萬欣計算機信息科技有限公司
“大數據”時代的計算機信息處理方法闡述
基于并行計算的大數據挖掘在電網中的應用
計算機信息處理技術
基于大數據背景下的智慧城市建設研究
一種基于Hadoop的大數據挖掘云服務及應用
基于GPGPU的離散數據挖掘研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合