?

互聯網大數據的多維度特征數據的應用

2013-09-03 06:32吳俊爽韓琴琴劉誠偉
中國信息化·學術版 2013年7期
關鍵詞:多維度建模用戶

吳俊爽 韓琴琴 劉誠偉

【摘 要】隨著計算機技術和應用飛速發展,互聯網上的數據每年將增長50%,網民數量也成倍的增加,再加之全世界其他各行各業每分每秒都在制造著大量數據?!按髷祿钡母拍钪鸩奖蝗藗兯匾?,本文提出了一種大數據的多維度特征表示方法(BDDP),并且積極探討了這種表示方法在互聯網中的應用,比如:招聘信息挖掘、移動APP的廣泛利用。

【中圖分類號】TP393.4【文獻標識碼】A【文章編號】1672-5158(2013)07-0117-02

1、研究背景介紹

大數據具有信息體量巨大、數據類型繁多、價值密度低,商業價值高、處理速度快的4個“V”特點。[1]大數據的概念一經提出,科學研究者就發現大數據技術的戰略意義并不在于對掌握龐大的數據信息而歡欣鼓舞,而在于對這些含有意義的數據進行專業化處理,即提高對數據的“加工處理能力”體現數據的“價值”。本文認同,在大數據時代下,仍將是以數據為中心的SOA模型占領主導地位。故本論文側重對大數據本身的處理,而并非對其存儲等架構技術[2]做過多的探討。本論文提出了大數據的多維度處理方法,將互聯網上的大數據進行整合處理,并對其應用到互聯網應用中提出了憧憬和建議。

2、 大數據的多維表示方法(BDDP)

2.1 互聯網應用中的大數據

2.1.1 互聯網中的大數據定義

互聯網中的大數據目前還沒有很明確的定義,本論文特指其是:由互聯網產品或者網民產生的大量數據。如:商品信息、商品價格、用戶信息(位置、好友信息、生活信息)、 音頻、視頻、圖片、網站管理日志、用戶登錄日志 、社交網站中的聊天記錄、博文等等。[3]

2.1.2 互聯網用戶產生大數據的方式

目前,互聯網用戶的主要接入媒介分為:PC和手機、智能平板等移動和不可移動終端。[4]加之互聯網應用包括:企事業信息門戶網站、百度等搜索引擎、新浪等新聞網站、APP應用商城、阿里巴巴等電子商務網站、社交網站、騰訊微博、騰訊微信、移動互聯網應用等。因此本論文認為,大數據產生方式有以下:

1) 新聞、企事業單位網站的每日新聞、政策公布

2) 博客用戶針對新聞事件的討論、引用

3) 移動APP用戶信息匯總(移動終端觸摸行為)

4) 電子商城用戶行為(鼠標點擊行為)

5) 社交網站用戶的交流與社交關系

2.2 BDDP數據建模

2.2.1 BDDP建模的依據

互聯網大數據的產生方式是可以根據2.1.2中進行劃分的,因此能夠準確的了解并掌握不同數據的特征與特性。這些數據可以是結構化的、半結構化的、非結構化的。

但是這些數據的產生都是基于為用戶服務產生,并且由于用戶不同的參與行為導致數據急劇增加,因此用戶行為分析,[5]可以幫助我們進行BDDP數據建模。另一方面,互聯網應用供應商性質,也是決定數據性質的一個關鍵因素。

2.2.2 BDDP建模算法

1)以新聞事件為中心的大數據產生模型

對某一新聞頭條為中心的大數據產生進行建模

第二層微博、微信、QQ推送記錄為第二層數據

第三層各種互聯網用戶產生的行為記錄為

我們還可以在每一層數據上加入時間維和地點維,這樣我們不僅可以檢測到該條新聞的傳播影響力,而且可以很清晰的查看到該頭條新聞在某一時所產生的影響,便于新聞歸檔,方便以后查閱。

2)移動互聯網APP為中心的大數據產生模型

對某款新的手機APP為中心的大數據進行建模圖2 典型的APP事件流動模式

根據上圖,本論文將APP產品數據記錄建立大數據多維特征數據

第一層數據

第二層數據

第三層數據

同理我們可以在每一層數據上加上時間維和地點維,便可得到特定時刻某個APP產品的用戶數量。

綜上所述,以上僅是兩種典型的模型,不足以代表所有互聯網大數據的產生模式。但是整體看:移動互聯網大數據一致可以分為三層、最多四維的特征數據,而最后一層數據通常又是以一個中心向外輻射的特征數據集,由于輻射數據集的復雜性才使得互聯網大數據的處理和挖掘變得異常困難。但是上述的大數據的多維度特征數據維度較少,定義精確,可以那個多層次關聯規則數據挖掘算法,[6]以較高的效率實現。

3、 BDDP在互聯網中的應用

移動互聯網的發展,離不開用戶的支持?,F在很多互聯網企業都是利用高瀏覽量來賺取廣告費用。掌握大量數據、分析用戶消費行為、引導用戶消費已然成為目前各大互聯網企業的重點研究領域。

前程無憂,應屆生求職網等以發布招聘信息為主的招聘網站,它并不為用戶提供任何職位,而是求職者和招聘單位的一個溝通橋梁。通過點擊率賺取利潤,這是一種典型的以新聞事件為中心的大數據產生模式。

近期,百度發布了“明星臉”,是一款手機終端的APP[7],目前該APP功能較單一,就是支持用戶上傳照片,然后識別與用戶相似的明星臉。其實這就是第二種大數據產生模式的一個應用。其發布時間是2013年愚人節那天,經過APP為中心的數據產生模式,很快就有了大量用戶關注。

從上述的分析可以知道,很多互聯網公司是憑借大量用戶、擁有大量數據,靠著模式創新而不是提供產品來獲得利潤。因此掌握互聯網大數據多維特征數據,有利于互聯網企業準確定位,建立正確的盈利模式。

4、 結束語

參考文獻

[1] 百度百科 大數據詞條 http://baike.baidu.com/view/6954399. htm 2013-4-5

[2] 王珊,王會舉,覃雄派,烜周.《架構大數據:挑戰、現狀與展望》 計算機學報Vol.34 No.10 Oct.2011

[3] 199IT推薦文章,2012年中國移動互聯網發展歷程回顧,2013-4- 3

[4] 劉三德.互聯網大數據應用之二:用戶行為分析 速途專欄,2012-6-10

[5] 王璐,唐紅.移動互聯網用戶行為分析,中國知網Vol.11 2012

[6] 程繼華,施鵬飛.多層次關聯規則的有效數據挖掘算法 軟件學報Vol.9,No.12,Dec.1998

[7] 百度百科,明星臉詞條,http://baike.baidu.com/view/10370916. htm 2013-4-5

猜你喜歡
多維度建模用戶
您撥打的用戶已戀愛,請稍后再哭
基于用戶和電路的攻擊識別方法
物理建模在教與學實踐中的應用
在經歷中發現在探究中建模
多維度探究PDCA循環在消毒供應室護理管理中的應用價值
思維建模在連續型隨機變量中的應用
求距求值方程建模
360與龍芯中科宣布將加深多維度合作
以“一”融“多”:多維度拓展群文閱讀時空
以“一”融“多”:多維度拓展群文閱讀時空
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合