?

面向大數據的電信客戶細分模型研究與展望

2018-04-12 11:45張小敏王小丫左小雪
數字通信世界 2018年3期
關鍵詞:細分數據挖掘聚類

張小敏,王小丫,左小雪

(安徽財經大學 管理科學與工程學院,蚌埠 233030)

1 引言

21世紀以來,數據的快速增長使得電信行業面臨著巨大的機遇與挑戰。隨著移動互聯網的快速發展,電信運營商主營業務由傳統的語音業務逐漸向移動數據業務轉變。作為大數據的生產者,電信企業擁有極有價值的用戶數據,如何利用這些大數據實現客戶的價值分析、產品的高效營銷以及市場的領先地位,成為決定企業未來發展的關鍵。移動通信高速發展的同時也帶來了電信市場激烈的競爭,對電信運營商提出了更加嚴酷的要求?,F有研究表明,電信運營商想要保持市場的相對領先,就必須善于利用客戶數據進行客戶細分,提高客戶價值,并針對不同的客戶群實現精準市場營銷[1]。

2 客戶細分方法演進及現狀

客戶細分的目的是為了將有潛力的客戶與無潛力的客戶區分開,以此對不同的客戶群進行不同的針對性營銷策略。自Smith(1956)首次提出客戶細分的概念以來,客戶細分方法經歷了一系列的變化[2]。

傳統的統計法主要是以客戶基本屬性特征的簡單統計來進行細分,包括諸如年齡、性別、家庭、種族、職業、教育狀況等客戶基本信息。但由于該方法不具備定量分析的功能,統計細分得出的結果往往帶有較強的主觀性,不能反映出真正的客戶價值。

經過多年的研究和探索,營銷學者們提出了一種基于客戶價值的細分方法,由于不同的客戶對企業的價值不同,通過分析客戶的盈利能力及公司的利潤貢獻率將客戶進行細分,再針對不同價值的客戶群采取精準營銷策略,從而實現企業的利潤最大化。

為了動態的對客戶的行為特征進行劃分,隨后提出了基于數據挖掘的客戶細分方法,也是現在電信企業實現客戶細分重點關注的研究領域[3]?;跀祿诰虻姆椒ㄖ饕沁\用聚類算法對客戶進行細分,通過客戶的歷史數據來分析未知的客戶行為特征,大致可分為兩類客戶細分方法:1)多元統計分析,如K-means方法;2)神經網絡模型,如自組織神經網絡SOM算法。

目前,國內外學術界比較關注的是對于數據挖掘技術的優化與改進,以提高細分結果的準確性和可靠性,為企業界提供一定的理論結果和方法創新。而國內學者對客戶細分的研究起步較晚,相關理論主要來源于國外,沒有與中國企業的現狀很好地結合起來。隨著市場的不斷發展,相信客戶細分解決方法的需求會越來越強烈,在一定程度上會加快客戶細分理論的研究進程。

3 電信客戶細分模型構建

目前,數據挖掘已經逐漸被應用到國內外電信業的生產和經營中,而數據挖掘建模方法是數據挖掘順利開展的先決條件,由歐洲委員會和相關行業的四大公司提出的行業標準過程CRISP-DM[4],是目前業界權威的標準流程方法。CRISP-DM將數據挖掘過程看作一個商業過程,提供了一個數據挖掘項目生命周期的全面描述,如圖1所示。

CRISP-DM參考模型大致可分為6個階段:商業理解、數據理解、數據準備、模型建立、模型評估和結果部署,最終構成一個統一的循環周期。在整個過程的每一個階段,如果發現某個階段產生的結果和預想的結果有偏差,則需要用戶重復以前的工作。本文將從這6個過程對電信客戶細模型進行詳細闡述。

3.1 商業理解

根據數據挖掘的流程,對客戶細分進行商業理解主要是從商業角度理解項目的目標和要求。對于積累了大量客戶數據的電信行業來說,商業目標可概括如下:利用系統化的方式組織和分析龐大的數據量,從中發現有價值的規律;把有相近交易行為的客戶歸到一個客戶群,深入了解每一客戶群組的客戶消費行為特征;從而為發展新業務、挽留高價值客戶打下基礎,實現利潤最大化、提升企業競爭力。

3.2 數據理解

移動通信企業擁有計費、賬務、欠費、寬帶上網等系統,而這些系統數據庫中存儲了大量的客戶消費及行為數據。通常情況下電信運營商會以消費樣本數據作為研究對象構建模型,主要包括客戶基本數據、消費數據以及行為數據。主要收集的用戶數據清單如表1所示。

圖1 CRISP-DM參考模型

表1 數據收集清單

3.3 數據準備

獲得客戶的消費樣本數據后,還需要對數據樣本進行充分的準備與分析。數據準備過程的關鍵步驟是數據檢測、屬性約簡及數據轉換[5]。對電信企業來說,數據檢測主要是指缺省值和異常值的檢測,一般采用值分析、統計分析和頻次分析等方法來進行檢測。在客戶所有的屬性中,許多屬性對客戶細分的意義不大,甚至還會影響結果,因此,需要進行屬性約簡將冗余的屬性清除。此外,電信企業數據倉庫包含大量不同數據類型的數據,需要根據建模的要求,對數據加以變換,以消除量綱不同可能引起的數據差異。

3.4 模型建立

聚類算法在客戶細分模型構建中得到了大量的應用,本文針對適合大數據分析且效果較好的K-means聚類算法進行詳細闡述。K-means[6]算法的基本步驟可表述如下:

(1)隨機或按照某種先驗知識選擇一個K值,用來確定簇的總數。

(2)在數據集中任意選擇K個樣本,作為初始聚類中心c1,c2,…,ck。

(3)依據樣本{xi,i=1,2,…,n}到聚類中心的距離,將其賦給最近的中心cj的簇Xj,即若

則x∈Xj。

確定好數據挖掘算法之后,才能建立挖掘模型。從整個流程來看,建立模型是一個反復的模型調優過程,不僅涉及不同算法的選擇,也取決于屬性參數的設置,確保建立最合適的電信客戶細分模型。

3.5 模型評估

建立好模型以后,評估是重要的環節。模型評價標準就看其是否有效,能否正確反映前期定義或假設,結果是否存在偏差。對于聚類、關聯規則挖掘等無監督學習系統來說,模型的評估是困難的,因為結果的好壞很大程度上取決于使用工具的特定環境。

3.6 結果部署

結果部署,即對挖掘結果進行解釋分析,對其盡可能使用統計工具和可視化方法來刻畫屬性特征,如表格或圖形的形式,最后根據挖掘結果提出相應的決策方案和建議。

4 面向大數據的電信客戶細分方法未來展望

大數據背景下電信客戶細分方法也會有所轉變,筆者將基于大數據對電信客戶細分方法進行展望,同時也為進一步研究客戶細分方法提供相關依據。

(1)基于技術不斷發展的大背景下,電信客戶細分模型中數據網絡型用戶已經取代了電信傳統的話務型客戶,電信客戶細分模型應該趨于面向數據業務的分群分析,企業逐漸培養客戶使用數據的習慣。

(2)近年來,中國電信與互聯網公司開始進行產業融資合作,在迅速增強其競爭優勢的同時,在客戶細分過程中充分利用互聯網企業的網絡資源、網絡平臺、客戶服務與營銷渠道,達到需要的細分效果,可大大提高企業的獲利。

(3)在大數據時代,獲取信息的途徑更為豐富,可以通過社交網絡獲取客戶之間的聯系信息,增加個體客戶對所在群體內其他客戶的影響力指標,這樣客戶的價值不再僅是個體客戶消費體現的價值,營銷效率將會有很大的提高。

5 結束語

本文首先詳細描述了客戶細分方法的發展歷程并對其現狀進行分析,其次介紹了數據挖掘過程參考模型CRISP-DM,并依據其6個過程對電信客戶細分模型進行闡述與構建,重點介紹了K-means聚類算法。最后,就大數據時代背景,對未來電信客戶細分方法進行展望,為進一步研究客戶細分方法提供相關依據。

[1]賀仁龍,葉宇航,趙曉康.電信企業客戶細分模型構建與應用研究[J].情報雜志,2011,30(S1):148-151.

[2]楊茜.基于大數據的客戶細分模型及精確營銷策略研究[D].南京郵電大學,2015.

[3]陳治平,胡宇舟,顧學道.聚類算法在電信客戶細分中的應用研究[J].計算機應用,2007(10):2566-2569+2577.

[4]薛薇.SPSS Modeler數據挖掘方法及應用(第二版)[M].北京:電子工業出版社,2014:270-290.

[5]陳金波.面向電信CRM的數據挖掘應用研究[D].東南大學,2006.

[6]Survey of clustering algorithm.XU R,WUNSCHLL D.IEEE Transactions on Neural Networks.2005.

猜你喜歡
細分數據挖掘聚類
探討人工智能與數據挖掘發展趨勢
深耕環保細分領域,維爾利為環保注入新動力
基于K-means聚類的車-地無線通信場強研究
基于并行計算的大數據挖掘在電網中的應用
基于高斯混合聚類的陣列干涉SAR三維成像
基于Spark平臺的K-means聚類算法改進及并行化實現
1~7月,我國貨車各細分市場均有增長
基于改進的遺傳算法的模糊聚類算法
一種基于Hadoop的大數據挖掘云服務及應用
整體低迷難掩細分市場亮點
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合