?

基于異源數據聚類分析比較的衡陽卷煙市場品牌培育策略選擇研究

2023-11-01 06:08朱博王雄峰黎賠肆劉穎璇
中國民商 2023年9期
關鍵詞:聚類分析

朱博 王雄峰 黎賠肆 劉穎璇

摘 要:論文對來自衡陽市煙草公司零售終端和入戶訪談兩個不同渠道異構數據的一致化處理后,再對兩份數據分別進行了二階段聚類分析,發現兩份數據聚類的結果具有高度相似性,表明以衡陽市煙草公司獲得的任意來源數據進行市場細分具有很高的可靠性。然后,以聚類結果為基礎,發現不同細分市場消費者在卷煙品牌偏好和品牌培育活動參與上存在顯著差異,進而結合以前研究的證據,并依據每個細分市場消費者特征、品牌參與活動經歷,提出了深化品牌培育活動的建議。

關鍵詞:異源異構數據;品牌培育;聚類分析

卷煙品牌培育是近10多年來各地煙草商業公司持續關心的重要問題,早期思路是借鑒其它領域的營銷模式應用于卷煙的品牌培育,后來強調基于卷煙品牌個性化設計的品牌培育,慢慢形成了具有卷煙消費特征的培育模式,如卷煙品吸活動。衡陽市煙草公司近年來也一直在推進卷煙品牌培育的研究和實踐,主要涉及三個方面:一是除了培育本土的白沙和芙蓉王品牌外,也重視省外卷煙品牌培育體系的研究;二是進行卷煙精準營銷問題的探索,利用零售終端的數據將區域內投放市場的卷煙品規劃分到“俏、緊、平、松、軟”五類狀態,構建了基于20個細分市場的精準投放模型,為卷煙精準投放提供建議;三是探索了不同品牌培育模式對新品牌推廣的促進作用。但是目前尚未有將上述三個方面綜合起來深化品牌培育問題的研究,即缺乏從精準化視角,探討省內、省外不同品牌的培育模式的選擇研究。

本文嘗試通過對不同來源數據的聚類分析,對衡陽市卷煙消費者進行畫像細分,并針對不同細分市場不同品牌提出合適的品牌培育措施。

一、問題提出

目前關于卷煙消費精準化研究的一個主要思路是通過數據的聚類分析對消費者進行畫像,以此為依據來設計有關策略。這類研究面臨的一個共同難題就是同一市場不同來源數據帶來的畫像結果不一致,如有文獻為了解國內各城市卷煙消費者特征,通過線上調研獲取國內12個城市卷煙消費者消費行為數據,發現由于各城市經濟水平、人口密度和區位優勢不同,各城市卷煙消費者畫像存在明顯差異。更為普遍的是,隨著互聯網等技術的快速發展,卷煙消費者的數據來源越來越多,數據的構成差異可能千差萬別,這種多源異構的數據導致數據的管理和分析越來越困難。特別是基于不同來源數據進行的獨立分析,會有不一樣的消費者細分市場結果,從而導致難以做到真正的精準營銷。雖然目前有一些文獻探討多源異構大數據的管理問題,但是對于如何有效利用傳統渠道獲得的多源異構數據進行融合分析尚未得到充分研究。

多年來衡陽市煙草公司通過不同的渠道來源獲得了卷煙消費者數據,如通過零售終端微信掃碼填寫調查問卷、進行入戶調查、通過布局品吸機收集數據等方式累積了大量的消費者數據。這些不同來源的數據所依賴的測量變量以及變量的分類等并不總是一致,如調查消費者日均吸煙量上,有的來源是直接收集消費者日均吸煙具體數量(如每天8支,數據屬于定距數據),有的收集的是一個區間數據(如每天10支以下,屬于定序或定類數據)。要利用這些多源異構數據進行聚類從而對消費者進行畫像,存在兩個關鍵問題:一是如何將不同來源不同結構的數據一致化,同時要保證不同來源數據分布不一樣(即保證數據原有多樣性特征);二是如何判斷不同來源數據聚類分析結果具有一致性或可以融合。

本文將圍繞上述兩個關鍵問題,通過對異源數據的一致性處理和聚類分析比較,得出更加可靠的消費者畫像,從而為卷煙市場開展更精準的品牌培育模式提供建議。

二、數據來源與處理

(一)數據來源

從目前衡陽市煙草公司數據來源來看,一些來源的數據量還不夠充分,地區分布還不均衡,如通過品吸機收集的數據因為品吸機布點的時間較短數據量不多,布點地區差異導致一些縣市區缺乏數據,不具有代表性。因此,本文僅關注兩個成熟渠道數據來源,即零售終端微信調查獲得的數據和入戶訪談獲得的數據。

數據來源1:零售終端數據是消費者在零售端購買香煙時自愿通過掃碼微信填寫有關問卷獲得的,數據包括消費者人口統計特征(性別、年齡和學歷)、消費行為特征(卷煙消費的數量、價格和月均支出)和消費意愿有關數據(如品牌培育參與、推新接受意愿等),初步篩選獲得7760份有效數據。

數據來源2:入戶訪談數據是采取分層抽樣的方式,由專業調查人員深入衡陽市本級和7縣1區、區縣下設的鄉鎮街道、鄉鎮街道下設的社區或村開展訪談調查獲得,與零售終端調查內容相似,數據包括消費者人口統計特征、消費行為特征和消費意愿有關數據,初步篩選獲得1820份有效數據(依據每一份數據調查人員和復核人員的簽名確保數據的可靠性)。

(二)數據一致性處理

(1)樣本篩選標準一致化。兩份數據均調查了消費者是否每天都吸煙,其中回答“否”,則意味著被訪者屬于偶爾吸煙行為,但是這個偶爾的頻率與行為無法統一,如有的可能是每兩天抽一次,有的可能是每周抽一次,有的是自己主動抽,有的可能是在特定場合被動抽,這導致很難保證同批樣本一致性,因此兩份數據均只保留了回答每天都吸煙的人。另外,統一了缺失數據處理,因為兩份數據變量測量方式不同,不宜對缺失數據進行補值,因此刪除了兩份數據中有缺失值的所有樣本。最終得到了2704份零售終端數據和495份入戶訪談數據。

(2)同一變量不同數據尺度的一致化。一方面是消費者行為數據測量尺度的差異需要一致化,零售終端關于消費者日均吸煙數量、價格和支出均是以分段形式的定性數據,入戶訪談這三個數據則均采取消費者直接填寫具體數量的定量數據,前者數據尺度等級低,后者尺度等級高,由于高等級數據包含低等級數據的特性,因此將后者三個變量數據按照前者數據的等級分別轉化為分段形式的定性數據,日均吸煙數量分為5個等級(10支及以下、11-20支、21-30支、31-40支、41支及以上),價格(11元以下、11-25元、26-50元、50元以上)和月支出(500元以下、500-999元、1000-1999元、1999元以上)分為4個等級。另一方面,消費者人口統計特征的變量雖然均采取的是分段數據,但是兩份數據的分段方式不一樣,如零售終端數據年齡分為6段,入戶訪談數據年齡分為11段,考慮到11個分段的某些段樣本很少,因此按照前者分6段的方式,統一進行了數據的分段(18-25歲、26-35歲、36-45歲、46-55歲、56-65歲、65歲以上)。學歷統一分為小學及以下、初中、高中/中專、高中以上4個層次。

(三)數據分布差異性比較分析

通過上述數據的一致性處理后,需要判斷兩份數據是否具有同樣的樣本結構分布(如學歷構成、年齡構成是否一致),如果兩份數據樣本分布一致則意味著兩份數據性質完全相同,則無法達到利用多源數據的不同屬性的優勢。為此,需要對兩份數據樣本分布的差異性進行檢驗。本文從消費者人口統計特征的性別、年齡和學歷,消費行為特征的卷煙消費的數量、價格、月均支出和消費者品牌偏好意愿(一致性化處理將眾多品牌偏好一致化為白沙、芙蓉王和省外煙)7個變量角度對兩份數據的分布差異進行檢驗。由于這些變量均是分類或排序數據,因此采取卡方檢驗來進行兩個數據來源總體分布比例是否相等的檢驗,結果顯示7個變量在兩份數據上的總體分布比例均存在顯著差異,詳情如表1所示(兩份數據同一變量之間無0頻數交叉單元格,無單元格期望頻數小于5,因此全部采取Pearson卡方檢驗的結果)。

三、消費者畫像

借助SPSS兩階段聚類方法,以前述消費行為特征和人口統計特征變量為聚類依據,分別對兩份數據進行聚類分析,從而對樣本進行畫像細分,并對兩份數據的細分結果進行詳盡比較,以確定衡陽市整個卷煙消費者的細分市場,為下一步的品牌培育策略選擇提供依據。

聚類分析的結果見圖1和圖2,圖中的“大小”和“輸入”行數據是軟件輸出原始數據,“說明”行的文字是依據聚類結果中每一類消費者樣本分布的詳細數據(詳細分析的數據可向作者申請查看)總結概說后在軟件中輸入的。從結果可以看到兩個來源數據的聚類結果有4個明顯的相似性。

(1)兩個數據來源的聚類變量重要性(圖中顏色深淺加以區別)非常類似。直觀來看除了學歷重要性以外,兩個聚類其它變量重要性排序是一樣的。按照聚類變量重要性,設置兩個排序變量,分別代表每個數據來源的6個聚類變量重要性,計算兩個排序變量的相關性(變量重要性的一致性檢驗),得到兩個排序變量的Kendall's tau-b數值為0.6,在0.1水平上存在顯著相關(P值為0.066)。

(2)軟件自動聚類輸出的兩個來源數據的最優聚類均是4類,聚類的效果雖然不是非常優良,但是也可以接受。

(3)每個聚類樣本數量分布沒有明顯差異。8個聚類類型中樣本占比最高的是32.9%,最低是19.2%,與期望占比25%的差均沒有明顯的差異。

(4)一個數據來源的聚類在另一個數據來源聚類中可以找到非常類似的對應類別。

入戶訪談樣本聚類1與零售終端樣本聚類2匹配,主要特征為樣本女性較多、年齡偏低、學歷較高,吸煙量較少、價格適中、消費支出低,該聚類可以稱之為“高知獵奇”細分市場;入戶訪談樣本聚類2與零售終端樣本聚類4匹配,主要特征為樣本年齡偏大、學歷偏低,價格偏低、支出偏低、日均吸煙量沒有明顯特征,該聚類可以稱之為“高齡低端”細分市場;入戶訪談樣本聚類3與零售終端樣本聚類3匹配,主要特征為樣本無女性、無初中以下學歷、中年人為主,中等吸煙量和價格、無月支出1000元以上樣本,該聚類可以稱之為“中端男性”細分市場;入戶訪談樣本聚類4與零售終端樣本聚類1匹配,主要特征為樣本年齡、學歷、吸煙量、價格、支出均偏高,該聚類可以稱之為“高量高端”細分市場。

由此可見,雖然數據來源不一樣,但是聚類分析結果有較高的一致性,說明衡陽卷煙市場對任意數據來源聚類分析的結果具有較高的可靠性,可以此為依據開展有關營銷活動。

四、細分市場的品牌偏好與培育方式選擇

(一)細分市場的品牌偏好

通過對兩個來源的數據聚類分析,得出了4個具有獨特人口統計特征和消費行為特征的細分市場,那么每個細分市場消費者的品牌偏好是否具有顯著差異呢?本文利用聚類分析時生成的聚類成員變量(4個類別)與品牌偏好(3個品牌,白沙、芙蓉王和省外煙)變量交叉表進行卡方檢驗來分析每個細分市場消費者對不同品牌的選擇是否具有明顯的偏好差異。結果顯示零售終端樣本的4個聚類消費者的品牌偏好(Pearson卡方為412.504,P值為0.000)和入戶訪談樣本的4個聚類消費者的品牌偏好均存在顯著差異(Pearson卡方為166.837,P值為0.000)。進一步分析發現:“高知獵奇”市場消費者主要偏好芙蓉王品牌(55%),偏好白沙品牌的也不少(41%),也有部分低價省外煙的偏好者;“高齡低端”市場消費者明顯偏好白沙品牌(63%),偏好芙蓉王品牌的較少(31%);“中端男性”市場消費者沒有明顯的品牌偏好;“高量高端”市場消費者特別偏好白沙品牌(81%),另外高價省外煙的消費者將近一半分布在該市場。

(二)細分市場的品牌培育方式選擇

1.細分市場品牌培育模式現狀分析

為給每個細分市場選擇合適的品牌培育活動,先要借助交叉表的卡方檢驗來分析目前市場消費者參與過的品牌培育活動情況。衡陽卷煙市場目前有品吸、品牌推介和掃碼三種主要品牌培育模式(有極少樣本表示參加過其它類型的活動,但未注明是什么活動,因此把這部分樣本刪除),組合起來共有8種品牌培育活動參與情況(詳情見表2)??ǚ綑z驗顯示不同細分市場參與品牌培育的模式存在顯著差異(Pearson卡方為63.169,P值為0.000)。

2.細分市場品牌培育模式發展建議

根據本文作者們的前期研究和表2目前的現狀,提出以下品牌培育模式選擇建議:

第一,針對沒有參與過任何品牌培育活動的消費者,依據每個細分市場的特征優先加強品吸活動的推廣,不具備開展品吸活動條件的可以考慮開展掃碼和品牌推介活動。表2數據說明目前4個細分市場沒有參加任何品牌培育活動的消費者比例都較高(每個細分市場該數值比例均在1/3以上,低端和高端市場該數值比例超過了40%),而我們的前期研究發現任何品牌培育活動可以促進消費者接受新品牌的意愿,其中品吸活動比品牌推介和掃碼活動更有效,因此對于沒有參加過任何品牌培育活動的消費者應優先考慮吸引他們參與品吸活動。以“高量高端”市場為例,該市場具有高學歷、高吸煙量、高價格和高支出以及明顯偏向高端高價位白沙品牌和高端高價位省外卷煙的特征,那么品吸機布局的地點和卷煙品種配置就要符合這類市場的需求特征。比如說可以考慮在南岳機場和一些高端消費場所布點,配備高端高價位白沙和省外卷煙。

第二,前期研究還發現,過多的參與品牌培育活動會抑制消費者對新品牌的接受意愿,因此對參加過品牌培育活動的消費者,要設計針對性的應對策略。首先,對已經參加過3種類型培育模式的消費者不要再考慮開展任何品牌培育活動。其次,對于參加過其他品牌培育活動,但沒有參與過品吸活動的消費者,可以開展品吸類型的品牌培育活動。最后,對于參加過品吸活動的消費者,不宜再針對性開展其它品牌培育活動。

五、結論與展望

(一)結論

本文通過對衡陽卷煙市場一致化處理后異源異構數據的聚類分析,發現不同數據來源的聚類結果具有高度的相似性,說明任意來源數據均可用來開展市場細分及其對應營銷策略研究,并結合本文作者們前期研究探索了每個細分市場的品牌培育模式選擇的深化策略。得到以下幾點結論:

(1)對于傳統結構化程度較高的異源異構消費者數據可以通過適當方式進行一致化處理,從而加以比較分析。

(2)傳統的只通過對某個來源數據聚類分析進行市場細分有一定的不可靠性,但是通過異源數據的比較分析予以佐證。如果異源數據分析結果差異很大,則需要重新設計和收集數據。

(3)卷煙市場品牌培育模式要依據細分市場的特征、品牌偏好和消費者以往培育活動經歷綜合考慮。

(二)展望

(1)本文分析的兩個來源的數據事先并沒有按照統一的設計模式和收集方法獲得,具有異源異構的特征,但數據本身的結構化程度非常高,可以采取傳統方法一致化,然后對于結構化程度極低的異源異構大數據來說,如何融合和一致化仍是需要深入探索的問題。

(2)本文提出了依據細分市場的特征來選擇品牌培育模式,指明了每個細分市場大致的品牌培育方向,但限于時間和尚未實踐探索,未來的研究需要更加細化討論如何具體開展品牌培育,并通過實踐優化和選擇更合適的品牌培育模式。

參考文獻:

[1]蔣麗雯,王雄峰,劉穎璇等.大數據下的卷煙市場狀態評價方法[J].電腦知識與技術,2022,18(20):10-12.

猜你喜歡
聚類分析
基于譜聚類算法的音頻聚類研究
基于Weka的江蘇13個地級市溫度聚類分析
我國中部地區農村居民消費行為階段特征分析
基于聚類分析的無須人工干預的中文碎紙片自動拼接
淺析聚類分析在郫縣煙草卷煙營銷方面的應用
新媒體用戶行為模式分析
農村居民家庭人均生活消費支出分析
基于省會城市經濟發展程度的實證分析
基于聚類分析的互聯網廣告投放研究
“縣級供電企業生產經營統計一套”表輔助決策模式研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合