?

基于保險行業新投保、續保、理賠綜合性SPSS數據分析報告

2021-07-03 05:58楊鴻志四川大學錦城學院計算機與軟件學院
營銷界 2021年9期
關鍵詞:平均收入續保保額

楊鴻志 楊 杉(四川大學錦城學院計算機與軟件學院)

■ 前言

保險,是指投保人根據合同約定,向保險人支付保險費,保險人對于合同約定可能發生的事故因其發生所造成的財產損失承擔賠償保險金責任,或者被保險人死亡、傷殘、疾病或者達到合同約定的年齡、期限等條件時承擔給付保險金責任的商業保險行為。

從經濟角度看,保險是分攤意外事故損失的一種財務安排;從法律角度看,保險是一種合同行為,是一方同意補償另一方損失的一種合同安排;從社會角度看,保險是社會經濟保障制度的重要組成部分,是社會生產和社會生活“精巧的穩定器”;從風險管理角度看,保險是風險管理的一種方法。

為了盡可能規避保險風險,獲得更大的利益,并且在此過程中體會理財的難度,為更多人的保險選擇以及保費范圍提出中肯的建議,我尋找到三份涉及新投保、續保、理賠的數據報告,并提出相應問題進行探究。筆者帶著“過去三年平均年收入與總保費之間是否相關”等3 個問題,通過對新投保(續保信息內容與新投保內容較為一致)90 萬條數據(包含投保機構,險種,投保時間,繳費方式,繳費期限,投保份數,總保費,保額,投??蛻舻目蛻籼?,性別,年齡,婚姻狀況,過去三年平均年收入,教育程度,職業,家庭人口)的excel 數據表,提煉出關于投保機構,險種,總保費,保額,客戶個人信息(性別,年齡,婚姻狀況,職業,過去三年平均收入)這幾個重點,對理賠21 萬條數據(包含投保機構,險種,案件號,保單號,賠款金額,賠款時間,費用類型,總保費,保額,投??蛻魝€人信息),進行SPSS 制圖和數據分析,探究以平均年收入與總保費之間簡單相關性為主的數據之間的關系,進行數據分析并提出結論和建議,做此分析報告。

■ 研究思路

將三個excel 表進行基礎整理,去掉對本分析無用的行列,從而減少數據數目,然后使用SPSS 打開,使用SPSS 的線性回歸分析、相關性分析、區間估計、分析描述統計中的探索功能等分析方法逐步分析,在探究投保數據時總保費與保額年齡、過去三年平均收入的線性回歸數據分析,在續保的表格里探究不同性別的區間關系,在保額的數據表里面探究相關數據,如不同性別與總保費、保額之間的關系,在理賠的保險里對總保額、保費和賠款金額進行SPSS 分析,分析其兩兩變量之間的影響,得出相對應的計算公式,理清數據之間的影響因素,得出最終結論。

■ 數據說明

(一)數據來源

數據來源于某保險公司新投保數據表(90 萬條),續保數據表(21 萬條),理賠數據表(21 萬條)。

(二)數據清洗

我們對excel 數據工作表做了兩方面的清洗工作:第一是對與研究問題無關的行列進行刪除和簡單的整理排序,將無用的列或者是信息不完整的列或行進行刪除,另外對部分不合理的數據進行篩查,看其數值是否異常。第二是注釋性別F 指女性,M 指男性,婚姻狀況S 指未婚,M 指已婚,D 指離異,X 指未知。并且將客戶號一列的科學計數法變為常規計數法。再用SPSS 軟件將其打開,并對數據進行區間估計以及雙變量數據分析。

■ 投保數據分析

(一)新投保數據分析

總保費與保額、年齡、過去三年平均年收入的線性回歸數據分析。

圖1 總保費與保額、年齡、過去三年平均年收入的線性回歸數據分析

如圖1 所示,先對總保費、保額、年齡與過去三年平均收入分別做一個簡單相關性分析,因顯著性大于0.01 則為相關,由此我們可以分析得出結論,即根據斯皮爾遜相關性來分析,保額與年齡還有過去三年的平均收入都呈顯著相關,這也就說明在我們投保新的總保額時,我們往往會考慮自身的收入和年齡以及保額的影響,從而根據我們自身的情況來進行總保額的選擇。同時從保額的斯皮爾遜分析結果來看,保額和總保費與過去三年平均收入均有顯著性相關,由此結果我們可以知道,人們隨著年齡的增加可能個人的收入也在增加,從而加大了對保額的投保。從年齡的斯皮爾遜結果來看我們不難發現,年齡和總保費有著顯著相關結果。由此可見,當我們隨著年齡的增大時,我們想要買入的保險份額可能也隨之增加。當我們看到過去三年平均收入的斯皮爾遜相關系數時,我們不難發現,過去三年平均收入和總保費與保額均呈現顯著性相關,由此結果我們可以看出,當人們的收入提高時,人們自然而然就會對所購買保險的費用進行加大,從而保費的額度與之相應增大。

(二)續保數據分析

圖2 不同性別之間續保額區間估計的數據分析

先點擊分析——描述統計——探索,再根據我們的問題,將保額作為因變量,性別作為因子,接著點擊右上角的統計將置信區間改為95%,最后點擊繼續,下方的輸出樣式選擇統計表。

對不同性別之間的保額做區間分析之后,由圖2 知道保額與續保額呈現逐相關性的。由圖2 可知:男女性的數據都為真實有效的,并且缺失值為0。又可知,男性女性的峰度都大于0,說明不同性別與保額之間都成正態分布,而男性女性的偏度都大于0,則說明其分布較正態、分布曲線更向右偏,稱為正偏或右偏,說明存在偏大的極端值,并且男性的極大值大于女性的極大值。而在對于平均值95%置信區間的對比中我們看出,女性的續保額區間要比男性的高。由圖一可知這大概率是因為一方面由于年齡的增加我們的過去三年平均收入也隨之增加,所以我們的續保額也隨之增加,由圖二又可知,女性在選擇續保保險的類別范圍是比男性小的,在一定程度上導致了男性的選擇種類多,因為續保的金額不同,但并不是每個都會大筆投入。而女性選擇更加單一化,投入的資金更傾向于之前所買的,所以也隨之而增加了其續保額的投入,所以在對于平均值95%置信區間的對比中我們看出,女性的續保額區間要比男性的高。

(三)理賠數據分析

不同性別理賠總保費的區間估計。

圖3 不同性別總保費的區間估計

步驟:先點擊分析——描述統計——探索,再根據我們的問題,將總保費作為因變量,性別作為因子,接著點擊右上角的統計將置信區間改為95%,最后點擊繼續,下方的輸出樣式選擇統計表。

如圖3 所示,對不同性別保費做區間估計后,得出結論:根據男性與女性的平均值數據,男性的總保費是要高于女性的,因為男性在中高檔之間的保額是遠大于女性的,又因為保費和理賠額之間呈顯著相關,且男性女性的峰度都大于0,說明不同性別與理賠總保費之間成正態分布,這也就可知,男性的保險種類買的比較多,所以理賠總額也會比較高。而男性女性的偏度都大于0,則說明其分布較正態、分布曲線更向右偏,稱為正偏或右偏,說明存在偏大的極端值。而在對平均值95%置信區間的對比中我們看出,女性的總保費區間要比男性的低。

而根據箱型圖我們可以得知,男性和女性總保費的分布也不一樣,男性極端值大于女性的,但是女性有兩個極端值情況,在二十萬到六十萬的區間,男性的人數明顯多于女性,也因此說明了男性的大金額的人數要比女性的多一點。而在二十萬這個區間上下,女性的人數是明顯多于男性的。在二十萬以下的情況里可以看到女性的人數是明顯比男性更加偏向底部,而男性的分布則更加均勻。

■ 總結

從三張不同的表格分析數據來看,保險的保額、保費、退保額與三年的平均收入成正比關系。不僅如此,對于推銷人員來說,從保險數據的表格來看,男性和女性總保費的大致分布有一定區別,男性更偏向于中高檔的保險種類,但是其續保額可能不如女性的多一點,女性的保額區間較高于男性,但是男性的賠大金額的人數要比女性的多一點。我們可以選擇將大額理賠推銷給男性顧客,在續保時,我們可以嘗試將不同的保險類型推銷給男性群體,將保額區間高一點的推銷給女性客戶,并且在續保時推銷同種或同類型的保險種類給女性群體。對消費者來說,從三張保險的數據分析來看,在一定的年齡范圍內,我們對于保險的額度會往較高的方向去選擇,而賠款金額也會相應較高,自然而然的我們投保的金額也會增加。所以,我們不妨在選擇保險時可以考慮保額時間較長的險種,這樣對我們后續的投入和保額的要求以及保額的賠款金額要求都會得到相應滿足。

猜你喜歡
平均收入續保保額
惠民保
短期醫療險,你了解多少?
車險客戶續保率
五款防癌險終極PK
合理選擇重疾險保額
保證續保百萬醫療險來襲 消費者該不該買?
被高估的工作
美國這些醫療保健崗位在2016年最熱
美國這些醫療保健崗位在2016年最熱
女性重大疾病咋保障
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合