?

基于多維數據融合的“校園貸”風險控制研究

2023-06-25 03:40錢珺金君仰季新國
現代信息科技 2023年4期
關鍵詞:防范策略校園貸風險評估

錢珺 金君仰 季新國

摘? 要:“校園貸”作為信息化和消費金融行業快速發展的產物,是消費金融行業市場的重要組成部分。近年來,不良因素的介入使得“校園貸”淪為某些惡意利用者違法犯罪的工具和平臺,高校亟需一份合適的“校園貸”自身視角方案。研究以構建金融管理服務中心和XGBoost風險評估模型為核心,從疏導、防范等多角度入手,滿足大學生合理借貸需求同時,降低和防范高?!靶@貸”風險,讓高?!靶@貸”處于有效的監管和風險控制之下。

關鍵詞:校園貸;XGBoost建模;多維融合;防范策略;風險評估

中圖分類號:TP391? ? 文獻標識碼:A? 文章編號:2096-4706(2023)04-0174-03

Research on Risk Control of“Campus Loan”Based on Multi-Dimensional Data Fusion

QIAN Jun1, JIN Junyang2, JI Xinguo3

(1.School of Information Technology, Nanjing Forest Police College, NanJing? 210023, China; 2.Shaoxing Public Security Bureau Yuecheng branch, Shaoxing? 312099, China; 3.Information Management Center, Nanjing Forest Police College, NanJing? 210023, China)

Abstract: The “campus loan” is an important part of the consumer finance industry market as a result of the rapid development of information technology and the consumer finance industry. In recent years, the inclusion of unfavorable factors has transformed “campus loan” into a tool and platform for some criminals to commit crimes, and universities need suitable schemes of “campus loan” urgently from their own perspectives. The research takes the construction of financial management service center and the XGBoost risk assessment model as cores, from the guidance, prevention and other perspectives, meets college students' reasonable lending needs while reducing and preventing the risks of college “campus loan”. Then the college “campus loan” is under effective supervision and risk control.

Keywords: campus loan; XGboost modeling; multi-dimensional integration; prevention strategy; risk assessment

0? 引? 言

“校園貸”以其超前的消費理念和針對大學生群體的突出特征,在高校中得到快速傳播和發展。以“校園貸”之名偽裝的高利貸、圍繞非法平臺“校園貸”的電信詐騙、侵害公民合法權益的“裸貸”等違法犯罪事件以及負債、暴力催收等借貸衍生問題,導致大學生身心健康受到消極影響。本文結合不良“校園貸”的界定和運作機制分析,使用風險控制理論,對“校園貸”風控模型進行了構建與研究,采用了知名P2P網貸公司Leading Club的公開借貸信息,以該數據作為研究樣本,分析風險要素作為根據,為“校園貸”風控模型方案提供核心評估環節的科學支撐。

1? 高?!靶@貸”發展現狀

隨著社會消費的爆炸式增長和信息技術的迅速發展,網絡貸款及其衍生產物“校園貸”隨著互聯網金融繁榮發展而興起。國內高校針對“校園貸”管理總體普遍呈重處置、輕疏導和防范的特點。在處置方面,開展排查和整治行動,如對校內各類型“校園貸”活動情況開展摸排、清除并抵制校內不良“校園貸”活動宣傳、學校有關部門統計學生校園貸數據等。在疏導方面,開展學生教育引導工作,如大學生法律意識培訓講座、輔導員加強師生交流溝通、開放心理健康咨詢;開展學生受教育資助工作,如落實國家獎助學金教育資助政策、貧困家庭學生補助幫扶;開展建立大學生創新創業就業基金,如高校向應屆畢業生提供創新創業活動政策保障和科研技術支持、提供小額免息貸款。多數高校在為學生建立正確的消費等觀念上,做了大量的教育引導工作,并致力于突發案件的應急處置,但不可否認,非法不良“校園貸”在誘導非理性超前消費、套路借貸上仍然對在校學生造成巨大危害[1]。

2? 高?!靶@貸”風險控制模型的構建

2.1? 高校金融管理服務中心

高校大學生是主流消費群體,為他們提供安全、適宜的信用消費信用貸款,有助于在高校學生中逐步培養起成熟、理性的消費意識和信用觀念[2]。本文引入“高校金融管理服務中心”的概念,以消除或減少風險要素來實現風險的規避或降低。高校金融管理服務中心一方面對內承接學生的借貸需求,另一方面對外與社會金融機構(如銀行、合法網貸平臺等)簽訂校企合作協議,建立合作項目。

高校金融服務管理中心接受網貸平臺的合作申請,對風控能力、經營模式、不良記錄等申請信息進行審核后,準許平臺服務入駐;從網貸平臺中接收學生借貸信息,監測管理學生借貸風險,并完善學生借貸信息數據和提高風控預測能力;學生借貸申請需提交至高校金融管理服務中心,經中心審核通過方可從網貸平臺申請借款。通過中心對外及對內的雙向業務,將不良“校園貸”滲入校園的風險排除,從而形成對學生利益的保護,將大學生普遍缺乏金融防范意識、不成熟消費觀的風險要素影響降到最低。

2.2? 基于XGBoost算法的評估模型實證分析

借貸評估工作,一般分為傳統風險評估和現代風險度量方法。在現階段的金融借貸市場中,基于專家的人工審核評估主觀性強、科學性較弱、經驗的高度依賴性,已很難適應當前信息化、大數據的金融行業發展模式。在多數的現代金融行業中,利用機器學習等技術的算法模型評估風險已廣泛應用[3]。本文引入風控管理評估模型,利用算法模型的構建,對“校園貸”借貸中的風險進行科學評估,為該風控模型提供可靠支撐。作為評估核心,“校園貸”風控管理模型接受學生提交的申請,并輸入模型,根據已經訓練構建完善的模型輸出評估意見,評估意見將給出申請人本次申請的違約預測,將可能違約的預測結果定為“不準許申請”,將沒有違約可能的預測結果定為“準許申請”;并對于評估結果為“準許申請”的樣本提交反饋給高校金融服務中心;同時對于評估結果為“不準許申請”的樣本,將進一步提交給學工部門。同時,模型接收高校金融管理服務中心在業務運行過程中產生的真實借貸數據,這些數據也將被列入訓練樣本中,對模型進一步優化,使其獲得更好的預測評估效果。

2.2.1? 數據來源與指標選取

基于某借貸平臺的37 946條數據信息,首先對影響借貸違約的因素進行分析,并從中選取評估指標,隨后通過XGBoost算法建立模型,利用訓練后的模型對實時提交的學生借貸申請進行風險評估預測,為高校金融管理服務中心的數據研判工作提供有效依據。

本文將大學生個人信息中的家庭年收入(annual_inc)、未結算的貸款數量(open_acc)、地址區位(addr_state)等作為引入構建該風控模型的變量指標;將大學生個人在校信息中的學制(emp_length)、學位(emp_title)等作為引入構建該風控模型的變量指標;同時將其他一般貸款信息引入該風控模型。根據風險評估模型實驗需求,選取其中相關人群數據部分,并篩選部分數據信息變量,主要包含loan_amnt、term、emp_title、annual_inc、loan_status等,這些變量及其數據將參與“校園貸”風險評估模型構建中的訓練和驗證分析。

2.2.2? 數據清洗處理與采樣

數據預處理,首先利用拉格朗日插值法(lagrange)對缺失值進行近似值的估算填補[4];再通過繪制箱線圖對這些數據進行異常值的判斷,標準的箱線圖上下邊緣則代表了該組數據的最大值和最小值,即在箱體外部的數據則稱為異常數據,將箱線圖中處于上、下邊緣線外的數據進行篩除。

2.2.3? 數據標準化及特征選取

數據標準化和特征值選取,通過標準化處理,可以使得不同的特征變量具有相同的尺度,即將特征的值控制在一定的范圍內,這樣目標變量就可以由多個相同尺寸的特征變量進行控制,不同的信息變量對模型參數的影響程度保持一致。本文采用Z-score標準化(標準分數),其公式為:(X為原始數據, 為數據平均數,s為數據標準差)。本文采用單變量統計檢驗的方法對本數據表格中的信息變量即特征進行選擇處理。引入python函數庫sklearn.feature_selection中函數SelectKBest、f_classif,進行特征的選取,構造處理的關鍵代碼為[5]:

x_new = SelectKBest(f_classif,k=10).fit(X,y).get_support(indices=True)

經過特征選取,根據計算得分排序,得到10個最具價值的特征,結果如表1所示。后續的模型構造訓練學習及檢驗,將使用該10個特征進行運算。

2.2.4? 訓練樣本與檢驗樣本的選取

參照熱力值對照表,得知變量間相關性系數整體處于0.0~0.4的區間內,且多數處于0.0~0.2的區間內,呈弱或極弱相關,變量間的互相影響程度小,符合模型要求。將所有樣本數據分為訓練組數據和檢驗組數據,其中訓練組數據用于構建模型,檢驗組數據用于檢驗模型的準確性和預測評估。構建模型的訓練樣本和檢驗樣本如表2所示。

XGBoost由樹模型的迭代來直接影響學習的效果,理論上迭代次數越多,則模型的訓練效果越好,但通常情況下,模型會因樹模型的迭代次數過多而產生過擬合的風險,使預測值在訓練集數據下表現良好,而在測試集數據下表現不佳。

依次對num_boost_round、max_depth/min_child_weight、gamma、subsample、colsample_bytree和eta學習率參數進行調整,使模型在平均絕對誤差上盡可能小并處于適度擬合的狀態。最終得到該數據集下各參數最佳參數值如表3所示,模型擬合狀態如圖1所示處于適度擬合,同時模型的評價指標mae(Loss-1)由模型最初狀態得分-0.612 9上升為調參結束后的得分-0.249 6。

在模型建立、訓練、參數調優后,針對模型的最優狀態進行預測能力檢驗。利用驗證數據集輸入模型,并得到數據集中各組數據所對應的預測值,預測能力結果如表4所示,該模型能夠在對大學生群體“校園貸”的風控運行機制中,發揮較好的學生借貸風險預警和校園金融風險分析輔助作用。

3? 結? 論

“校園貸”仍是金融領域中的一個重要組成部分,并在當今信息技術和消費金融快速發展中扮演合理存在的重要角色。面對風險,僅僅依賴處置無益于高?!靶@貸”的有效整治。創新高?!靶@貸”金融服務體系,把風險控制與聯合整治融入整體構建中,滿足學生合理借貸需求同時,降低和防范高?!靶@貸”風險,讓“校園貸”在有效監管和風險控制下成為真正服務于學生群體的“安心貸”。

參考文獻:

[1] 貢怡丁.高?!靶@貸”治理現狀及對策研究 [D].合肥:安徽大學,2020.

[2] 張春蓮,徐麗麗,馮云珠.“互聯網+”背景下的高校網絡詐騙及風險防范 [J].現代交際,2020(6):187+186.

[3] 王元彬,張堯,李計廣.數字金融與碳排放:基于微觀數據和機器學習模型的研究 [J].中國人口·資源與環境,2022,32(6):1-11.

[4] 趙莉,孫娜,李麗萍,等.拉格朗日插值法在數據清洗中的應用 [J].遼寧工業大學學報:自然科學版,2022,42(2):102-105+117.

[5] 馮凱媛,羅慶斌,鄭明輝,等.基于多特征融合的惡意網頁檢測方法研究 [J].湖北民族大學學報:自然科學版,2021,39(1):80-85.

作者簡介:錢珺(1990—),女,回族,安徽安慶人,講師,碩士,研究方向:電子數據檢驗和網絡犯罪偵查。

收稿日期:2022-09-27

基金項目:江蘇高校哲學社會科學研究項目(2020SJA0567);江蘇高校哲學社會科學研究項目(2022SJYB0089)

猜你喜歡
防范策略校園貸風險評估
從眾心理對大學生“校園貸”的影響淺析
電力施工企業勞動關系管理的法律風險及其防范策略研究
企業應收賬款風險及其防范
新形勢下化工企業財務風險及防范策略
我國養老保險基金投資運營的風險評估
厘清“校園貸”潛在風險:大學生當心跌入人生陷阱
現代風險導向審計局限性及其對策研究
論我國“校園消費信貸”發展中存在的問題
中小企業財務管理問題研究
大二學生被“校園貸”奪命
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合