?

基于支持向量機的金融數據分析研究

2016-10-14 21:19李峰韓祝華
科學與財富 2016年28期
關鍵詞:支持向量機機器學習

李峰+韓祝華

摘 要:金融市場由于其所包含的不可測因素非常多,所以我們可以將其看作是一個非線性的、非結構化的復雜系統。而支持向量機作為機器學習方法智能信息處理的重要組成部分,在其他領域已經被證明可以有效地解決這種非線性問題,從而我們很容易聯想到它能否有效地處理金融數據。金融數據處理的預測問題主要是對金融時間序列的預測,本文將介紹一種最下二乘法來對此問題進行說明。

關鍵詞:機器學習;支持向量機;金融數據

一、研究現狀

金融數據處理的預測問題主要是對金融時間序列的預測,金融時間序列可以看成是一種特殊的時間序列,它具有以下三大特點:(1)金融時間序列的產生過程較為復雜,并且影響因素較多;(2)多數金融時間序列含有大量不可預知的影響因素;(3)金融時間序列的各數據間的構成較為復雜,通常呈現出非線性性。而神經網絡、混沌理論、遺傳算法等人工智能信息處理方法能很好的適應這三大特點,這已然成為解決金融數據處理問題的先進方法。1999 Lab.H用遺傳算法對日本股票市場進行了預測,從中分析出哪一只股票最好,并預測應該在何時買或賣多少股票。2005 年Lixin Yu 等人建立了一個混合神經網絡模型對金融市場的數據進行了預測,并取得了良好的效果長期以來專家學者們都希望能夠找到使誤差更接近零的分析預測方法,以使投資目標函數在利益盡量大的時候風險盡量最小。所以,人們不得不努力的研究更新、更有效、泛化能力更強的數據分析預測模型。當前的金融市場業務繁多,和業務形成正比關系的各類信息系統眾多,這些管理系統也產生海量的各類金融數據,如何對金融市場進行有效地、及時地預測與分析,則成為企業、銀行和現代投資者所追求的目標。然而現行的大量分析方法并不能對已有的數據進行大規模的開發和利用,所以并不能滿足金融市場投資者的需求。而支持向量機方法作為智能信息處理的重要組成部分,在其他領域已經被證明可以有效地解決這種非線性問題。

二、 最小二乘支持向量回歸算法(LSSVM )

最小二乘支持向量機是由 Suykens 等人提出的,它將支持向量機中的損失函數替換成了最小二乘的損失函數,這一替換使得最小二乘支持向量機在訓練過程中等價于求解一個線性方程組,最小二乘支持向量算法是將標準支持向量算法中的不等式約束化成等式約束而得到的。

對于線性回歸,設樣本為n維向量,某區域的l個樣本及其值表示為:

對于非線性回歸,同樣使用一個映射φ把數據映射到高維特征空間,再在高維特征空間進行線性回歸,關鍵是選取適當的核函數 k(x,y),使得 k(xi,yi)=Φ(xi)TΦ(xj)。以高斯核函數為例,它的定義如下:

那么這個最小二乘支持向量機的非線性函數可以表示為:

最后解出參數a,b的值即可。

三、股票市場預測中的應用

結合我國股票指數的數據,利用最小二乘支持向量算法(LSSVM)和AR(n)模型進行預測,采用LSSVM直接建立非線性AR (1)模型,所有數據均來自于金融研究數據庫,實驗根據邏輯性、有效性、客觀性及敏感性,并根據財政部出臺的《國有資本金績效評價原則》選取了38個指標作為各上市公司的特征以及財務指標,此次實驗同樣采用Matlab軟件和Eviews軟件實現。

財務指標及股票信息如下表:

一、研究現狀

金融數據處理的預測問題主要是對金融時間序列的預測,金融時間序列可以看成是一種特殊的時間序列,它具有以下三大特點:(1)金融時間序列的產生過程較為復雜,并且影響因素較多;(2)多數金融時間序列含有大量不可預知的影響因素;(3)金融時間序列的各數據間的構成較為復雜,通常呈現出非線性性。而神經網絡、混沌理論、遺傳算法等人工智能信息處理方法能很好的適應這三大特點,這已然成為解決金融數據處理問題的先進方法。1999 Lab.H用遺傳算法對日本股票市場進行了預測,從中分析出哪一只股票最好,并預測應該在何時買或賣多少股票。2005 年Lixin Yu 等人建立了一個混合神經網絡模型對金融市場的數據進行了預測,并取得了良好的效果長期以來專家學者們都希望能夠找到使誤差更接近零的分析預測方法,以使投資目標函數在利益盡量大的時候風險盡量最小。所以,人們不得不努力的研究更新、更有效、泛化能力更強的數據分析預測模型。當前的金融市場業務繁多,和業務形成正比關系的各類信息系統眾多,這些管理系統也產生海量的各類金融數據,如何對金融市場進行有效地、及時地預測與分析,則成為企業、銀行和現代投資者所追求的目標。然而現行的大量分析方法并不能對已有的數據進行大規模的開發和利用,所以并不能滿足金融市場投資者的需求。而支持向量機方法作為智能信息處理的重要組成部分,在其他領域已經被證明可以有效地解決這種非線性問題。

二、 最小二乘支持向量回歸算法(LSSVM )

最小二乘支持向量機是由 Suykens 等人提出的,它將支持向量機中的損失函數替換成了最小二乘的損失函數,這一替換使得最小二乘支持向量機在訓練過程中等價于求解一個線性方程組,最小二乘支持向量算法是將標準支持向量算法中的不等式約束化成等式約束而得到的。

對于線性回歸,設樣本為n維向量,某區域的l個樣本及其值表示為:

對于非線性回歸,同樣使用一個映射φ把數據映射到高維特征空間,再在高維特征空間進行線性回歸,關鍵是選取適當的核函數 k(x,y),使得 k(xi,yi)=Φ(xi)TΦ(xj)。以高斯核函數為例,它的定義如下:

那么這個最小二乘支持向量機的非線性函數可以表示為:

最后解出參數a,b的值即可。

三、股票市場預測中的應用

結合我國股票指數的數據,利用最小二乘支持向量算法(LSSVM)和AR(n)模型進行預測,采用LSSVM直接建立非線性AR (1)模型,所有數據均來自于金融研究數據庫,實驗根據邏輯性、有效性、客觀性及敏感性,并根據財政部出臺的《國有資本金績效評價原則》選取了38個指標作為各上市公司的特征以及財務指標,此次實驗同樣采用Matlab軟件和Eviews軟件實現。

財務指標及股票信息如下表:

從實驗結果可以看出 LSSVM模型的預測結果要優于單純的時間序列模型。綜合來看,如果在支持向量機的基礎上能夠融合時間序列模型,那么在金融預測中將取得良好的應用效果。

參考文獻

[1] 高鐵梅.計量經濟分析方法與建模.EVIEWS應用及實例.清華大學出版社,2006.

[2] 謝衷潔,王馳.用時間序列方法預測股票價格初探.數理統計與管理,2004,23(5):68 - 77.

[3] 孫德山.支持向量機分類與回歸方法研究:(博士學位論文).長沙:中南大學,2004.

[4] 鄧乃揚.數據挖掘的新方法—支持向量機.北京:科學出版社,2004.

[5] 楊一文.基于神經網絡的多變量時間序列預測及其在股市中的應用.信息與控制,2001,30(5):413-417.

[6] 王振龍,胡永宏.應用時間序列分析.北京:科學出版社,2008.

作者簡介:

李峰(1981-),男,山西陽泉人,碩士,現供職于河北金融學院信息管理與工程系,研究方向數據分析.

猜你喜歡
支持向量機機器學習
基于改進支持向量機的船舶縱搖預報模型
基于詞典與機器學習的中文微博情感分析
基于SVM的煙草銷售量預測
動態場景中的視覺目標識別方法分析
論提高裝備故障預測準確度的方法途徑
基于網絡搜索數據的平遙旅游客流量預測分析
前綴字母為特征在維吾爾語文本情感分類中的研究
基于熵技術的公共事業費最優組合預測
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合