?

基于人工神經網絡的人口預測

2014-12-24 06:54楊茂江
科技視界 2014年21期
關鍵詞:人工神經網絡權值神經元

楊茂江

(茂名市高級技工學校,廣東 茂名525000)

0 引言

中國是一個人口大國, 人口問題始終是制約我國發展的關鍵因素之一, 但是要確定人口發展戰略, 必須既著眼于人口本身的問題, 又處理好人口與經濟社會資源環境之間的相互關系, 構建社會主義和諧社會, 統籌解決人口數量、素質、結構、分布等問題。已有的文獻采用微分方程、灰色系統和曲線擬合等方法研究了我國人口問題[1-2]。 本文根據近年來中國的人口發展所出現一些新的特點, 以及近幾年中國人口抽樣數據及現有全國人口普查數據, 運用人工神經網絡算法[3-4]對中國人口做出了分析和預測。人工神經網絡(ANN)可以通過學習來抽取和逼近輸入輸出之間存在的非線性關系。 因此,基于人工神經網絡的預測方法成為近幾年研究的熱點。目前,主要采用BP 神經網絡、局部反饋性神經網絡等。 BP 神經網絡是人工神經網絡中應用最廣泛的算法。

1 BP 神經網絡模型

BP 神經網絡的輸入與輸出之間是一種高度非線性映射關系,如果輸入節點數是N,輸出節點數是M,則網絡是從N 維歐式空間到M維歐式空間的映射。 通過調整BP 神經網絡的連接權值和網絡的規模(包括N,M 和隱層節點數),可以以任意精度逼近任何非線性函數。

BP 算法的訓練過程包括輸入信號的正向傳播和輸出誤差的反向傳播兩個過程。BP 算法首先進行輸入信號的正向傳播。輸入的樣本首先進入網絡的輸入層,經中間隱含層的分析計算處理后,進入輸出層得到樣本訓練輸出結果。 如果網絡最終輸出與網絡期望輸出值(導師信號)存在誤差,那么就進行誤差的反向傳播。 誤差的反向傳播首先將誤差按照一定的學習算法整理成相應的形式, 由隱含層傳播至輸入層,并將誤差分配給各層的所有神經元上,從而獲得各層神經元的誤差信號,此誤差信號即作為修正各神經元權值的依據。 這種權值修正的過程,也就是網絡的學習訓練過程。這種過程不斷迭代,最后使得誤差信號達到允許的范圍內。

在BP 神經網絡預測前,首先要訓練網絡,通過訓練使網絡有聯想記憶和預測的能力。 具體的步驟如下:

第一步:設置好已知參數,包括目標輸出、預期平均誤差、隱含層的數量與神經元個數、輸出層的神經元個數、各層的權值與閥值等。

第二步:數據歸一化。在設定好各種參數之后,確定每一樣本的參數。 每一樣本的每個數據作為輸入層神經元,所有樣本計算做為一個學習周期,為了使網絡能更快地收斂,應該將輸入層神經元歸一化,即將其按照式(1)轉換為(0,1)之間的值,其中x 是樣本數據。

第三步:確定樣本數據之后,通過每一個樣本數據對網絡進行的計算。 計算時首先將輸入層神經元按照式(2)計算出隱含層輸入,其中h 表示隱含層,k 表示第k 個樣本,wih表示第i 個輸入層神經元與第h個隱含層神經元之間連接的權值,bh表示隱含層第h 個神經元的閥值。 計算隱含層輸入之后通過可導函數(一般選擇sigmond 函數,如式(3)所示,其中x 表示隱含層輸入)處理得出隱含層輸出;將第一層隱含層的輸出作為下一隱含層的神經元進行下一隱含層輸入計算,在通過可導函數處理得出下一層隱含層的輸出如此反復計算,直至隱含層全部計算完;

第四步:誤差計算,更新權值和閥值。

第五步:判斷誤差是否符合預定要求,若符合,則停止迭代;否則轉第二步。

圖1 BP 神經網絡流程圖

2 人口預測

2.1 數據來源

為了驗證神經網絡模型在人口預測中的效果,本文采用的我國人口數據均來自1995 -2012 年的《中國統計年鑒》,具體數值如表1 所示。 我們將數據分為兩部分,1995-2008 年作為訓練樣本,2009-2012年作為測試樣本。

表1 1995-2012 年我國人口數據統計(年/萬人)

2.2 BP 神經網絡拓撲結構的確定

如果隱含層神經元數目過少,網絡很難識別樣本,難以完成訓練,并且網絡的容錯性也會降低;如果數目過多,則會增加網絡的迭代次數,從而延長網絡的訓練時間,同時也會降低網絡的泛化能力,導致預測能力下降。在選擇隱含層層數時要從網絡精度和培訓時間上綜合考慮。在具體設計時,首先根據經驗公式初步確定隱含層神經元個數,然后通過對不同神經元數的網絡進行訓練對比, 再最終確定神經元數。通用的隱含層神經元數的確定經驗公式有:

其中i 為隱含層神經元的個數,n 為輸入層神經元的個數,m 為輸出層神經元的個數, a 為常數且1<a<10 。 則在本文中,經過不斷的模擬實驗,以出錯率、偏差值、訓練次數、時間作為成功與否的3 個判斷條件,當3 個條件都符合的時候即為符合條件的神經網絡。 從符合條件的多個神經網絡中挑選出最佳的一組,最終將隱含層節點數確定為3 個(即網絡結構為1-3-1),輸入層轉移函數確定為tansig,輸出層函數確定為tansig。學習次數為1000 次,學習函數為默認函數,訓練函數為trainlm 函數,訓練次數為500 次。

圖2 BP 神經網絡數據訓練圖

2.3 人口預測結果

由圖2 可知,神經網絡很快就訓練收斂了。 經過多次訓練和學習,得到BP 網絡的預測值。 預測結果是2009-2012 年人口預測數量分別為:133487,133985,135139,135431.(單位:萬人)。

2.4 結束語

將BP 預測值與實際值做比較, 2009-2012 年的相對誤差為0.01%、0. 01%、0.3%、0. 009%.

BP 網絡預測結果表明, 比其他數學方法預測值更接近實際值.這是因為我國的人口數量受多種因素的影響,人口的增長呈非線性局勢, 而BP 網絡的優點就在于它的非線性趨近性和泛化能力。 本文采用自適應學習速率和附加動量法相結合的方法, 比應用單一的方法效果要好很多。 BP 網絡具有它的局限性, 隱含層的設計是人為設定的,這樣很容易造成誤差。 因此, 如何更好的將BP 網絡與其他神經網絡結合起來應用于人口預測系統, 是我們以后努力的方向。

[1]王曉龍,楊廣,張保華.灰色及其改進模型在人口預測中的應用[J].世界科技研究與發展,2009,31(4):757-758.

[2]蔣超,楊琳,付敏.中國人口預測的數學模型[J].內江師范學院學報,2008,3(12):33-35.

[3]邢立遠,黃東偉,曹宇.BP 神經網絡在中國人口預測中的應用[J].紡織高?;A科學學報,2010,23(3):386-388.

[4]陳虹,田八林.徑向基函數網絡在陜西省人口預測中的應用[J].現代電子技術,2005,28(23):91-92.

猜你喜歡
人工神經網絡權值神經元
一種融合時間權值和用戶行為序列的電影推薦模型
《從光子到神經元》書評
CONTENTS
利用人工神經網絡快速計算木星系磁坐標
人工神經網絡實現簡單字母的識別
躍動的神經元——波蘭Brain Embassy聯合辦公
基于權值動量的RBM加速學習算法研究
基于二次型單神經元PID的MPPT控制
毫米波導引頭預定回路改進單神經元控制
基于聲發射和人工神經網絡的混凝土損傷程度識別
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合