?

基于人工神經網絡的長三角城市創新能力評價

2024-02-17 05:14
中阿科技論壇(中英文) 2024年2期
關鍵詞:權值神經元指標體系

馮 赟

(同濟大學經濟與管理學院,上海 201804)

黨的二十大報告指出,高質量發展是全面建設社會主義現代化國家的首要任務。區域創新在高質量發展中扮演著關鍵角色。隨著各地區域創新步伐的加快,知識、技術、人才等創新要素的集聚,推動了區域創新型科技園區和高新技術產業的發展,為構建現代產業體系提供了重要支撐。區域創新發展增強了國內大循環的內生動力和可靠性,成為推動高質量發展的“倍增器”[1]。

城市創新能力在區域創新能力中具有重要作用。城市具備資源集中和主體多元的優勢,使其創新能力具有獨特性。盡管存在關于城市創新是側重于文化等軟創新還是技術等硬創新的爭議,但普遍認為城市是創新的重要單元,城市創新能力是國家創新能力的重要組成部分[2]。

城市創新能力的評價方法主要包括綜合指數法、灰色聚類法、因子分析法和熵權TOPSIS法,其能夠針對不同評價目標、主體和標準來確定評價指標權重,并對數據進行處理和計算,最終得出評價結果。然而,這些評價方法在處理非線性問題時可能不夠準確和靈活,并在處理大量數據時還可能存在計算量大、效率低的問題,且需要事先確定指標權重和參數。

因此,本文提出了基于人工神經網絡的評價方法。這種方法模仿人腦神經元工作機制,能處理復雜的非線性關系,適應數據變化,并能夠通過自適應學習來優化網絡結構和參數。對于城市創新能力的研究,涉及到由多個子系統的多個指標項組成的復雜系統。因此,將人工神經網絡應用到城市創新能力的研究中具有得天獨厚的優勢。

1 指標體系構建

1.1 構建城市創新能力評價指標體系應遵循的原則

(1)體現內涵,突出目標:城市創新能力反映了科技、經濟、社會等領域的創新活動能力和效果,而評價指標體系需要以統計核算體系為基礎,再加上綜合性指標體現城市創新能力的新概念和內容[3-4]。

(2)全面但不涵蓋所有可能性:指標體系應反映科技、經濟、社會發展的各個方面,但并非涵蓋所有可能的指標。無法量化或數據不易獲得的指標可暫不列入。

(3)繼承性和創新性相結合:指標體系既不能簡單地復制現有的城市創新能力統計指標體系,也不能完全脫離該體系。應在充分利用現有統計體系的基礎上有進行發展和創新,以反映城市創新能力的實際情況。

(4)普遍性和特殊性的統一:由于各城市的特殊性,建立通用指標體系困難。由于評價者的知識水平、背景、認識問題的角度、價值觀念和對目標的理解存在差異,因此會構建出不同的城市創新能力指標體系。

(5)科學性與現實性的統一:評價指標設計需考慮研究任務與客觀現象特性,實現科學性原則,即要求主觀要求與客觀實際相統一,使評價指標成為反映客觀現象的有效工具。為了確保評價指標的科學性和客觀性,應遵循“實事求是”的原則,使其定量描述以定性認識為前提。在具體的設計過程中,應注重指標的規范化、標準化和科學化,避免解釋的重復和遺漏,確保評價指標的準確性和完整性。

(6)實用性與可操作性:城市創新能力評價指標體系需考慮實用性和可操作性,以便決策者使用。一個實用的指標體系應具備以下特點:易于理解、易于接受、數據易于收集和量化,同時具有評價性和比較性。在反映基本內涵的前提下,選取的指標應盡可能少、避免重復、含義明確,具有現實統計基礎,便于使用。

1.2 建立城市創新能力評價指標體系

本文以長三角地區城市為樣本,查閱2012—2021年《中國統計年鑒》《中國城市統計年鑒》與國家知識產權局專利數據庫,獲取27個城市10年的面板數據,共計270個觀測樣本。遵循重要性、必要性、科學性等原則,在對《中國區域科技創新評價報告》等相關文獻以及相關政策進行分析的基礎上,構建了城市創新能力評價指標體系。指標體系內容如表1所示。

表1 城市創新能力評價指標體系內容

表2 指標數值優劣程度與所處區間的關系

創新環境是城市創新能力的基礎,其涉及到城市的教育、醫療、社會等方面的條件,影響著城市的創新氛圍和創新文化。創新資源是城市創新能力的保障,其涉及到城市的科技、資金、人才等方面的投入,影響著城市的創新能力和創新效率。創新產出是城市創新能力的表現,其涉及到城市的專利、產業、經濟等方面的成果,影響著城市的創新水平和創新競爭力。

2 基于人工神經網絡的評價方法

2.1 RBF神經網絡結構和原理

RBF神經元模型如圖1所示。圖1中,‖dist‖為歐氏距離,用函數式可以表示為:

圖1 RBF神經元模型

式(1)中,w為權值矩陣,x為輸入向量,權值矩陣元素w1,i的第一個下標參數表示的是權值連接后一層接收目標神經元的編號,第二個下標參數表示權值連接前一層輸出源神經元的編號。例如,w1,2表示該元素是從前一層第二個神經元到后一層第一個輸入神經元的連接權值。

另外,凈運算值n為RBF神經元的中間運算結果,可由式(2)表示為:

RBF神經元模型的輸出y為:

式(3)中,,rbf(x)為徑向基函數,常見的形式有:

多項式高斯徑向基函數或廣義徑向基函數:

RBF神經網絡由輸入層、單層隱含層、輸出層三層組成,其結構如圖2所示。

圖2 RBF神經網絡的結構原理圖

圖2中,n1為RBF神經網絡隱含層的中間運算結果,可由式(7)表示為:

式(7)中,,diag(x)表示取矩陣向量主對角線上的元素組成的列向量,b1代表第1層神經元的偏置值信息,ones(N,1)指一個N行1列的全1矩陣。RBF神經網絡隱含層的輸出y1為:

n2為RBF輸出層的中間運算結果,可由式(9)表示為:

RBF神經網絡的輸出y2為:

RBF神經網絡中,隱含層節點利用徑向基函數對輸入信號進行局部響應。當輸入信號接近函數中心時,隱含層節點會產生較大的輸出,顯示出其局部逼近能力。因此,RBF神經網絡也被稱為局部感知場網絡。RBF神經網絡的核心是利用徑向基函數作為隱含層單元的基,將低維輸入數據映射到高維空間,實現低維空間線性不可分問題在高維空間的線性可分。

假設RBF神經網絡的輸入向量x為R維,輸出向量y2為S2維,輸入和輸出樣本的數量為N。該網絡的隱含層傳遞函數由徑向基函數構成,通常選用式(4)所示的高斯函數。輸入層節點將輸入信號傳遞給隱含層,實現了x →y1(x)的非線性映射,即:

輸出層的傳遞函數采用線性函數,實現了從隱含層到輸出層的信號傳遞的線性映射,即:

2.2 RBF神經網絡算法

假設RBF神經網絡有N個訓練樣本,則系統對N個訓練樣本的總誤差函數為:

式(13)中,N為輸入輸出樣本數,S2為RBF神經網絡輸出節點數,表示在樣本p作用下的第個神經元的期望輸出,表示在樣本p作用下的第k個神經元的實際輸出[5]。

RBF神經網絡的學習過程分為兩個階段:無監督學習和有監督學習。在無監督學習階段,主要目標是根據所有輸入樣本確定隱含層節點的徑向基函數的中心向量和標準化常數。這個階段通過使用均值聚類算法對所有樣本輸入進行聚類,訓練樣本集的輸入向量被劃分為若干個族群,并在每個族群內部找出一個徑向基函數的中心向量。選擇這個中心向量的依據是它能使該族群內各樣本向量與該族群中心的距離最小化。具體步驟如下:

1)初始化各隱含層節點的中心向量,并設定停止計算的誤差閾值。

2)計算輸入樣本與各中心向量的歐氏距離,并找出歐式距離最小的節點:

式(14)中,p為樣本序號,r為中心向量ci(p-1)‖與輸入樣本‖x(p)距離最近的隱含層節點序號。

3)調整RBF神經網絡隱含層徑向基函數的中心向量:

式(15)中,η(p)是學習速率,,0 <η(p)<1。η(p)=,int (x) 表示對x進行取證運算。式(15)表明經過S1個樣本之后,學習速率逐漸減小至零。

4)評估聚類質量。當滿足式(16)時,聚類結束,否則轉到第2)步。

在隱含層的參數確定后,利用最小二乘法的原則來計算隱含層到輸出層的連接權值。當確定后,開始訓練隱含層到輸出層之間的連接權值。由于輸出層的傳遞函數是線性函數,求解連接權值的問題就轉化為線性優化問題。因此,與線性網絡相類似,RBF神經網絡隱含層到輸出層連接權值ωki(k=1,2,…,S2;i=1,2,…,S1)的學習算法為:

由于向量y1中僅有少數元素為1,其余均為0,因此在進行一次數據訓練時,僅有少量的連接權值需要調整。這一特點使得RBF神經網絡能夠快速地學習。此外,當輸入向量x遠離ci時,會變得非常小,近似為0。實際上僅當)大于某一閾值(例如0.05)時,才會對相應的權值wk i進行修改。經過這樣的處理,RBF神經網絡同樣具備局部逼近網絡學習收斂快的優點。

RBF神經網絡學習算法的關鍵在于確定隱含層節點中心參數。常用方法包括直接選取或聚類方法,以下是幾種常見的學習算法。

(1)直接計算法:隱含層節點中心在輸入樣本中隨機選取并固定。隱含層輸出確定后,求解隱含層到輸出層的連接權值,相當于求解線性方程組。

(2)自組織學習選取法:通過自組織學習確定隱含層節點中心,再通過有監督學習確定隱含層到輸出層的連接權值。此法采用均值聚類法選擇RBF神經網絡的中心,屬于無監督學習方法。通過學習使隱含層節點中心位于輸入空間重要區域。

(3)正交最小二乘法法:其源于線性回歸模型。RBF神經網絡輸出為隱含層神經元的響應參數和隱含層到輸出層連接權值的線性組合。所有隱含層神經元的回歸因子構成回歸向量,因此,RBF神經網絡的學習過程主要是回歸向量的正交化過程。

在許多實際問題中,需要通過學習獲得RBF神經網絡隱含層節點中心,以更好地反應訓練集數據所包含的信息。

3 模型建立與求解

本文涉及神經網絡訓練集由仿真模擬得出。在模擬前,需對各項指標數據進行模糊化處理。數據年份為2012—2021年,涵蓋27個城市,每個指標有270條數據。計算各指標數據的最小/最大值、第60/70/80/90個百分位數;并將指標數據分為5個區間,用1~5表示指標數值的優劣程度,即數字越大、指標數值越優。對于每一指標的每一區間,隨機生成2 000條訓練集數據,總共10 000條,將使用這些數據作為訓練集。采用MATLAB進行編程,對訓練集進行模擬,搭建并訓練RBF神經網絡。

選擇高斯徑向基函數作為單一RBF神經網絡隱含層神經元的激勵函數,并利用newrb函數進行學習。其調用格式為net=newrb (X,T,GOAL,SPREAD,MN,DF)。其中,X為輸入數據,T為期望輸出數據,GOAL為訓練目標,設為0.01;SPREAD為函數寬度,設為2 000;MN為隱含層神經元的最大個數,設為5 000;DF為兩次顯示之間所增加的神經元數目,設為1。

生成訓練集時,各條數據中不同指標的值均隨機處于同一優劣程度的區間范圍內,如所有指標數值均為“4(良)”。如果一條數據的所有指標數值都處于同一優劣程度區間,那么該數據的綜合優劣程度即為各指標數值的優劣程度。

測試集則采用1.2節指標體系所對應的270個樣本。使用訓練完成的神經網絡模型對測試集進行評估,得到對應的評估結果,如表3所示。

表3 長三角各城市創新水平得分

由表3得到以下幾點結論。

(1)長三角地區的城市創新能力總體上呈現上升趨勢,但各城市之間的差異較大,存在明顯的空間分異。從評價結果來看,上海市、杭州市、蘇州市、南京市等城市的創新能力較高,屬于創新型城市;而安慶市、泰州市、鹽城市、揚州市等城市的創新能力較低,屬于創新能力待提升的城市。這些差異主要受到城市的經濟發展水平、科技投入水平、人才資源水平、政策支持水平等因素的影響。

(2)長三角地區的城市創新能力與城市的規模、地理位置、行政級別等因素有一定的相關性。一般來說,城市規模越大、創新能力越強,這是因為大城市具有更多的人口、資本、信息、技術等創新要素,也具有更強的創新需求和創新動力。城市的地理位置也會影響城市的創新能力,沿?;蜓亟某鞘型ǔ>哂懈玫慕煌?、通訊、貿易等條件,有利于創新資源的流動和交流。城市的行政級別也會影響城市的創新能力,省會城市或直轄市通常享有更多的政策優惠和財政支持,有利于創新環境的優化和創新活動的開展。

4 結論

本研究文基于人工神經網絡,構建城市創新能力評價模型,以長三角地區的27個城市為例,評價2012—2021年城市創新能力。通過模擬訓練集和測試集數據,得到準確、合理的評價結果,反映長三角城市創新能力差異和變化。本研究結果可為政府和企業創新決策提供依據,幫助其制定創新戰略、優化創新資源配置、改善創新環境、提高創新效率和效果,推動城市經濟可持續發展,增強城市競爭力。

猜你喜歡
權值神經元指標體系
一種融合時間權值和用戶行為序列的電影推薦模型
《從光子到神經元》書評
CONTENTS
躍動的神經元——波蘭Brain Embassy聯合辦公
層次分析法在生態系統健康評價指標體系中的應用
供給側改革指標體系初探
基于權值動量的RBM加速學習算法研究
基于二次型單神經元PID的MPPT控制
毫米波導引頭預定回路改進單神經元控制
測土配方施肥指標體系建立中‘3414
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合