?

基于改進PCA的高新企業核心技術創新與專業技能提升數據分析研究

2023-07-12 14:39張瑋
粘接 2023年6期
關鍵詞:隨機森林信息熵主成分分析

張瑋

摘 要:針對企業創新創業技能提升影響因素多,各因素相關性強,傳統主成分分析不能夠很好地提取主要因素的問題。通過隨機森林模型獲得最佳特征組合,采用信息熵對傳統主成分分析進行改進。對比主成分分析和改進主成分分析結果,改進主成分分析的前3個主成分包含了超過95%的信息量,而傳統主成分分析的前7個主成分所包含的信息量僅為91.01%。結合主成分分析結果指出有效提升化工企業創新創業技能必須強化員工技能培訓,注重企校合作,打造創新創業平臺,這對化工企業轉型升級提供了數據支撐。

關鍵詞:隨機森林;主成分分析;信息熵;企業

中圖分類號:TP391;TQ050.8 文獻標志碼:A文章編號:1001-5922(2023)06-0166-05

Research on improving innovation and entrepreneurship skills of enterprises based on improved PCA

ZHANG Wei

(Jiangsu Provincial High & New Technology Innovation Centre,Nanjing 210008,China)

Abstract:The traditional principal component analysis cannot effectively extract the main factors that affect the improvement of innovation and entrepreneurship skills in enterprises due to the multiple factors and strong correlation among them.The best feature combination is obtained through random forest model,and the traditional principal component analysis is improved by information entropy.Comparing the results of principal component analysis and improved principal component analysis,the first three principal components of improved principal component analysis contain over 95% information,while the first seven principal components of traditional principal component analysis only contain 91.01% information.Based on the results of principal component analysis,it is pointed out that effectively improving the innovation and entrepreneurship skills of chemical enterprises requires strengthening employee skill training,emphasizing enterprise school cooperation,and creating innovation and entrepreneurship platforms.This provides data support for the transformation and upgrading of chemical enterprises.

Key words:random forest;principal component analysis;information entropy;enterprise

環境污染、能源危機使得國民的環保意識不斷增強,化工企業傳統經營模式必須實施改革,通過提升企業的創新創業技能,確保自身市場競爭力的持續提升[1]。影響化工企業創新創業技能提升的因素是多方面的,提升企業創新創業技能必須抓取主要因素。主成分分析(PCA)在處理復雜影響因素且各種影響因素之間具有一定相關性的問題中具有突出的優勢,在許多領域得到了廣泛的應用[2]。構建了激光麥克風語音信號特征提取的PCA模型,有效降低了計算成本和時間,并指出由第1主成分重構的語音信號最為清晰[3]。采用PCA構建了CFRP-鈦合金疊層材料制孔刀具健康指標,其健康指標具有良好單調性、趨勢性,能夠有效反應制孔刀具加工過程的健康狀態,達到提升孔加工精度和加工質量的目的[4]。為解決風電齒輪箱故障診斷特征指標之間存在的相互干擾、非線性分類困難問題,采用PCA對數據降維處理,并結合支持向量機實現了對風電齒輪箱故障高精度分類的目的[5]。采用PCA對小麥籽粒、面粉、面團品質指標進行分析,有效篩選出綜合性狀優良的品種,實現了對優質強筋小麥品質的改良[6]??紤]到影響企業創新創業技能提升的因素是十分復雜的,且各因素之間存在相關性。對PCA進行改進,獲得影響企業創新創業技能提升的主要因素,從而達到提升企業創新創業技能的目的。

1 化工企業創新創業技能影響指標體系

化工企業創新創業技能直接影響到企業的競爭力,影響企業創新創業技能的因素是多方面的,同時各種影響因素之間往往存在一定的相關性。通過對創新創業技能的分析,構建影響指標體系,如圖1所示。

由圖1可知,從創新創業意識、創新創業環境、創新創業水平、創新創業制度4個角度構建了包含16個指標的企業創新創業技能影響體系。很明顯,16個指標中部分指標之間存在明顯的相關性,如主觀意愿和內在動力。只有具有比較強的主觀意愿,才能夠激發企業創新創業的內在動力,但是2者之間也存在差異。采取PCA來消除16個指標之間的相關性,減少影響企業創新創業技能提升的指標維度[7]。

2 化工企業創新創業技能主因素提取模型

2.1 主成分分析

主成分分析的關鍵是降維,作為多元統計方法,其在處于具有比較強相關性的多指標問題中具有良好的效果[8]。影響化工企業創新創業技能提升的指標是多方面的,同時不同的指標之間存在相關性且不同指標對企業創新創業技能提升的影響也存在比較大的差別。通過PCA來獲取信息量大的主成分,確保所篩選出的評價指標之間不相關,大大減少數據分析的工作量[9]。定義為化工企業創新創業技能影響指標集合,對各影響指標進行標準化處理消除評價指標數據之間存在的量綱差異,即

3.3 結果分析

分別采用PCA和信息熵改進PCA的特征信息融合模型進行分析,結果如表1所示。

由表1可知,采用主成分分析,第1主成分特征值為1.236,方差占總方差的比重為26.45%,前7項主成分在總方差中的比重超過90%。采用信息熵改進PCA的特征信息融合模型,第1主成分特征值為3.56,前3項主成分在總方差中的比重超過90%。由此可見,通過計算隨機森林模型對應特征重要性指標,以指標篩選出的最佳特征組合使得算法的效率大大提升,通過前3個主成分就可以包含原有信息超過95%的信息量。獲取主成分載荷矩陣[20],結果如表2所示。

由表2可知,對第1主成分影響比較大的是創新創業能力和創新創業環境;對第2主成分影響比較大的是創新創業定位和創新創業制度;對第3主成分影響比較大的是創新創業主觀意識。

3.4 企業創新創業技能提升建議

通過對化工企業創新創業技能提升影響因素的主成分分析可知,提升創新創業技能的關鍵在于創新創業能力的提升與創新創業環境的改善。為了有效提升化工企業創新創業技能,需要做到3個方面的內容。

3.4.1 強化員工技能培訓

化工企業創新創業技能提升的關鍵在于員工技能的提升,必須強化對員工的技能培訓。員工只有掌握了相應的創新創業技能,才能夠更好地結合企業現有的資源實施創新創業,打造符合市場需求的高質量產品。構建對企業員工的完善培訓體系,使得員工的個人發展和企業的發展之間實現雙贏。圖3為構建的員工技能培訓體系。

3.4.2 注重企校技術合作

企校合作是企業在發展的過程中有效借助專業高校的力量來促進企業創新創業技能的提升,高校的發展離不開企業,同樣企業的高質量發展也離不開高校。通過注重企校合作將高校先進的技術應用于企業實際生產中,提升企業產品的市場競爭力。充分發揮企校合作在提升化工企業創新創業技能方面所發揮的重要作用,具體如圖4所示。

3.4.3 打造創新創業平臺

打造創新創業平臺能夠有效改善化工企業創新創業環境,從而達到提升企業創新創業技能的目的。企業要加大對創新創業的支持力度,在整個企業內部形成人人講創新創業的良好氛圍,對創新創業過程中存在的錯誤給予最大程度的寬容,激發員工的創新創業潛能。

4 結語

創新創業技能的提升是化工企業轉型升級,更好迎合社會和市場發展需求的關鍵。構建了包含16個指標的企業創新創業技能影響指標體系,采用信息熵改進主成分分析,得到了對化工企業創新創業技能影響大的主成分。通過和傳統主成分分析結果對比,改進主成分分析模型能夠通過比較少的主成分來獲取原始數據中所包含有的超過95%的信息量。為提升化工企業創新創業技能,要重點強化員工技能培訓,注重企校合作,打造創新創業平臺,這對化工企業實施轉型升級,實現綠色、可持續發展提供了參考。

【參考文獻】

[1]屈永斌.面向化工企業的管理系統構建及實現[J].粘接,2021,47(7):141-144.

[2]陳艷杰.HPLC法測定銀杏葉提取物中9種小分子有機酸類含量研究[J].粘接,2021,48(12):39-43.

[3]孫學明,張大華,周志全,等.基于主成分分析的激光麥克風的語音信號提?。跩].激光與紅外,2022,52(12):1761-1767.

[4]王賢鋒,王守文,張烘州,等.基于主成分分析的CFRP—鈦合金疊層材料制孔刀具健康指標構建[J].工具技術,2022,56(11):128-132.

[5]黃宇斐,石新發,賀石中,等.一種基于主成分分析與支持向量機的風電齒輪箱故障診斷方法[J].熱能動力工程,2022,37(10):175-181.

[6]李曉麗,姜蘭芳,馬小飛,等.基于主成分分析的強筋小麥加工品質綜合評價[J].麥類作物學報,2022,42(12):1473-1483.

[7]張賤根,劉均華,劉知遠,等.基于相關性和主成分分析的上猶名優綠茶品質評價[J].食品安全質量檢測學報,2023,14(3):285-292.

[8]劉青,張浩然,尚英強,等.基于主成分分析法的高壓服役電纜主絕緣老化狀態評估[J].絕緣材料,2022,55(11):56-62.

[9]鄭自強,李凌,喬宇,等.基于主成分分析的目標熱紅外偽裝效果評價研究[J].激光與紅外,2023,53(3):431-438.

[10]孫強,王麗艷,荊瑞勇,等.不同品種亞麻籽8種生物活性物質含量及其主成分分析[J].食品與機械,2022,38(9):40-45.

[11]滑小贊,程濱,趙瑞芬,等.基于主成分分析的山西省油桃主產區土壤肥力評價[J].北方園藝,2023,524(5):77-84.

[12]陳偉,陳紹安,羅婷,等.思茅松產脂量相關生態因子的主成分分析[J].西部林業科學,2023,52(1):27-33.

[13]梁良,杜雨馨,楊子建.基于主成分分析的有機化合物吸收光譜識別方法[J].激光雜志,2022,43(9):183-187.

[14]鄧智廣,譚振鵬.基于機器學習的智能電網調度控制系統在線健康度評價研究[J].粘接,2021,48(12):158-161.

[15]陳薛輝,馮燕,錢權.差分隱私保護的隨機森林算法及在鋼材料上的應用[J].工程科學學報,2023,45(7):1194-1204.

[16]李順勇,許曉麗.基于信息熵加權的多視圖子空間聚類算法[J].陜西科技大學學報,2023,41(2):207-214.

[17]楊軍,張敏敏.利用模型相似性的三維模型簇協同分割[J].光學精密工程,2021,29(10):2504-2516.

[18]王小剛,閆光輝,周寧.多階鄰接分布熵下的復雜網絡節點相似性分析方法[J].控制理論與應用,2021,38(6):739-747.

[19]潘婷婷,張楓,邢昆明,等.不同儲層相對滲透率曲線歸一化方法評價[J].大慶石油地質與開發,2016,35(3):78-82.

[20]閆春曉,周聰,王德華,等.基于主成分分析玫瑰露酒感官特征與偏好性關系[J].食品研究與開發,2023,44(1):83-88.

收稿日期:2023-01-20;修回日期:2023-04-20

作者簡介:張 瑋(1981-),男,碩士,副研究員,研究方向:科技管理;E-mail:zhweizq_zh@sina.com。

基金項目:江蘇省高新技術創業服務中心自立項目(項目編號:CY202105)。

引文格式:張 瑋.基于改進PCA的高新企業核心技術創新與專業技能提升數據分析研究[J].粘接,2023,50(6):166-170.

猜你喜歡
隨機森林信息熵主成分分析
基于信息熵可信度的測試點選擇方法研究
基于信息熵的實驗教學量化研究
一種基于信息熵的雷達動態自適應選擇跟蹤方法
隨機森林在棉蚜蟲害等級預測中的應用
基于二次隨機森林的不平衡數據分類算法
拱壩變形監測預報的隨機森林模型及應用
主成分分析法在大學英語寫作評價中的應用
江蘇省客源市場影響因素研究
SPSS在環境地球化學中的應用
基于隨機森林算法的飛機發動機故障診斷方法的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合