?

統計學科技情報“知識圖譜”教學工具的構建

2024-03-08 03:31鞠成曉
長春師范大學學報 2024年2期
關鍵詞:商科知識圖譜圖譜

易 翔,鞠成曉

(東莞城市學院商學院,廣東 東莞 523419)

1 研究背景

在智能技術沖擊傳統產業的時代背景下,商業模式和管理模式被迫處于高速迭代變更狀態。產業需求的變化向上傳遞至專注于人才輸出的教育行業,也驅動著擁有商科專業的各類高校不得不思考如何在課程建設中進行“數智化”轉型。除了硬件的導入和升級,通過計算機強大的運算能力及機器的理性決策,輔助教學人員完成商業概念和產業重要節點內容的傳導,使得“新商科”這個概念逐漸成為炙手可熱的話題[1-3]。2018年5月于北京召開的教育部產學合作協同育人項目對接會上,首次提出了“新文科”概念。相對于傳統文科,新概念更加強調學科深度交叉融合,以促進該領域新理論、新機制、新模式的形成。在服務國家應對當今更為錯綜復雜的全球形勢的同時,促進國內經濟社會領域深化改革,幫助人們解決與精神價值相關的重大理論問題?!靶律炭啤笔窃凇靶挛目啤斌w系下延展出的關于經濟管理的教育門類分支。傳統商科對專業人才的塑造,不論是會計、財務管理,還是人力資源管理和市場營銷,大多是基于學科內容區分,幫助未來從業者完成在認知層面的職能定位。但是,當下復雜的經濟環境要求商科專業人士能從商業手段、管理技巧及操作技能方面主動回應由于技術創新、社會變革所帶來的產業新需求。因此,“新商科”體系塑造出的專業人士一定是既懂經濟、管理,又懂新技術應用的跨學科、復合型人才。而這樣的多領域專業認知技能融會貫通的一個關鍵就在于新商科人才數據思維特征的培育[4]。王昕等[5]在探究數字經濟時代新商科專業群的建設路徑問題時指出,當下的教學重心應該逐步從占有知識轉向利用多種數字化技術和數據內容解構新商科跨專業領域(如科技金融、精準營銷、跨境電商等)的應用知識層面。一方面是為了適應市場變革,因為數字化技術和數據要素不僅是深化數字經濟迭代發展的引擎,同時也是驅動商業模式進化升級的關鍵;另一方面,加強對商科人才數據思維的培育,也能促進我國人才市場對國際格局變化和社會科學中國化需求進行有效回應。

隨著全球化的技術迭代快速更新,知識密集型的經濟模式正逐漸主導著社會的發展。知識經濟帶來的關于技術創新、產品周期、客戶偏好、商業模式等爆炸式增長的信息,極大地延長了專業人士的認知周期,同時也給他們在知識選擇上帶來了困難。為了幫助專業人士迅速地進行新知識結構的搭建,并快速實現信息檢索,專注于專業知識核心節點繪制、特征信息挖掘、關聯關系分析、知識計量生成和可視化展示的新興學科逐漸成為研究人員的討論熱點。這門包含著信息處理、計算機手段、統計算法、應用數學模型、商科理論等眾多交叉領域專業技術的學科被定義為“知識圖譜”[6]。知識節點的降維分類、節點內容的關聯、相關重要性的計量及節點空間位置的可視化呈現,能加深專業人員對自己研究領域在知識空間所處位置的了解。知識圖譜在空間上描述了特殊知識資源的整體概況。以知識圖譜為代表的大數據知識工程技術也為成就包含智能評估、智能決策的新型商業模式帶來全新的機遇[7]。

2 新教學手段設想及知識圖譜系統繪制方案

科技媒體作為覆蓋新概念、新技術、新產業最廣的內容源之一,在其對外公開的信息和數據中,存在大量的實體和關系。但是,它們之間通常缺乏確定的“邏輯指向”,這也造成專業人員或專業學員無法有效地認知科技概念并挖掘出相關潛在價值。相較于傳統的“關系型”數據庫,建立知識圖譜數據庫更擅長回應復雜的關系網絡。在知識圖譜系統實現自動化自我學習與優化過程中存在一個關鍵問題,即在先驗階段通過人工干預生成初級知識圖譜各節點之后,面對某些節點存在眾多關聯的子節點的情況(圖1),如何通過價值分類,區分低價值子節點、高價值子節點。因為只有層次分明,才會方便后續后臺服務器針對不同價值權重的子節點形成優化的信息追蹤方案,并將有限的算力及存儲資源集中在高價值節點,實現基于知識圖譜的智能系統作用最大化。目前,在確定知識圖譜各節點要素方面,大多是采用現有知識百科固有模板,通過條件隨機場模型的預測算法(CRF)對標準語料庫進行學習及人工干預補充得到節點屬性。而節點權重價值則一般通過某節點所有鄰近關聯節點總數的導數[8],或者通過節點關聯特征向量的逆文檔頻率來確定[9-10]。不過這兩種方法的問題在于,對于前者,由于在確定節點實體要素階段人工干預影響的不確定性,往往會對節點所有鄰近關聯節點總數產生較大影響,因此容易造成節點權重價值產生較大偏移;而后者,其初衷原本是抑制某一節點無意義高頻詞的負面影響,但高頻詞并不等于無意義詞,而低頻詞的偶然出現也容易被當作高權值關鍵詞而納入節點的關鍵向量特征,從而過度放大包含大量生僻詞特征向量節點的重要性。因此這兩個指標并不適合節點價值分析。節點價值的識別、分類和優化是增強知識圖譜實用效力的基礎。如果僅通過擴大人工干預的影響來實現,受個體差異的影響,不同專業人員對節點價值判斷則難以相同。如何提供一種設備,使其能準確、自動化地從科技媒體消息來源、渠道、情報等因素中判斷出節點價值,從而構造出更優化的知識圖譜是一個難題。

圖1 行業知識圖譜示例

針對當前技術的缺陷,本文提出了一種基于科技媒體情報的智能優化新興科技行業知識圖譜系統繪制方案,其整體框架如圖2所示。方案包括依次相連的目標行業數據采集&傳輸接口、與所述數據采集&傳輸接口連接的處理器、與所述處理器連接的存儲器。圖2所示的存儲器存儲行業知識圖譜節點內容及知識圖譜節點情報價值數據庫,行業知識圖譜節點內容主要包括行業關鍵詞。行業知識圖譜節點情報價值數據庫包括節點情報長度L、最新報道時間間隔I、關聯報道出現頻率F、關聯報道總長度C和消息來源加權平均值W,五個指標數據作為識別節點價值的指標,構建LIFCW模型,如表1所示

表1 知識圖譜LIFCW模型各指標

圖2 系統框架圖

表2 節點價值指標數據

圖3具體描述了由數據預處理模塊和“建模+應用”模塊組成的處理器。數據預處理模塊將接收上述數據并進行預處理,包括數據規約、數據變換、缺失值和異常值識別、數據清洗與整理。

圖3 系統處理器操作流程圖

……

將所有數據對象分配完成后,計算每個聚類的均值,并與初始聚類中心比較。若發生變化,則重新定義聚類中心,并計算所有子節點數據點到各新聚類中心的距離,并將它們分配到新的距離最近的聚類中。重復以上步驟,直到聚類中心不再變化,這種劃分使得下式最小:

3 結語

科技媒體作為覆蓋新概念、新技術、新產業最廣的內容源之一,通常也是商科統計課程中數據和案例資料的重要來源。值得注意的是,在其對外公開的信息和數據中存在大量的實體和關系。在用于教學的科技情報知識圖譜系統構建過程中,若逐一關注體量龐大的實體及其關聯節點,將會帶來很高的操作成本,有針對性的資源投放也難以開展。這種情況下,如果采用傳統的自然語義分析方法來確定節點價值權重,容易過度放大帶有大量生僻詞特征向量節點的重要性。而若采取人工干預,其經驗的不確定性也容易造成節點權重價值產生嚴重偏移。本文提出的知識圖譜繪制系統,具有的效益在于更為深入、準確地表達圖譜中子節點詞條對于上一節點詞條的重要性,并進一步地為信息數據追蹤提供了判斷方案。處理器中的“建模+應用”模塊對應的LIFCW模型,相比傳統基于文檔詞頻的節點權重判斷方案,不僅不會過度放大包含大量生僻詞特征向量節點的重要性,而且由于新興媒體對新興行業所有特征的特殊敏感性,基于情報的價值判斷更有益于在繪制知識圖譜時,有效識別出最有價值的節點群。通過突出高價值節點的位置,將方便后續后臺服務器針對不同價值權重的子節點形成優化的信息追蹤方案,將有限算力及存儲資源集中在高價值節點,進而幫助專業人才在跟蹤與分析新興行業領域主要特征數據時,更有效地判斷和掌握統計學理論的應用價值。

新經濟形勢對商科專業教學提出了新的挑戰,大量的統計數據涉及社會經濟和生產生活的各個方面。統計教學不僅是對數據的收集、整理與分析,更重要的是要引導學生擴展知識面,運用統計方法認知和理解復雜問題。結合知識圖譜工具應用的教學,將有助于提高學生對專業化理論的個性化認知,在提升學生學習效率的同時,對全面推行智慧型教學模式和個性化培養具有積極意義。

猜你喜歡
商科知識圖譜圖譜
新商業模式下新商科通識課建設的思考和探索
繪一張成長圖譜
補腎強身片UPLC指紋圖譜
基于知識圖譜的產業集群創新績效可視化分析
基于知識圖譜的產業集群創新績效可視化分析
基于知識圖譜的智慧教育研究熱點與趨勢分析
從《ET&S》與《電化教育研究》對比分析中管窺教育技術發展
主動對接你思維的知識圖譜
商科院系建立咨詢委員會的思考
應用型本科院校商科教學改革與實踐
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合