?

基于電商數據的產品知識圖譜構建研究綜述

2020-12-16 07:56王雯
農村經濟與科技 2020年20期
關鍵詞:構建

[摘要]伴隨著互聯網商貿行業的發展,對電商的產品數據進行分析,通過引入產品知識圖譜,來解決當前電商產品信息與動態評論的關聯問題。運用產品數據知識圖譜的構建,能夠將產品的數據進行分析、挖掘、展示和存儲。借助產品知識圖譜來提出相應的關系,幫助電商購物平臺改善產品對比和搜索機制。因此,本文主要對基于電商數據的產品知識圖譜構建進行研究分析,旨在通過對電商產品數據知識圖譜關系進行詳細闡述,構建新型的產品知識圖譜,為電商用戶提供更好的產品服務,促進我國經濟的穩定發展。

[關鍵詞]電商數據;產品知識圖譜;構建

[中圖分類號] F590

[文獻標識碼]A

在我國當前的互聯網發展中,市場網購消費的發展愈發明顯。在當前的產品銷售中,線下與線上融合的銷售模式讓電商平臺積累了大量的數據資源。在當前的電商平臺中,如何運用產品數據進行挖掘分析,進而提升消費者在電商平臺的網購體驗和服務效率。在電商數據中,構建產品知識圖譜,將產品的信息數據進行挖掘分析,通過產品的信息動態與靜態的結合,從而完善產品知識圖譜,幫助電商平臺改善產品的關聯對比與搜索,促進電商平臺具備更好的服務。

1 電商數據服務平臺現狀

在當前的電商產品的數據利用中,其主要面臨著電商產品信息與銷售數據之間缺乏合理的運用。同樣電商數據服務平臺對產品的數據缺乏標準規范管理,由于當前的購物平臺的搜索引擎往往知識針對消費者關鍵詞的檢索,商家對產品的不同表述往往會影響消費者對產品的查找效率,嚴重時候導致消費者不能夠尋找到合適的產品。因此針對當前的電商數據平臺的構建,需要運用和采納個別知識圖譜將產品搜索和產品對比加入到電商產品服務平臺當中,從而改善消費者的購物體驗和效率。

2 電商數據的產品知識圖譜構建

在當前的電商數據的產品知識圖譜構建中,需要融合產品的靜態信息與動態評論。其中產品的靜態信息主要來源于行業信息、官網信息和百科信息等三種來源;動態評價主要來自于行業信息與電商信息等兩個信息源。

2.1 產品知識圖譜框架設計

在電商數據的產品知識圖譜構建中,其主要的框架設計采用由上到下的構建形式。電商數據產品的知識圖譜框架需要先搭建產品知識圖譜的模式層,在其約束下填充相應的數據層,最終形成結構化的產品知識圖譜。因此其實際電商數據的產品知識圖譜的邏輯框架、一般過程和構架流程如圖1所示:

2.2 產品知識圖譜模式層構建

2.2.1 術語獲取。在模式層構建中,由于模式層相當于產品知識圖譜的支架,那么對其構建是建立在現有的結構框架上進行。屬于獲取是電商數據的產品知識圖譜從專業權威的信息員,借助產品的說明和廣泛網站等信息源進行獲取,其重要的價值體現在于,方便電商服務平臺方便用戶理解。屬于獲取的信息通常借助表格或者表單的半結構化呈現,其產品知識圖譜模式層的屬于需要從網頁采集或者表單解析進行獲取。

2.2.2 概念獲取。在產品知識圖譜的模式層構建中,其概念獲取主要是產品的概念數量有限的特點中,需要采取高可信度的信息源進行結構或者半結構的信息獲取相關。同樣在產品知識圖譜的模式層概念獲取中,需要從專業性高的信息員進行獲取,同樣也能夠服用其的領域資源,進一步保證產品知識圖譜模式層的全面性和嚴謹性。

2.2.3 關系定義與抽取。在產品知識圖譜的模式層構建中,其產品功能與市場流通的信息主要體現在關系定于當中,由于存在四種關系:因此,其采取的抽取方法也不相同。其中同義關系主要指概念上相同或者相似的表達,那么其同義關系的抽取目標為發現字面表示的不同,對同一個概念或者實體進行抽取;其中上下關系主要是根據范圍確定概念與子概念,同樣由于上下這種層次關系的數量有限,從抽取的效率上,其主要依賴于百科網站的上下層次關系,利用百科網站進行分類體系,獲取上下關系的概念抽取;其中整體與局部的關系,主要存在于產品的組成當中,由于產品部件與整體之間存在的關系,需要利用百科網站進行和智能體部分概念抽取;其中屬性關系為產品與產品特征之間的抽取,往往需要從開放式銜接數據庫和半結構網頁中抽取。

2.3 產品知識圖譜數據層構建

在電商數據的產品知識圖譜數據層構建中,主要分為抽取和融合兩個階段。其中,數據層抽取階段主要以圖譜的模式層為基礎開展試題抽取和屬性收取,在融合階段主要是同義詞為基礎,在數據集上進行實體或者屬性抽取銜接,從而達到實體關系、屬性關系、同義詞等,進而完成產品知識圖譜的數據層構建。

2.3.1 實體抽取。在電商數據的產品知識圖譜數據層構建中,實體抽取,主要能夠抽取實體的名詞和屬性、圖片預計同義詞等。同樣實體抽取由于具備產品知識圖譜的更大領域,其實際的產品知識圖譜數據抽取信息源具備更高的領域性和權威性,同樣實體抽取包含大量的領域實體,可以直接用于產品知識圖譜的數據倉,因此數據層的實體抽取需要從產品的官網和結構化網站上進行抽取,以便提高產品領域的中文分詞的精準,同樣抽取的規則為依次抽取,實現產品命名實體的抽取。

2.3.2 屬性抽取。在電商數據的產品知識圖譜數據層構建中,如果實體所屬概念含有屬性,只需抽取屬性值,如果不存在概念,需要抽取屬性與屬性值。同樣豎向抽取的主要針對數據層的關心關系的收取,其包括屬性值范圍和信息,同樣在數據層的構建中,需要運用部分數據進行抽取,當前最為有效的屬性抽取方法為采用結構化和半結構化進行信息資源抽取,同樣借助電商產品相關的高質量網站,屬性抽取可以借助網站的半結構化信息,直接獲取實體信息與屬性值。

2.3.3 評價對象與評價詞抽取。在產品知識圖譜的數據層構建中,評價對象與評價詞抽取,主要是產品的性能和洗屬性以及流通方向下進行抽取。評價對象和評價詞抽取主要是在傳感否不發的關系上進行,同樣評價詞或評價對象的抽取主要是對句中的關系距離與語法進行抽取,與句子相比較,評價詞和評價對象抽取需要根據句子的路徑和磁性進行歸納抽取。

2.3.4 實體關系抽取。在電商數據的產品知識圖譜數據層構建中,實體關系抽取主要是上下為關系和整體部分關系的復用抽取。鑒于數據層的實體具備的屬性與評價往往來源不同的信息源,因此在抽取中需要重視上下位關系與整體部分關系的復用抽取,以構建的模式層為基礎,完成數據層中的關系抽取,通過具體,將數據層實體進行模式層對應,采用復用概念來實現整體部分關系抽取。同樣實體關系抽取需要重視同義關系與屬性關系抽取。由于模式層的同義詞關系具有一定的數量限制,因此起用部分概念間的同義詞外,需要從屬性抽取的過程獲取。

2.3.5 屬性銜接與實體銜接。在電商數據的產品知識圖譜數據層構建中,屬性抽取和實體抽取主要分為表述靈活的實體同義和規范的實體對象,同樣在已抽取的評價對象中,根據數據漣源。信息載體和語言習慣等相關因素,進行產品知識圖譜的屬性銜接與實體銜接。根據產品知識圖譜中個實體與屬性具備較高的領域性,那么借助實體銜接與屬性銜接能夠從統計的角度進行抽取。

2.4 存儲設計

在電商數據的產品知識圖譜構建中,為了保障其適用于各個大電商平臺和行業網站,需要存在市場占用率高且穩定的節點存儲圖譜數據,通過節點、關系與屬性的存儲結構,將產品的存儲知識圖譜進行完整的轉換,從而實現其存儲的關系一一對應。產品知識圖譜的實體往往是獨立存在的隊形,實體作為存儲關系的節點,通過關系、節點與屬性的銜接,實現電商產品的存儲。同樣將產品的屬性作為一個節點進行存儲,能夠實現產品的屬性抽取和附屬關系的表達。產品知識圖譜中的一個實體產品往往關聯著多個評價詞,新穎的評價屬性通過詞表進行存儲,實體詞與屬性詞作為實體銜接與屬性銜接的基礎,其數據龐大,通常需要在產品知識圖譜存儲與繪制的過程中進行多次調用,依照鍵值對應的方式存儲到文件當中。

3 電商數據的產品知識圖譜實例生產分析

在當前的電商數據的產品知識圖譜構建中,以筆記本電腦進行實例分析,通過按照框架設計、模式層構建、數據層構建等,可以生產筆記本電腦類產品知識圖譜進行相應的應用。筆記本電腦知識圖譜的生產需要電商網站和筆記本電腦行業測評網站上的筆記本靜態信息與動態評價,其中靜態信息采用樹結構進行抽取,同臺信息運用異步傳輸抽取。同樣對于抽取的初始數據進行集中清洗與預處理,將夜色的字符過濾,對其中的中文馮恩超和詞性進行標準。同樣筆記本電腦產品知識圖譜需要是涉及品牌、上市時間、代言人、外觀、硬件、軟件等等。對于筆記本電腦知識圖譜的數據層進行生成,借助相應的方法進行抽取與銜接,運用實體抽取,展開評價詞和評價對象抽取,運用句法分析的評價詞與評價隊形進行抽取,借助過濾和實體銜接來保證筆記本電腦知識圖譜數據的準確性,通過基于獲取的筆記本電腦領域的同義詞比對,完成筆記本電腦知識圖譜上的實體銜接與屬性銜接,生產筆記本電腦知識圖譜的數據層,最后借助節點存儲筆記本電腦的知識圖譜。同樣由于筆記本電腦更新快和評價變化較大等特點,需要生產商通過研發與完善產品的基礎,實現分析不同信號的筆記本電腦知識圖譜,不僅加強產品之間的哦關聯,同樣也對產品升級的屬性進行評價反饋,從而不再局限于客觀屬性與屬性值的對比,讓產品進一步聯系到用戶評價,從而將筆記本電腦客觀屬性和用戶評價進行管理,通過產品知識圖譜來進一步分析筆記本電腦屬性與屬性之間的管理,從而發現屬性差異對于用戶評價造成的影響,能夠實現筆記本電腦的優化設計和提升購買者的購買效率與滿意度。

4 結語

由此可見,在電商數據的產品知識圖譜構建中,注重框架設計、數據層和模式層構建,從而實現運用產品數據進行挖掘分析,進而提升消費者在電商平臺的網購體驗和服務效率。在電商數據構建產品知識圖譜,將產品的信息數據進行挖掘分析,通過產品的信息動態與靜態的結合,從而完善產品知識圖譜,幫助電商平臺改善產品的關聯對比與搜索,促進電商平臺具備更好的服務。

[參考文獻]

[1]李原昕,周松濤.線上線下結合的電商超市新零售運營模式研究[J].電子商務,2020 (07).

[2]劉嬡嬡.淺議大數據下跨境電商平臺選品策略[Jl.商訊,2020 (20).

[3]徐濤.基于大數據的中小型電商企業精準營銷研究[J].中國商論,2020 (04).

[4]閔亨慧子大數據背景下電商企業網絡營銷存在的問題及對策[J].現代經濟信息,2019 (23).

[5]丁晟春,侯琳琳,王穎.基于電商數據的產品知識圖譜構建研究[J].數據分析與知識發現,2019 (03).

[作者簡介]王雯(1987-),女,湖北武漢市人,碩士,講師,研究方向:電子商務多媒體。

猜你喜歡
構建
以學生為中心視角下的新型師生關系構建
基于工作任務的高職院校英語課程評價體系構建研究
淺析企業文化管理的重要性與構建
創建《數控自動編程》優質核心課程
淺析汽車維修專業一體化專業課學生評價體系的構建
動車組檢修基地與動車檢修分析
環境生態類專業大學生創新創業能力培養體系的構建與實踐
構建游戲課堂加強體育快樂教學的探究
共情教學模式在科學課堂的構建與實施研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合