?

基于標準和專利數據的企業技術研發方向識別研究*

2024-03-02 03:08馮家琪王海燕吳菲菲黃魯成
情報雜志 2024年3期
關鍵詞:空白點遠程專利

馮家琪 王海燕 吳菲菲 黃魯成

(1.中國科學技術信息研究所 北京 100038 ;2.北京工業大學經濟與管理學院 北京 100124)

0 引 言

數字化和信息化浪潮推動了社會經濟的快速發展,給企業產品和服務的更迭帶來更大的挑戰。2011—2022年的《全球創新指數報告》顯示,中國企業技術研發支出占GDP比重的排名由第35位上升至第13位,單位國內生產總值的本國人專利申請數量也上升至第1位,這表明技術研發對于技術創新有重要的促進作用。技術創新對國家經濟增長、產業升級與企業發展所產生的影響越來遠大,企業必須持續不斷進行技術創新,才能更好實現自身發展,應對不斷變化的市場環境。信息技術、數據科學、人工智能的快速發展,為企業技術研發搭建了新平臺,也使多源異構數據應用于技術研發問題分析成為可能,客觀上也提出了如何更好地利用多源數據進行分析的新要求。企業如何依據產業發展特征,識別出具有前沿性和創新性的研發方向,實現高速度高質量發展,是擺在決策者面前亟待解決的問題。技術標準化可以提高技術創新的效率,加速科技成果轉化速度和質量。企業作為創新主體,需要不斷提升競爭力,而主導和參與標準的制定是企業增強影響力的重要途徑,將技術研發方向與技術標準化有機關聯,可以使企業研發決策更具針對性。

隨著企業技術的不斷成熟,市場供給和需求也逐漸增加[1],產品逐漸從單一低質向多樣優質發展,企業間的市場競爭日益加劇,建立在標準必要專利基礎上的企業技術標準出現并不斷更新,企業研發處于從技術到應用的演化階段,參與到標準的制定中,把握技術發展方向話語權,成為企業研發的主要目標[2]。標準是對已有技術的總結和提煉[3],建立在已經應用廣泛的技術上[4],通過引導市場發展來指引研發活動的方向[5]。標準作為引導和規范企業發展的依據[6],不僅是重要的行動指南,也是關鍵性的創新成果,特別是在技術快速發展的時代,企業競爭已經表現為標準的競爭,標準創新決定著企業未來發展方向和態勢[7]。同時標準數據可以大大降低統計誤差性和時間滯后性,因此適用于企業研發方向的識別研究。目前針對標準文本信息挖掘的研究成果較為豐富,明確了企業的技術機會和方向,但是忽略了標準的數量、迭代周期階段以及技術范圍等重要非文本信息。標準具有嚴格完整的制定體系,每一項標準都需要經過委員會共識和ISO成員國嚴格審查。標準存在現行、即將實施、被替代和已作廢等不同狀態,每一種狀態的標準代表不同的技術變革,綜上對標準非文本信息的挖掘對于研發方向識別也很重要[8]。本文在現有研究基礎上,利用標準和專利之間的潛在關聯關系,集成標準文本信息及非文本信息識別企業研發方向,提高了研發方向識別的準確性和可靠性。

1 研究綜述

研發方向識別是研發各方為解決技術創新問題而確定的共同努力的方向,與企業自身利益和發展前景密切相關。高質量的技術研發工作對于提升企業競爭力、 維護國家產業技術安全具有重要意義[9]。目前關于企業技術研發方向識別的研究主要有將文獻識別出的前沿問題作為企業技術研發方向[10],通過預測和識別新興技術判斷企業技術研發方向[11],以專利技術空白點表征的技術機會作為企業技術研發方向[12],從技術融合視角分析未來技術發展趨勢預測企業技術研發方向[13]?;谖墨I數據的研發方向識別重點關注現階段基礎科學研究內容,有助于企業現有技術方向的布局,但不能明確企業未來發展方向;目前新興技術識別的研究多數采用的是單一類型的論文數據或者專利數據,單一數據源往往會影響新興技術識別的準確性和科學性,進而影響研發方向識別結果;基于專利數據的研發方向識別明確了企業技術發展水平和技術改善方向,但是專利數據存在一定的滯后性,忽略了具體產品市場發展的需求特點,對產品質量水平的提升會產生一定影響;從技術融合視角分析技術發展趨勢的研究主要是從引文網絡層面、專利指標層面或利用專利共性信息進行技術融合分析,覆蓋的技術領域比較受限,研究方法較為傳統。

技術標準是一種重要的知識產權和競爭戰略,目前已有很多學者對標準的重要性進行了分析[14]。關于技術標準視角下研發方向識別的相關研究大致可以分為兩類:一類是以標準必要專利為契機分析技術標準對于研發方向識別的重要性,將專利納入技術標準對于技術發展和轉化有積極的促進作用[15],同時有研究發現技術標準合作已經成為新一輪國際合作的主要類型之一,反映出技術標準在國際交往間的重要作用[16]。另一類是以技術標準為研究對象定性分析企業未來的研發走向,解決標準空白的預判問題可以更好的將技術標準融入企業研發戰略的制定過程中[17],隨著技術標準對技術創新的推動力越來越大,企業間競爭的核心逐漸轉向技術標準的競爭[2]。技術創新對于企業形成市場競爭新優勢,增強發展的長期動力具有戰略性意義。技術標準化可以提高技術創新的效率,加速科技成果的擴散,將技術創新與技術標準化有效結合,是對企業發展戰略的優化和擴展[18]。關于技術標準化的研究主要集中在以下幾個方面:a.研究技術標準化進程[19],涉及與標準制定相關的體系制度和法律問題;b.研究技術標準化在創新技術轉化中的作用[4],重點關注技術標準化對企業生產經營過程的影響;c.研究技術標準化對創新績效的影響[7],認為技術標準化可以正向影響企業創新績效;d.以技術標準為導向識別企業研發方向[2],主要是利用標準文本信息進行研究。

專利數據可以明確企業微觀技術改善方向,但是專利主要代表研發初期的研究成果,哪些技術可以用于特定領域形成新的產品和服務,單獨從專利本身無法得到解讀,專利成果轉化問題也得不到解決。標準數據可以在很大程度上降低誤差性和滯后性的影響,有利于技術標準化這一關鍵研發目標的實現,對于標準空白點的進一步分析可以獲取標準版本的更新內容,明確企業未來的發展方向。專利與技術標準間存在長期穩定的動態均衡關系,專利是技術標準的技術基礎,專利被納入標準會被更為廣泛的使用[18]?;跇藴屎蛯@麛祿钠髽I技術研發方向識別,可以對企業當前技術發展水平和未來研發方向進行更好的研判,為企業獲取市場先發優勢和競爭優勢提供支撐?,F有研究更多關注技術標準對于技術創新和研發的影響,為企業發展和進行技術創新提供了很好的指導作用。但是標準本身就是關鍵性的創新成果,標準文本信息及非文本信息都包含重要價值信息,需要深入挖掘才能全面研究技術標準化。為此,本文提出一種利用標準和專利數據對研發方向進行篩選,集成標準文本信息及非文本信息解決企業技術研發方向識別問題的新方法。

2 研究方法和框架

依靠標準和專利數據的研發方向識別研究,既要發揮企業的技術優勢,將技術轉化成產品的能力考慮在內,實現技術標準化,也要面向多應用場景分析,為企業未來發展布局。首先以某產業標準和專利數據為數據來源,利用文本挖掘算法與GTM模型挖掘文本信息,繪制標準和專利地圖,通過逆映射完成標準空白點的解讀,實現技術空白點的初步識別;其次運用鏈路預測模型常用相似性指標對空白點進一步篩選,得到潛在技術機會;最后利用標準非文本信息構建關鍵詞創新性評價模型分析每個空白點的創新性和影響程度,從而確定研發方向。通過鏈路預測模型相似性指標和關鍵詞創新性評價模型改善了以往簡單運用余弦相似度分析相似性和主觀判斷空白點價值的方式,增強了空白點判別的可靠性,從而可以有效識別研發方向。研究框架如圖1所示。

圖1 基于標準和專利數據的企業技術研發方向識別研究框架圖

2.1 基于標準文本信息的技術空白點分析

GTM模型可以將識別出的空白點反向映射到實際數據中,從而實現對空白點的解釋[20]。在識別效果和實現效率上都具有優勢,克服了主成分分析法(PCA)和自組織神經網絡方法(SOM)主觀解釋地圖的限制。具體分析步驟如下:

第1步,數據收集與預處理。構建檢索表達式在ISO國際標準數據庫和Derwent數據庫中檢索相關標準和專利信息,將每條標準和專利的標題與摘要合并為一個字段,刪除空值,將經過預處理的標準和專利文本作為研究數據集。

第2步,標準和專利文本詞篇矩陣構建。標準和專利文本關鍵詞提取采用TF-IDF方法進行預處理,使用LDA主題模型進行技術主題聚類,兩種方法相結合可以對文本內容進行更深入的挖掘,進一步提高關鍵詞對標準和專利文檔的概括精確度。在篩選出最具解釋性和技術性的關鍵詞之后,通過VSM模型[21]構建關鍵詞向量,得到關鍵詞-標準和關鍵詞-專利兩個詞篇矩陣,并進一步將文本關鍵詞轉化成以二進制表示的矢量矩陣。

第3步,標準和專利地圖繪制。標準和專利地圖的繪制采用GTM模型,以往研究表明后驗眾數投影的空白點識別更加清晰。因此,對于標準和專利的可視化,選擇后驗眾數投影來實現。

第4步,技術空白點識別。通過逆映射找到空白點及對應關鍵詞的概率表示,并轉換為二進制值形式。由于技術標準是針對具有普遍性和重復性的關鍵技術問題制定的最佳解決方案,是成熟技術、兼容技術、通用技術,是技術成果的規范化和標準化[22],并且在標準內容迭代中,前一個標準文本的空白點可能成為下一個新標準內容的補充版本,因此對標準空白點所表征技術空白點的挖掘成為本文的研究重點。

2.2 基于標準空白點和專利數據的潛在技術機會識別

鏈路預測是通過已知節點及網絡結構信息預測未連接節點關聯的可能性[23]。Byungun Yoon[24]等人提出可以通過關鍵詞向量建立技術空白點和現有技術之間的鏈接關系,并利用專利數據進行了驗證。鑒于之前相關研究在進行標準與專利映射時,僅考慮了詞頻,未考慮二者之間潛在關聯,本文基于 Byungun Yoon 的研究成果,將鏈路預測用在由標準和專利組成的二模網絡中。為了更好量化標準與專利之間主題的相似度,選取鏈路預測常用相似性指標進行測度,可以更精確地進行標準與專利的匹配。具體分析步驟如下:

第1步,關聯網絡建立。將標準空白點及所有專利點都還原成關鍵詞向量表示的形式,現有專利作為技術基礎且與技術機會緊密關聯,因此以現有專利為橋梁建立標準空白點與專利點之間的對應關系。當標準空白點與現有專利點存在公共關鍵詞時,即認為標準空白點與現有專利點之間存在鏈接,為鄰居關系。

第2步,相似性指標構建。選取鏈路預測常用的兩個相似性指標共同鄰居(CN)[25]和Jaccard系數[26]。根據本文研究問題添加余弦相似度(CS)、公共關鍵詞權重(PK)兩個指標。使用余弦相似度[27]來測度標準和專利主題的相似度,計算公式如(1)所示。標準和專利的鏈接關系是通過關鍵詞向量構建的,因此關鍵詞對于研究結果具有重要影響作用,本文選用TF-IDF方法為關鍵詞賦權。

(1)

其中,PW,SW分別表示專利與標準文本的詞頻向量,n表示文本的數量。

第3步,潛在技術機會識別。使用熵權法對各指標賦權,通過加權相似度算法計算匹配得分,即可得到標準空白點與專利點之間存在關聯的可能性,將最有可能鏈接的標準空白點與專利點的鏈接視為潛在技術機會。

2.3 基于標準非文本信息的關鍵詞創新性評價模型構建

由于標準的數量、發展階段、價格等非文本數據也包含重要信息,同時研發需要以創新為中心,也為創新提供支持[28],因此本文構建了基于標準綜合信息的技術關鍵詞創新性評價模型,通過潛在技術機會包含的技術關鍵詞創新值之和表征空白點的創新性,將具有高創新性的空白點所代表的潛在技術機會確定為研發方向。本文基于吳菲菲等的研究成果[14],從創新影響力范圍和創造成果新穎性程度兩個角度構建關鍵詞創新性評價模型,各指標含義和測量方式見表1。

表1 關鍵詞創新性評價指標

2.4 基于標準文本信息及非文本信息的研發方向識別

為了更加客觀準確地評價不同關鍵詞的影響作用,本文使用變異系數法對各關鍵詞的創新性進行綜合評價。變異系數法可以綜合分析各項指標所包含的所有信息,消除測量尺度和量綱的影響[29]。在得到每個技術關鍵詞的創新性綜合評價值之后,通過計算潛在技術機會創新性綜合評價值之和得到各標準空白點的創新性,將具有高創新性的標準空白點表征的技術機會確定為企業的技術研發方向。

3 實證研究

3.1 研究對象選取

遠程醫療使得醫療資源得以最大限度地共享和利用,在很大程度上改善了患病人群的生活質量和健康程度。新冠疫情給醫療秩序的穩定和患者就醫保障帶來嚴峻考驗,遠程醫療的開展,有利于提高醫療資源可及性,帶來更高效的醫療服務[30]。遠程醫療技術的發展相對成熟,并且已經形成了很多相應的技術標準。本文以遠程醫療產業的標準和專利數據為樣本進行研究。ISO是世界上最大的非政府性標準化專門機構,所發布的國際標準更具有代表性和研究價值,以ICS3=35.240.80為檢索條件在ISO國際標準數據庫中檢索標準文本;Derwent囊括了不同國家專利局的專利數據,包含的技術范圍更加廣泛,潛在技術機會識別使用的專利信息在Derwent上檢索。對檢索到的數據進行初步清洗,最終得到標準文本273篇,專利文本911篇。

3.2 遠程醫療產業技術空白點分析

因為標準和專利的標題和摘要文本中都包含大量的技術關鍵詞信息,而且不存在明顯的語義關系,具有較高的研究價值,因此本文選用關鍵詞來表征文本所包含的信息。首先,對標準和專利文本進行預處理;其次,利用TF-IDF初步提取標準和專利文本的關鍵詞,從每篇文本中檢索出15個關鍵詞。最后,將所有關鍵詞作為輸入端,基于LDA模型進行主題聚類,得到30個基數詞作為最終關鍵詞。清洗后的遠程醫療產業標準和專利文本的技術主題分布情況如表2所示。

表2 遠程醫療產業主題-關鍵詞分布

根據關鍵詞分布情況,將標準和專利文本轉換成以二進制形式表示的關鍵詞向量,最終的關鍵詞向量如表3所示,矩陣中 1表示標準和專利文本中包含該關鍵詞,0表示不包含。

表3 遠程醫療產業標準和專利關鍵詞向量

將標準和專利的關鍵詞向量作為輸入端,由于標準和專利的原始數據量存在較大差異,因此二者的GTM模型應設置不同的參數。標準數據設置81個徑向高斯基函數,每個基函數的數據中心位于一個8*8的正則網格點上;專利數據設置 100個徑向高斯基函數,每個基函數的數據中心位于一個10*10的正則網格點上。通過上述參數設置可制作標準與專利地圖,如圖2所示。

圖2 標準地圖(左)和專利地圖(右)

圖2中“★”代表標準和專利空白區域,由圖可知,標準地圖中共存在20個空白點,通過GTM逆向映射將20個標準空白點逆向映射到數據空間,還原成關鍵詞向量,完成對標準空白點的解讀。

3.3 遠程醫療產業研發方向識別

GTM模型將標準和專利關鍵詞映射于各自地圖上,逆映射過程如圖3所示。

圖3 標準(專利)空白點逆向映射過程

潛在技術機會的識別通過建立標準空白點與專利的映射來實現, 如圖4所示。各標準空白點(與各專利點)的關聯關系預測結果如表4所示。

表4 各標準空白點預測結果

圖4 標準與地圖映射圖

通過閾值設定選取匹配值大于20的標準空白點所代表的技術機會作為潛在技術機會,即標準空白點3、標準空白點4、標準空白點2、標準空白點1、標準空白點6、標準空白點7、標準空白點15、標準空白點16、標準空白點12。

通過構建的關鍵詞創新性評價指標體系,綜合創新活力、創新質量和創新規模確定30個關鍵詞的創新性評價值,通過各個標準空白點包含的關鍵詞創新值之和表征其創新性,最終9個標準空白點的綜合評價結果如表5所示。

表5 標準空白點的綜合評價結果

從表5中選取綜合評價值遠高于其他點的標準空白點所表示的技術主題作為遠程醫療產業內企業的技術研發方向,通過對空白點解讀和對領域知識的研究,最終確定的研發方向為:K3基于計算機網絡平臺的電子健康記錄和在線咨詢技術;K12基于5G和健康關懷技術的遠程醫療護理技術。

普華永道全球醫療研究院發布的醫療行業熱門趨勢報告中指出,診斷、治療、監測設備在醫院住院管理系統中自動記錄患者就醫數據可以大大提升醫院運營管理效率,數字化和互聯網醫療被列為國家戰略,應該將基于健康關懷技術的虛擬護理納入整體策略,向患者、醫療機構、醫生等提供有價值的信息;健康界研究院在2022年關于中國遠程醫療發展的報告中指出,遠程會診、遠程影像、遠程監測等成為5G技術與遠程醫療融合發展的典型應用場景,應加強5G技術、物聯網等相關技術的成熟和融合應用;CB INSIGHTS在《2022年遠程醫療狀況報告》中強調應該加強對遠程監測、遠程醫療護理、遠程輔導和咨詢等的建設和管理。這些研究報告的內容有力的支撐了本文遠程醫療產業內企業技術研發方向識別的結果,也很好的驗證了研究方法的可行性和研究結果的可靠性。

4 結論與建議

本文從技術標準化視角出發,以標準和專利數據作為研究數據源,充分挖掘專利的文本信息、標準的文本和非文本信息,運用GTM模型繪制標準地圖和專利地圖識別技術空白點,通過鏈路預測模型識別潛在技術機會,構建關鍵詞創新性評價模型對潛在技術機會進行綜合評價,將綜合評價值較高的技術機會確定為研發方向,以遠程醫療產業為例進行實證研究,并與國際知名行業報告研究內容進行匹配分析,驗證了本文所提出方法的可行性,得到的建設性結論與建議如下:

a.綜合運用標準和專利數據可以更好的解決技術集成轉化的關鍵問題。專利文本中包含了大量技術信息,有助于對產業整體技術布局的了解;標準信息中可以提取出關鍵性的創新成果,有助于科技成果轉化和技術標準化。充分挖掘標準和專利信息,可以更好的完成技術集成轉化,使得技術多樣性逐漸標準化,幫助企業提前布局研發活動的方向,以便在激烈的市場競爭中獲得有利地位。

b.集成標準文本信息及非文本信息可以進一步提升研發方向識別的效益,同時可以為產業整體創新發展和相關技術布局提供參考。技術標準是國家技術先進性競爭和標準話語權的有效籌碼,應該積極關注和影響數字經濟相關的技術標準,對技術標準所包含的重要信息進行充分的研究和挖掘。針對標準文本信息的挖掘明確了企業的技術機會和方向,充分發揮了企業的技術優勢,將技術轉化成產品的能力考慮在內;標準本身就是重要的技術指南,標準非文本信息也包含重要價值信息,可以用于創新性的測度,實現面向多應用場景的分析,可以很好的為企業未來發展布局。需要綜合與集成挖掘才能全面研究技術標準化。

c.新冠疫情的持續沖擊和日趨嚴重的人口老齡化問題使得遠程醫療技術需不斷發展和完善。通過預測遠程醫療產業內企業的技術研發方向,將5G技術、物聯網技術等與遠程醫療融合應用,進一步推動遠程醫療護理、遠程會診、遠程影像等應用方向的成熟,可以大幅度降低患者的就醫成本,改善患者的生活質量和健康程度,也可以最大限度地共享和利用醫療資源,大大提升醫院運營管理效率。

d.我國經濟發展步入新時代,經濟增長正在經歷從高速增長向高質量發展的轉型,企業的技術需求和研發策略都與產業發展的階段存在關聯。未來可結合產業生命周期不同階段的不同特征針對性選擇數據源和研究方法,研究結果會更加具體和適用。本研究也為產業內企業尋找合適的研發合作伙伴進行合作研發奠定了基礎。

猜你喜歡
空白點遠程專利
讓人膽寒的“遠程殺手”:彈道導彈
專利
遠程工作狂綜合征
發明與專利
遠程詐騙
挖掘文本“空白點”培養學生“想象力”
緊抓三大支點,提升文本解讀的實效性
緊扣空白點,深入理解文本
作文起步
專利
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合