?

基于用戶興趣改進模型的智慧圖書館個性化檢索服務研究

2024-03-12 04:25李菲菲
圖書館研究與工作 2024年2期
關鍵詞:檢索系統精確度檢索

李菲菲

摘 要:為了解決目前用戶在圖書館檢索系統中無法找到自己感興趣的內容的困境,文章以抓取的各類教育網站上的課程信息作為實驗數據,將用戶興趣與基于倒排索引的Lucene算法及LDA算法模型相結合,引入UCI-Lucene算法:使用Lucene算法得出基于倒排索引的搜索結果,使用LDA主題模型算法對Lucene算法得出的搜索結果計算得到課程的興趣分布,與此同時使用LDA主題模型算法通過對用戶日志進行計算得出用戶的興趣分布,接下來將課程的興趣分布與用戶的興趣分布做相似度計算,得到課程—用戶的興趣相似度,最后通過加權Lucene算法得出的搜索結果得分和課程—用戶的興趣相似度得分得到每個課程的綜合得分,得到最后的搜索排序結果?;谏鲜龈倪M算法,文章設計了一款智慧圖書館個性化檢索系統。實驗表明,基于用戶興趣改進模型的智慧圖書館個性化檢索系統不僅能夠更好滿足用戶的搜索需求和用戶興趣,還能夠顯著提升搜索結果的準確性和召回率。

關鍵詞:Lucene;LDA;個性化檢索系統;UCI-Lucene;用戶興趣改進模型;智慧圖書館

中圖分類號:G250.7;G252.62文獻標識碼:A

Research on Personalized Retrieval Services in Smart Libraries Based on User Interest-Enhanced Models

Abstract To address the challenge of users not being able to find content of interest in library retrieval systems, this article utilizes course information collected from various educational websites as experimental data. It combines user interests with the Lucene algorithm based on inverted indexing and introduces the UCI-Lucene algorithm. The UCI-Lucene algorithm derives search results based on the Lucene algorithm's inverted indexing. It then employs the LDA topic modeling algorithm to calculate the interest distribution of courses from the search results obtained by the Lucene algorithm. Simultaneously, it utilizes the LDA topic modeling algorithm to calculate the interest distribution of users based on their activity logs. Next, it computes the similarity between the interest distributions of courses and users, resulting in course-user interest similarity scores. Finally, it combines the scores from the weighted Lucene algorithm and the course-user interest similarity scores to obtain comprehensive scores for each course, yielding the final search ranking results. Based on the improved algorithm described above, the article designs a personalized retrieval system for smart libraries. Experimental results demonstrate that the user interest-enhanced model in the smart library personalized retrieval system not only better satisfies users' search needs and interests but also significantly improves the accuracy and recall of search results.

Key words Lucene; LDA; retrieval system; UCI-Lucene; User Interest-Enhanced Models; smart library

1 引言

隨著信息技術的快速發展,各類檢索系統[1]應運而生并得到了迅速發展,人們的需求日益多樣化,對于檢索系統的期望也越來越高。圖書館作為人類精神文明的重要載體,核心任務就是致力于為用戶提供更加人性化和智慧化的服務[2],以滿足用戶工作、學習和研究需求,不斷探索和提高智慧化的可能性。但是,當前的圖書館檢索系統存在一些不足,例如搜索結果與用戶的期望不符,不能夠滿足用戶的需求和興趣等,這些問題導致了用戶必須花費大量的時間來篩選和過濾沒有價值的內容,因此需要設計一種挖掘用戶潛在興趣的檢索算法[3]來提高讀者的檢索效率。

早期的檢索系統旨在通過分析和優化已有信息,以提高搜索結果的準確性和可靠性。Metacrawler檢索系統[4]可以有效地收集和處理用戶的信息,用戶可以輕松地在瀏覽器中查詢所需的信息,提升了檢索系統的效率。Google檢索系統使用PageRank算法[5]評估網站的權重,從而確保用戶可以獲得更多有價值的信息,但是這種方式的缺陷是無法實現滿足用戶興趣的個性化檢索。隨著時間的推移,網絡上信息數量急劇增加,搜索結果的準確性和可靠性也在不斷下降,越來越多的研究人員開始將研究重心轉向用戶興趣。研究人員通過深入分析用戶行為,挖掘用戶興趣,建立用戶興趣模型,以期望滿足個性化搜索和提高搜索結果的準確性,在個性化搜索領域的用戶興趣模型研究取得了長足的進步和豐碩的成果。Personal WebWatcher為用戶提供了一種個性化的服務[6],它能夠根據用戶的不同需求進行實時調整,通過用戶的點擊行為來獲取用戶的最新需求。雅虎(中國)公司推出的MyYahoo[7]利用用戶的個性化偏好和興趣,構建出一個完整的用戶模型,從而幫助用戶更加有效地搜索出所需信息,但是由于缺乏實時性和可靠性,使得其無法有效地滿足用戶的需求。南京大學開發的個性化檢索系統DOLTRI-Agent[8]運用挖掘用戶特征、行為、興趣等個人信息進行計算分析構建出用戶的興趣模型,以便更好地滿足用戶的需求,并且能夠及時發現其中存在的問題,從而提升用戶的搜索體驗。

經過深入分析發現,目前個性化檢索系統存在諸多挑戰,其中最突出的幾個問題如下:(1)當前的個性化檢索系統未能充分考慮用戶特征、行為信息、興趣等,也無法深入挖掘用戶潛在的興趣,從而導致搜索結果無法真正滿足用戶的需要。(2)當前的個性化檢索系統會出現“興趣漂移”的問題,即用戶的需求會隨著時間的推移而發生變化,而現有的個性化檢索系統無法及時發現和滿足這些新的興趣和需求。針對上述問題,本文以隱含狄利克雷分布主題模型算法(Latent Dirichlet Allocations, LDA)和Lucene算法為基礎,引入用戶興趣并加以改進,設計了一種智慧圖書館個性化檢索算法模型:UCI-Lucene。該模型不但更能挖掘用戶潛在的興趣和更加滿足用戶現有興趣,而且能大大提升準確率和召回率。

2 研究方法

2.1 LDA主題模型

LDA主題模型[9]已經成為一種普遍采用的自動化技術,可以有效地深入探索文本的語義特征[10],幫助人們發現文檔中隱藏的主題,從而可以根據主題分布來對文檔進行分類或計算出主題之間的相關性。該主題模型基于EM算法,能夠將復雜的語義概念轉化為一種簡單的數學形式,這樣就能夠讓人們更容易地理解和接受這些信息。由于LDA主題模型沒有充分考慮詞語之間的順序關系,大大降低了模型的復雜度,從而使得該主題模型成為更加高效的方法。2.2 Lucene基本原理

Lucene通過倒排索引技術,將文件、圖表以及其他數據結合在一起構建出一個有效的索引系統[11]。Lucene算法原理:(1)創建文檔對象,將每個文件的屬性存儲在創建的文檔對象中,并在每個屬性中添加一個域以便更好地管理文件,將文檔對象中的每個屬性編號,以便更加有效地管理文件。(2)分析文檔,使用文檔對象的兩個域(文件名和內容)來進行更加細致的研究。首先需要根據文件中的字符串,在每個空白處劃分出一個詞語,然后將其中的每個單詞都轉換成小寫,可以將那些無意義的單詞稱為停用詞,并進行刪除。通過這種方式,可以創建一個關鍵詞清單,這個關鍵詞清單由一系列獨立的關鍵詞組成,它們分別代表著一個獨立的域,而這些域又可以由一系列的單詞組成,從而形成一個完整的系統。(3)創建索引。為了提升查詢的效率,可以構建一個索引庫,將相關的關鍵詞列表與文檔對象結合起來,以實現查詢的高效性,同時也能夠準確地記錄下這些關鍵詞與文檔對象之間的關聯關系。

2.3 分詞器

分詞器的主要功能是篩選信息,鑒于Lucene自帶的分詞器Analyzer[12]在中文分詞中表現不佳,本文選擇了分詞效果更好的IKAnalyzer[13]來實現更加準確的分詞。IKAnalyzer分詞器是一款功能強大的開源中文分詞工具。該分詞器支持Java平臺,并且具備良好的擴展性。Lucene技術為IKAnalyzer提供了強大的支持。IKAnalyzer支持中文、英文、日文等多種語言,其中中文版本符合用戶的需求,性能更加優異;除了擁有多種分詞技術,如精細化分詞和智能分詞,IKAnalyzer還擁有驚人的分詞速度,每秒鐘可以處理超過60萬個單詞;IKAnalyzer還可以有效地減少內存消耗,顯著改善自定義詞典的效率和準確度;通過對Lucene的改進,其分詞器的功能和性能顯著增強,使得搜索的效果和效率有了顯著的改善。

3 基于LDA主題模型的用戶興趣改進算法實現過程

隨著互聯網的快速發展,用戶數量和網頁數量都在迅速增長,導致了傳統的基于關鍵詞的圖書館檢索系統難以滿足當前用戶的需求,檢索結果容易出現“漂移”現象[14]。用戶在使用關鍵詞檢索系統時,系統會使用分詞技術把一個特定的詞語拆解為更多的字符,并使用倒排索引來獲取索引庫中的結果。由于用戶無法準確地描述自己的真正需求,因此系統會給出錯誤的結論和無效的解決方案。因此,在圖書館檢索系統中,引入用戶興趣是十分重要且必要的。

針對目前圖書館檢索系統檢索結果無法滿足用戶興趣和需求的問題,本文以抓取多個教育網站的課程信息作為實驗數據進行研究,設計出一種基于LDA主題模型的用戶興趣改進算法:UCI-Lucene排序算法。經過實驗表明,采用基于LDA主題模型的用戶興趣改進算法得到的檢索結果不但可以挖掘用戶深層次潛在興趣,構建更加精確的用戶興趣模型;搜索結果更加滿足用戶的興趣和需求,而且可以顯著提升搜索結果的準確性和召回率。

3.1 用戶興趣建模

通過建立一個有效的用戶興趣模型[15],可以將用戶的需求和偏好有機地組織起來,從而更好地反映出用戶的真實需求。通過使用關鍵詞來提取用戶的興趣信息時,由于存在一些相似的概念或者一個詞有多種含義,因此僅僅基于這些關鍵詞來構建用戶興趣模型是不夠可靠的。經過研究發現,在用戶的點擊行為、瀏覽時長和瀏覽內容方面,有一套完整的用戶興趣構建流程,它由三個方面組成。

(1)興趣行為表示

本文用三元組來描述用戶最近一段時間內的興趣行為,以便更好地了解用戶的行為特征。其中content代表用戶瀏覽的內容,本文主要用文章的摘要或者簡介來表示;ltime代表用戶最近一次瀏覽該文章的時間;hits指的是在一段時間內用戶對該文章的點擊次數。

(2)瀏覽記錄權重計算

在一段時間內,用戶可能會瀏覽多條記錄,本文將這些記錄以列表形式表示出來:,其中dk表示用戶瀏覽的第k條記錄,其興趣行為可以用公式(1)中的三元組來表示。根據分析,不同的記錄會影響用戶的興趣,點擊次數越多,代表用戶對此內容興趣更大,也就意味著這些記錄的權重越大。最后一次訪問的時間也代表了此內容更符合目前的興趣,因此權重也會更大。使用w(dk)來衡量用戶行為對用戶興趣的影響,可以通過公式(1)來計算瀏覽記錄的權重。

在本公式中,tn代表當前的時間, ltimek代表dk最近一次訪問的時間,表示正態分布,hitsk表示記錄dk的訪問次數,為阻尼系數,其具體數值可以通過實驗來確定。

(3)用戶興趣抽取

本文通過使用LDA主題模型算法從多條記錄中抽取出用戶的興趣。該方法的步驟是:采用LDA主題模型算法計算出用戶日志中每條記錄的興趣分布,然后將這些興趣分布(分數)進行加權求和,根據公式(2)來確定用戶的最終興趣。

I(user)代表用戶的初始偏好,而I(dk)則是通過使用LDA主題模型算法計算出的每條用戶興趣分布值。

3.2 UCI-Lucene排序算法

LuceneScore是使用基于倒排索引的Lucene算法得出的課程分數,UC-InterestScore是通過使用LDA主題模型算法分別對課程和用戶日志進行計算,得出的課程興趣分布和用戶興趣分布做余弦相似度計算得到的分數結果(課程—用戶興趣分布),這反映了課程與用戶興趣之間的相似程度,而UCI-LuceneScore則是通過加權Lucene排序算法和UC-InterestScore(課程—用戶興趣分布)得到的最終的綜合分數,是一個阻尼系數,具體取值取決于實驗過程。通常來說,我們無法精準地預測每個維度所代表的主題屬性,但能夠推斷出相似的主題屬性,即使在不同的文檔中,只要有相同的維度,就會有相似的主題屬性,從而使得最終的排序結果更加準確。UCI-Lucene搜索排序算法流程圖如圖1所示。

UCI-Lucene搜索排序算法過程如下:使用Lucene算法得到基于倒排索引的搜索結果,記為LuceneScore;然后使用LDA主題模型算法計算出課程的興趣分布,同時使用LDA主題模型算法對用戶日志進行分析計算得出用戶的興趣分布;接下來將課程興趣分布和用戶興趣分布做余弦相似度計算,得到課程—用戶的興趣相似度分數,記為UC-InterestScore;最后通過加權LuceneScore和UC-InterestScore得到每個課程的綜合分數UCI-LuceneScore,即最后的搜索排序結果,計算方法如公式(3)所示。

4 實驗與分析

4.1 實驗數據

通過采用分布式爬蟲技術[16]和經過精心篩選,實驗組最終確定了50 000條數據作為實驗數據,這些數據具有完整、明確的主題和均勻的分布特征,可以滿足本實驗要求,表1列出了其中的部分數據結果。

經過精心地對文檔集標題、簡介以及其他相關信息的研究,我們最終選擇了38 796條文章數據并對其主題打標簽,其中包括8個一級主題和26個二級主題。

4.2 實驗評價指標

精確度和召回率作為評測指標被廣泛用于檢索系統,來衡量算法得到檢索結果的質量和性能[17-18],精確度越高,表明檢索結果質量和性能越好、越精確,召回率越高,說明查準率越高。通過計算興趣精確度和興趣召回率來研究用戶興趣的精確度和性能,興趣精確度和興趣召回率越高,表明興趣越精確。

(1)精確度的計算如公式(4)所示。

TP表示正類判定為正類,FP表示負類判定為正類。以主題詞“計算機”為例,本文抽取10 000條數據,將與“操作系統”有關的3 000條數據打標簽為“計算機”。當在檢索系統中輸入“計算機”時,得到的搜索結果有3 200條,Lucene檢索結果中標記為“計算機”的有2 487條,即TP=2 487,FP=3 200-TP=713,由此可以得出精確度P=0.777的結果;UCI-Lucene結果中標記為“計算機”的課程條數為2 550條,即TP=2 550,FP=3 200-TP=650,最終得出精確度P=0.797。

(2)召回率的計算如公式(5)所示。

TP表示正類判定為正類,FN表示正類判定為負類。根據公式(4)中的數據,TP=2 487,FN=3 000-TP=513,可以得出,基于倒排索引的Lucene的搜索結果召回率為P=0.829;基于UCI-Lucene算法得到的搜索結果:TP=2 550,FN=TP=450,計算得出召回率為P=0.85。

(3)用戶興趣精確度可以根據公式(6)計算得出。

SIN代表檢索出的用戶興趣數,TN代表總數目。以“計算機”為例,本文取10 000條關于“計算機”的數據,將“計算機”分為10個類,如“數據結構、操作系統、人工智能原理、計算機組成原理、Java程序設計、算法分析與設計、數據庫原理”等。在這些數據中,與“數據庫原理”相關的數據有2 000條,將“數據庫原理”作為一個興趣,實驗組模擬用戶多次點擊與“數據庫原理”相關的數據。當在檢索框中輸入“計算機”時,得到的檢索總數目為2 100條,基于倒排索引的Lucene算法結果顯示,“數據庫原理”的數據有282條,即SIN=282,TN=2 100,得到興趣精確度P=0.134;改進的用戶興趣算法模型UCI-Lucene結果顯示,“數據庫原理”的數據量達到846條,即SIN=846,TN=2 100,計算可得興趣精確度P=0.403。

(4)根據公式(7)可以計算出興趣召回率。

SIN代表檢索出的用戶興趣數,IN代表的是所有的興趣。以上一段第(3)部分中的數據為例,與“數據庫原理”相關的數據有2 000條,根據倒排索引的Lucene算法結果顯示,“數據庫原理”的數據共計282條,即SIN=282,IN=2 000,得到興趣召回率P=0.141;根據UCI-Lucene的結果顯示,“數據庫原理”的數據量達到了846條,即SIN=846,IN=2 000,計算得到興趣召回率P=0.423。

4.3 實驗過程與實驗結果

在用戶登錄系統并輸入檢索詞之后,其瀏覽行為會被記錄下來,包括點擊次數、點擊時長以及其他相關信息。在重新進行搜索時,可以通過LDA主題模型算法對存儲的日志信息進行分析計算,從而統計出用戶的興趣,具體的算法搜索結果如表2所示。

通過實驗,本文發現“計算機”、“經濟學”、“醫學”、“理學”、“管理學”和“工學”這6個主題詞在圖書館個性化檢索系統結果中的有效性是通過使用用戶興趣模型和LDA主題模型來驗證的。通過下面四組實驗,本文探究了用戶興趣如何影響搜索結果,并將LDA主題模型算法與Lucene算法和UCI-Lucene算法進行了比較,具體數據可參見表3。

根據表3的數據可以看出,采用UCI-Lucene算法比采用Lucene算法的精確度更高,召回率更高,用戶的興趣更加準確,興趣召回率也更高,從而大大提升了智慧圖書館檢索系統的精確度、查準率和性能;用戶對同一搜索詞的搜索請求可能會有所不同,但最終的結果往往會更加符合用戶的需求,從而滿足用戶的搜索期望。

本文通過兩篇文獻研究了不同用戶興趣模型對搜索結果的影響,并對其進行了詳細的分析。文獻[19]研究設計的一種用戶興趣模型是通過對用戶的瀏覽偏好進行全面分析,建立的一個能夠滿足用戶長期和短期需求的興趣模型,并將其應用于個性化檢索系統中。根據本文中提出的算法以及參考文獻[19]中的研究成果,對興趣精確度和興趣召回率進行了分析和計算,具體結果可見表4。

通過對比,UCI-Lucene的搜索結果比參考文獻[19]中的興趣精確度和興趣召回率更高,這說明了本文所構建的用戶興趣模型在發掘用戶偏好方面擁有極大的優勢,具有更好的用戶興趣精確率和查準率。經過深入研究發現,文獻[19]中的用戶興趣模型未能充分考慮網頁點擊次數、網頁權重以及其他相關因素[19]。相比之下,本文提出的算法不僅能夠精確衡量網頁點擊時間,更好地捕捉網頁的興趣特征,還能夠更精確地反映出網頁的點擊頻率和內容。

參考文獻[20]提出的興趣模型是通過一組具有權重的關鍵詞構成的向量集捕捉用戶的興趣偏好并分析用戶瀏覽行為和內容[20],該模型能夠根據用戶不同時期的時間段來劃分其興趣,并且可以通過公式(8)來確定其實際需求。

Ptd代表了這一天的興趣,用一個m維的向量來表示,其中每一項Ptdtk代表了用戶的實時興趣,如公式(9)所示,S0代表了一天內訪問的總頁面數。

用戶的穩定興趣可以用一段較長的時間內用戶的訪問歷史來得出,如公式(10)所示。

Psd表示了用戶的穩定興趣,用一個m維的向量來表示,其中每一項Psdti如公式(11)所示。

n代表了穩定興趣的時間窗口,Si代表了前i天訪問的總頁面數,e-log2/h1*(d-din)為衰減因子,反映了一個人對某個關鍵詞的關注度,也可以用來衡量一個人對該關鍵詞的記憶程度,hl代表了人們興趣持續一段時間后開始減弱,d-din代表了人們對某個興趣持續的天數,Sn代表了n天內訪問的總頁面數。通過分析用戶的實時興趣和長期興趣,可以建立一個用戶興趣模型,如公式(12)所示。

在這個公式中,a+b=1,而c是一個常量,具體值根據實驗所得。經過對文獻[20]進行詳細的分析研究,本文將抓取的教育類數據集劃分為多個文本類別,并計算出每個文本類別的權重,用戶興趣類別及權重如表5所示。根據本文中的UCI-Lucene算法和參考文獻[20]中的研究方法,對興趣精確度和興趣召回率進行了計算,并將計算結果匯總在表6中。

根據表6的數據,可以發現本文提出的UCI-Lucene算法得到的搜索結果表現出更高的興趣精確度和興趣召回率,這說明本文提出的UCI-Lucene算法具有更加優秀的發現能力、精確率和查準率,能夠幫助用戶更加精確地發現和挖掘用戶的潛在興趣。本文提出的算法采用LDA主題模型算法,可以自動計算出內容的主題個數,而且可以有效地計算出內容的興趣分布,這種方法比文獻[20]中提出的興趣模型更加智能化。

5 結語

本文提出了一種新的算法模型來改善用戶體驗,即基于LDA主題模型的用戶興趣改進算法模型:UCI-Lucene算法模型。UCI-Lucene算法模型在發現用戶潛在興趣方面表現更出色,它能夠準確地捕捉用戶的興趣,并且能夠大大提升個性化檢索系統的精確度、召回率、興趣精確度和興趣召回率,同時也提高了檢索系統的檢索效率、準確度和查準率。智慧圖書館檢索系統融入用戶興趣使得搜索結果更符合用戶興趣和期望,也更好地滿足了用戶獲取信息、學習科研的需要。

參考文獻:

[1] 湯瑋,劉旭,尹志帆,等.基于solr下的檢索系統核心技術研究與應用[J].電子制作,2020(14):40-41,50.DOI:10.16589/j.cnki.cn11-3571/tn.2020.14.017.

[2] 湯尚.圖書館元宇宙賦能智慧服務研究[J].圖書館工作與研究,2023(5):22-27,74.DOI:10.16384/j.cnki.lwas.2023.05.005.

[3] 夏翔,劉姜,倪楓,等.基于混合相似度和用戶興趣遷移的改進協同過濾推薦算法[J].計算機時代,2023(3):36-39.DOI:10.16644/j.cnki.cn33-1094/tp.2023.03.009.

[4] 晏一平,岳泉.中外元檢索系統的比較研究[J].圖書館學研究,2005(11):19-24.DOI:10.15941/j.cnki.issn1001-0424.2005.11.006.

[5] SU Q Y,CHEN C,LONG Z,et al.Identification of critical nodes for cascade faults of grids based on electrical PageRank[J].Global Energy Interconnection,2021,4(6):587-595.

[6] MLADENIC D.Text-learning and related intelligent agents:a survey[J].IEEE Intelligent Systems & Their Applications,2002, 14(4):44-54.

[7] 柯青.基于RSS技術的個性化信息服務新方式:由雅虎看RSS在搜索引擎中的應用[J].情報理論與實踐,2005(5):537-541.

[8] PAN J G,HU X L,LI J,et al.Design and implementation of a personalized information retrieval agent[J].Journal of Software, 2001,12(7):1074-1079.

[9] LYU Y,YIN M,XI F,et al.Progress and Knowledge Transfer from Science to Technology in the Research Frontier of CRISPR Based on the LDA Model[J].Journal of Data and Information Science,2022,7(1):1-19.

[10] TAN J.Discusses of User Interest Model in Personalized Search[J].International Journal of Advancements in Computing Technology,2013,5(1):619-626.

[11] LUO G,XU H. Intelligent Retrieval Knowledge Repository Model Design Based on Lucene Research[C]//Science and Engineering Research Center.Proceedings of 2015 International Conference on Industrial Informatics,Machinery and Materials(IIMM 2015).Lancaster:DEStech Publications,2015:102-105.

[12] SIRINART C,AREENUCH T,SUMITTRA J, et al. Evaluation of the ESR fast detector and Improve? ESR analyzer as modified Westergren methods for erythrocyte sedimentation rate.[J].Scandinavian journal of clinical and laboratory investigation,2022,82:7-8.

[13] 孟幫杰,王占剛.兩種中文分詞算法在云計算平臺上的實現及比較[J].網絡安全技術與應用,2014(12):67,71.

[14] DING H,LIU Q,HU G W.TDTMF:A recommendation model based on user temporal interest drift and latent review topic evolution with regularization factor[J].Information Processing and Management,2022,59(5):528-543.

[15] TAN J.Discusses of User Interest Model in Personalized Search[J].International Journal of Advancements in Computing Technology,2013,5(1):619-626.

[16] PU Q.The Design and Implementation of a High-Efficiency Distributed Web Crawler[C]//Dependable,Autonomic and Secure Computing,Intl Conf on Pervasive Intelligence and Computing,Intl Conf on Big Data Intelligence and Computing and Cyber Science and Technology Congress.New York:IEEE,2016:100-104.

[17] TAN C C,SHENG B,WANG H,et al.Microsearch:A search engine for embedded devices used in pervasive computing[J].Acm Transactions on Embedded Computing Systems,2010,9(4):1-29.

[18] 陳弄祺.國內互聯網檢索系統評價研究[J].統計與決策,2017(3):63-66.

[19] 張宏亮,王海燕.基于改進用戶瀏覽行為個性化檢索系統系統研究[J].軟件導刊,2013,12(10):89-91.

[20] 蔣翀,費洪曉,張嘯.基于用戶興趣模型的Nutch個性化檢索系統研究[J].計算機時代,2015(9):26-28.

猜你喜歡
檢索系統精確度檢索
研究核心素養呈現特征提高復習教學精確度
“硬核”定位系統入駐兗礦集團,精確度以厘米計算
2019年第4-6期便捷檢索目錄
收錄《信號處理》的檢索系統及數據庫
收錄《信號處理》的檢索系統及數據庫
本刊被以下檢索系統及數據庫收錄
本刊被以下檢索系統及數據庫收錄
專利檢索中“語義”的表現
國際標準檢索
國際標準檢索
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合