?

數字圖書館信息檢索可視化體系

2019-04-08 09:06羅慧麗
科教導刊·電子版 2019年2期
關鍵詞:信息檢索檢索可視化

摘 要 可視化技術利用計算機圖像處理技術、數字技術、網絡通信技術等把沒有空間模型的信息數據轉換成視覺形式,將其應用于數字圖書館信息檢索可以使其信息服務更加人性化、智能化,可極大提高檢索效率,獲得滿意的檢索效果。本文論述了數字圖書館信息檢索可視化的必要性,構建了數字圖書館檢索可視化系統的體系結構。

關鍵詞 數字圖書館 信息檢索可視化

中圖分類號:G250 文獻標識碼:A

1數字圖書館信息檢索可視化的必要性

首先,數字圖書館的信息資源不僅包括各種多媒體信息,還包括各種經過處理的網絡信息資源,館藏信息資源內容的多樣性、廣泛性和深入性遠甚于多載體文獻形式的傳統圖書館。傳統圖書館文獻信息是按照一定的分類編目法進行組織分類編目并建立相應的類目標引體系,而數字圖書館信息資源是數字化信息,是以指針、元數據和數據的方式進行組織存貯。因此,數字圖書館信息資源組織方式和檢索操作的復雜性遠遠超過傳統圖書館。其次,數字圖書館作為大眾化的信息服務中心,其服務對象具有廣泛性和多樣性的特點。面對信息資源的多媒體性以及信息存貯的數字化,數字圖書館要為用戶提供優質服務就應提供更為簡便化、人性化、自動化的人機交互檢索系統,為用戶獲取所需信息提供有效捷徑。

2數字圖書館信息檢索可視化系統的體系結構

可視化檢索系統主要包括特征索引庫模塊、用戶檢索模塊以及結果可視化模塊,如圖1所示。在傳統的基于關鍵詞標引匹配檢索方法中一般是通過對多媒體信息的物理特征進行著錄標引,并將其轉換成相應的文本格式,建立索引庫,然后按照文獻檢索一樣,將用戶提問的關鍵詞與索引庫數據進行匹配。由于圖像、音頻、視頻等包含的信息量很龐大,物理特征描述往往不能揭示這些數字信息的內容,用戶也難以用文字合理地表述對其所需,導致信息檢索不能滿足用戶的信息需求。目前,基于內容的多媒體檢索技術較好地克服了這一缺點并成為數字圖書館多媒體信息檢索的熱點技術,本系統就以這種檢索技術為基礎,構建各功能模塊:

建立數字化信息資源特征索引庫是數字圖書館信息檢索的基礎。特征索引庫模塊的功能主要是對各種多媒體數字化信息資源按照選定的特征抽取方法,生成相應的特征數據庫建立索引數據庫。對數字化多媒體信息資源進行特征提取,是指選擇按照一定的算法從原始數字化資源庫中分析出可以表示數字化文本、圖像、音頻、視頻等各種信息資源本質內容的數據信息,并為這些信息數據建立相應的特征庫。在該模塊中為了加快檢索速度,系統模塊將這些數據按照抽取的方法分類存放到數據庫中,同時把各種媒體的特征數據和具體的媒體信息關聯起來。因為多媒體信息具有多種屬性,為了有效揭示信息內容,系統會從多個不同角度描述信息資源,所以特征索引庫的數據是多維的數據。用戶檢索模塊是用戶進行查詢和瀏覽數據的接口,該模塊的主要功能是將用戶的檢索提問輸入檢索系統為可視化信息檢索提供數據接口,將用戶提供的查詢需求與索引庫數據進行匹配檢索。結果可視化模塊的功能是通過可視化算法求出匹配成功數據的可視化結構模式,結合圖符庫將檢索結果以視圖形式顯示給用戶。由于基于內容特征的信息檢索是一種相似度檢索,需要在檢索過程中不斷與系統交互,評價系統查詢結果,并重新匹配調整查詢提問,逐步求精獲取有效信息的方法,所以系統設置利用相關反饋技術來收集用戶對檢索結果的反饋信息。

此外,信息檢索可視化需要把信息資源的特征數據信息描述為n維向量,然后選擇合適的檢索模型將向量在n維空間中顯示出來,因此選擇可視化檢索模型時要考慮所選模型是否能夠以向量的形式描述信息資源和查詢。布爾邏輯模型、向量空間模型和概率模型是常用的三大檢索模型。布爾邏輯模型(Boolean Model)是一種基于關鍵詞的信息檢索模型,通過將用戶的檢索提問與特征數據的標志進行嚴格字符匹配比較來檢索信息。它的改進模型包括模糊集合模型和擴展布爾模型。模糊檢索模型較好地克服了嚴格匹配導致查全率下降的不足,但它并沒有對檢索結果進行向量化處理;擴展布爾模型是對提問與特征數據進行布爾檢索后,再將檢索結果按照向量檢索模型處理,所以它符合可視化檢索要求。向量空間模型(Vector Space Model,VSM)是把每一條特征數據以及每個檢索提問用向量表示,然后將檢索中的特征數據與提問的匹配處理過程轉化為向量空間中特征數據向量與提問向量的相似度計算問題,所以向量空間模型及其改進模型都可以成為可視化檢索模型。概率模型是基于概率排序原理,根據特征數據信息與提問的相關概率來排序輸入檢索結果的方法。因此,擴展布爾模型以及向量空間模型及其改進模型都可以成為可視化檢索模型的選擇。

3結束語

可視化技術的研究和利用給數字圖書館環境下的信息資源操作管理帶來了根本性的變革。通過對可視化技術的研究和利用,數字圖書館把計算機技術、數字技術、多媒體技術結合起來,將那些通常難以設想和接近的環境和信息,以動態直觀的方式表現出來,為讀者提供更加有效的服務。

作者簡介:羅慧麗(1986.8-)女,漢族,福建省建甌市人,本科 ,閩北職業技術學院,助理館員,研究方向:圖書館服務。

參考文獻

[1] 曾民族.知識技術及其應用[M].北京:科學技術文獻出版社,2006:431.

[2] 張學福.信息檢索可視化基本問題研究[J].中國圖書館學報(雙月刊),2006(03):37.

猜你喜歡
信息檢索檢索可視化
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
基于CGAL和OpenGL的海底地形三維可視化
2019年第4-6期便捷檢索目錄
“融評”:黨媒評論的可視化創新
醫學期刊編輯中文獻信息檢索的應用
專利檢索中“語義”的表現
基于神經網絡的個性化信息檢索模型研究
教學型大學《信息檢索》公選課的設計與實施
公共圖書館信息檢索服務的實踐探索——以上海浦東圖書館為例
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合