?

面向用戶的網絡敘詞表需求調查分析*

2019-05-14 11:54陳紅艷
圖書館研究與工作 2019年5期
關鍵詞:詞表入口檢索

陳紅艷

(湖北大學圖書館 湖北武漢 430062)

數字技術和網絡技術的發展和應用,改變了用戶信息資源的供給、需求和環境。在網絡環境下,用戶利用信息資源的方式發生了變化,一般用戶更傾向于使用搜索引擎作為檢索起點。伴隨信息技術的發展,網絡資源正呈指數級別增長,對于一般用戶而言,信息利用成本增加,如何快速有效地查詢到所需信息顯得愈發困難。在用戶搜索與信息查找反饋復雜的信息交換過程中,網絡敘詞表作為一種成熟的語義組織工具,對于聯接用戶和信息資源發揮著重要的作用。本文在分析影響用戶對網絡敘詞表需求因素的基礎上,采用深入訪談的方式調研用戶需求,分析其需求特征,以期為構建面向用戶的網絡敘詞表提供參考。

1 影響用戶對敘詞表需求的主要因素

網絡敘詞表不僅可以用于紙質文獻的組織,也可用于組織網絡信息資源。伴隨互聯網的出現,用戶對網絡敘詞表的需求主要與下列因素有密切關系。

1.1 信息環境的改變

信息環境的改變主要體現在信息資源的網絡化和資源數字化兩大方面。當前,互聯網絡是用戶獲取信息的重要途徑。據中國互聯網絡信息中心(CNNIC)發布的第42次《中國互聯網絡發展狀況統計報告》顯示:截至2018年6月,中國網站數量達到了544萬個,中國網民規模達8.02億,互聯網普及率達到57.7%,近六成中國人已接入互聯網[1]。其中,即時通信、搜索引擎、網絡新聞和社交作為基礎應用,用戶規模保持平穩增長。隨著數字出版、預印本、開放獲取等新型數字媒體的出現,資源數字化趨勢日益明顯,數字資源在整個文獻信息體系中所占的比例越來越大。以上海交通大學圖書館為例,其在2001—2011年期間,數字資源增長迅猛,電子圖書增加了195.9萬種,電子期刊增加了267 000種,數據庫增加了196個,館藏資源朝數字化方向發展[2]。目前國內最大OA資源數據庫Socolar平臺,幾乎涉及所有學科領域,共收錄11 739種OA期刊,1 048個OA倉儲,平臺收錄文章數達23 894 558篇[3]。由瑞典隆德大學圖書館2003年5月推出的開放獲取期刊檢索系統——開放獲取期刊目錄(Directory of Open Access Journals,簡稱DOAJ),當前可提供12 228種開放獲取期刊的訪問,其中有9 209種支持文章級檢索,涉及128個國家,收集的論文數量達3 457 865篇[4]。由此可見,面對海量信息源,用戶需有適合的知識組織工具予以支持,方可節省檢索時間和提高檢準率。網絡敘詞表就是其中有效的工具之一。

1.2 用戶的現實需求

在檢索活動前,用戶對于所需查詢的問題通常有較為清晰的認識,清楚查詢主題的范圍。但在構建檢索表達式、選擇合適的檢索詞時,往往會遇到困難。國外已有學者對此展開過定性與定量研究。Nielsen曾對29個參與者進行調查,其中有21人表明在構建檢索式時,很難限定其信息需求所用檢索詞[5]。為了限定檢索提問式,在未產生更高檢索噪音而又獲得高查全率的情況下,用戶通常需要參考一些同義詞和其他類型的等同詞匯。比如,借助敘詞表等工具。Shiri在《敘詞表增強的檢索界面》一文中指出,在構建檢索式時,通常終端用戶在選擇詞匯時有困難。敘詞表通過提供有效檢索詞,幫助用戶順利完成檢索過程[6]。

1.3 網絡敘詞表具備的功能

網絡敘詞表具有標引、檢索、瀏覽、導航等多種功能,通過提供多途徑瀏覽方式,幫助用戶快速選定目標詞,提高詞表的易用性。網絡敘詞表既能標引各種媒介資源,又能實現資源鏈接,滿足終端用戶從檢索詞匯到檢索相關信息的連續檢索。因此,網絡敘詞表具有優化用戶檢索過程及檢索效果的功能。

網絡敘詞表為網絡環境下的信息生產者和使用者帶來雙贏:對網絡信息生產者而言,利用敘詞表可用同一標準來標引和描述信息,尤其是對同類資源的描述;對網絡終端用戶而言,作用則更為顯著。Shiri和Revie在《敘詞表增強的檢索界面的可用性及用戶認知》一文中曾經指出敘詞表:①為用戶的具體檢索引入相關新概念;②為檢索詞匯提供語境信息;③為用戶構筑提問式提供多種可選建議;④便于用戶擴大或縮小檢索范圍;⑤為用戶提供多角度檢索;⑥提供敘詞之間語義關系的指導說明;⑦提醒用戶使用檢索最初未想到的詞匯[7]。

同時,網絡敘詞表反映了概念間內在語義邏輯關系,對于促進客觀知識體系中的多級語義傳遞具有正向促進作用。通常,在具有5個相同相鄰語義域時,發生多級語義傳遞的可能性最大[8]。

2 用戶對敘詞表的認知與利用情況調查

為了探討不同學科領域的普通用戶對網絡敘詞表需求的差異及特征,筆者于2018年3-5月利用講授《信息檢索與利用》選修課程的機會,對33名選修學生進行分組深度訪談。訪談內容主要包括對敘詞表的認知、利用情況,以及在檢索過程中遇到的常見障礙和對敘詞表功能展望等,深入了解用戶對網絡敘詞表的認知情況與真實需求,以期為面向用戶的網絡敘詞表設計及構建提供借鑒。

2.1 用戶對敘詞表的認知情況

在33名訪談者中,大一學生有22人,占66.67%,大二學生有7人,占21.21%,大三學生有4人,占12.12%;所涉及的學科分布分別為社會學科9人(27.28%)、人文學科2人(6.06%)、理工學科14人(42.42%)以及信息學科8人(24.24%);專業主要有化學工程與工藝、地理科學、計算機科學與技術、檔案學、人力資源管理等。

在訪談之前,筆者首先對受訪者進行有關敘詞表基礎知識的普及講解。例如,在我國,敘詞表與主題詞表指代幾乎等同;主題與主題詞的常見應用場景等。根據用戶對敘詞表認知的熟悉程度分為“非常熟悉”“熟悉”“基本了解”“從未聽說”4個級別進行調查,統計結果見圖1。其中,“從未聽說”的比例占了66.67%,“熟悉”與“非常熟悉”的為15.15%。由此可見,一般用戶對敘詞表的認知水平有限。

圖1 用戶對敘詞表的認知情況

通過進一步交談得知,選擇“非常熟悉”的學生專業多集中在檔案學。究其原因是因為其開設了《信息組織》等相關課程,故對敘詞表非常了解。對于選擇“基本了解”的學生而言,對敘詞表的了解主要源于對WOS、EBSCO等外文數據庫的使用。

2.2 用戶對敘詞表的利用情況

為了解普通用戶使用敘詞表的場景,筆者列舉了圖書館公共目錄OPAC、中文數據庫、外文數據庫、電子圖書、搜索引擎、門戶網站、社交網站等不同信息平臺。訪談發現,文科類學生使用敘詞表時主要是在利用中文數據庫(CNKI、維普、萬方等)時,選擇“主題”項;而在利用OPAC檢索圖書時,更多地采用“題名”項。理工科類學生則主要是在利用外文數據庫(WOS、EBSCO等)時,為擴增檢索結果選擇“主題”項。

在利用搜索引擎、門戶網站檢索學術信息資源時,理工科類學生更愿意嘗試用多個關鍵詞來輸入查找信息;文科類學生則更傾向于用自己熟知的概念、詞匯作為首要輸入詞語,在檢索結果不理想的情形下,反復替換多個輸入詞的意識較弱。

在允許用戶自行添加標簽的社交網站(如豆瓣等)上,對敘詞表認知程度高的學生添加標簽積極性很高,標簽主題范圍更為具體。

在獲悉敘詞表基本功能后,利用敘詞表頻率較低者表示,未來在網絡檢索界面上,若鏈接有相關敘詞表或者主題詞表,均表示愿意試用。

2.3 用戶信息檢索存在的障礙情況

根據檢索過程,將用戶檢索行為分為檢索前的檢索表達式構建與檢索后的檢索結果處理兩個階段,列舉了6大類障礙,供受訪者選擇(選項可多選),其結果排序見表1。

表1 用戶檢索過程中存在的障礙情況統計

從表1可見,用戶對檢索過程所遇障礙因素的趨同性較高。其中,有超過半數以上的學生選擇“不知如何表達信息需求”“想不出恰當的檢索關鍵詞”等5類障礙因素。其中,“不知如何表達信息需求”居首位,占81.82%。通過深入交流,發現大部分受訪者選擇此項最主要的原因是無法精準、快速地提煉自己所需信息的主題,進而找不到合適的詞語進行表達。在面對初次檢索結果不理想時,“二次檢索(精確檢索)更困難”“無法及時想到很多關聯詞語”與主題表達均存在內在關聯性。

2.4 用戶對網絡敘詞表服務的期待調查

為進一步普及網絡敘詞表,推廣其應用,在訪談最后階段了解了用戶對網絡敘詞表平臺服務功能的期待,列出多項功能供受訪學生選擇,結果如表2所示。

表2 用戶對網絡敘詞表服務的期待情況統計

從表2可見,除了“自動標引”以外,其他服務類別期待的比例較高(均超過了半數),反映了用戶對這些服務的期待非常強烈。尤其是,“關聯詞匯提示”“可視化顯示”“提供注釋”以及“免費獲取”四項是用戶最需要的服務。用戶希望敘詞表能夠清晰、直觀地揭示不同詞匯之間的關系,提示同義詞、近義詞等關聯詞匯,供自己在確定檢索詞時選擇,提高檢準率?!懊赓M獲取”“與常用學術資源平臺(網站)鏈接”則從另一角度反映了用戶對網絡敘詞表的迫切需要。

3 用戶對網絡敘詞表需求的特征分析

通過調查用戶對網絡敘詞的需求情況可知,面向用戶、面向網絡是網絡敘詞表構建過程中必須遵守的基本原則。此處“用戶”既包括信息標引用戶和信息檢索用戶,又包含專業用戶和普通終端用戶,其對網絡敘詞表需求的特征如下。

3.1 基于用戶自然語言的入口詞擴增

在傳統信息環境下,敘詞表的入口詞是指等同(用代)關系中的“代項”,即非優選詞,包括優選詞的同義詞或準同義詞;優選詞是來源于正式文獻和學術術語。由于網絡敘詞表的使用環境和用戶群體發生了巨大改變,入口詞的來源、規模及作用亦需作出相應調整。

入口詞不應局限于優選詞的同義詞或準同義詞,有關優選詞的不同拼寫形式、不同的外語縮寫形式、不同翻譯形式、概念的全稱與簡稱等均可納入入口詞的范圍。入口詞的規模需要擴增,適當增加入口詞數量、擴大入口詞形式,提高入口率,增強網絡敘詞表的自然語言檢索能力。入口詞作為檢索的引導詞,雖不用作標引詞,但通過詞表的等同關系控制也可以檢索到相應的信息。由于不同學科領域,對于某一概念的表述詞語不盡相同。如果人為規定優選詞可能并不能滿足使用者的偏好,無法體現入口詞在進行高效信息檢索時發揮詞匯之間的調節作用[9]。當網絡敘詞表主要應用于網絡信息的組織和檢索、面向形形色色的非專業用戶時,入口詞就要收集用戶常用檢索詞作為其重要來源之一。

因此,在遵守敘詞表選詞基本原理與前提的條件下,網絡敘詞表需擴大收詞規模,增加入口詞的數量,使得其選詞與用戶在檢索時所使用的關鍵詞盡量保持一致,適應用戶檢索習慣。

3.2 詞間關系擴展

敘詞表詞間關系主要有等同關系、等級關系和相關關系三種,基本滿足了用戶對敘詞表的需要。由于網絡敘詞表的應用環境是面向網絡環境下的所有用戶,為了更貼近用戶的真實需求,這就要求敘詞表的編制要根據用戶的要求,支持用戶自定義詞間關系[10]。

自定義是基于三種基本詞間關系并結合學科特點作有針對性和適應性調整。例如,對于計算機專業用戶而言,希望能將“概念——對象——屬性”作為一類相關關系;藝術學科專業用戶則希望要充分考慮藝術學科的學科特色,在詞間關系設置時,多設立一些“對象”“材料”“空間”“時間”等頂層類別,用不同分面來細分某一具體主題。此外,還可將“學科——學者——研究機構”視為一種相關關系,以此了解某一研究領域概況。

通過詞間關系擴展,既能夠靈活處理不同的詞間關系,又能滿足用戶的個性化標引和檢索需求,提高檢準率。為方便用戶對詞間關系理解和使用,采用可視化技術,形象直觀地呈現不同類型的詞間關系[11]。

3.3 詞表顯示多樣化

在計算機屏幕顯示格式下,網絡敘詞表能夠在一張頁面上顯示每條敘詞紀錄的所有信息,給予用戶完整的信息反饋[12]。雖然用戶記住詞匯的語義內容難度增加,但超文本鏈接使用戶在不同顯示格式之間跳轉,加快了用戶在詞匯間的移動和定位。由于用戶對網絡敘詞的認知水平普遍較低,為更快熟悉與利用詞表,用戶希望在顯示界面清晰、明了,增強導航功能的前提下,提供多種網絡敘詞表顯示方式,方便其瀏覽和檢索詞匯。除了最常見的字母順序顯示方式外,還可考慮等級顯示、主題類別顯示等。

等級顯示直觀顯示了詞匯間的語義關系。通過顯示概念間線形、樹型等級結構,表達出敘詞整體結構和所有等級。網絡敘詞表應顯示詞匯不同層次的等級,并對不同等級賦予一定指示標記。不同的等級層次反映詞匯間不同的上、下位關系,對用戶選擇詞匯具有導航作用。等級顯示將詞匯語義關系直觀顯示,便于用戶擴檢或縮檢來選擇合適敘詞。

主題類別顯示一般按主題范疇集中顯示敘詞,在一個“語義場”內顯示大量相關概念,增加敘詞表系統性,方便用戶查找。此種顯示方式兼具分類、主題兩種標引和檢索功能,為不同層次和不同需求的用戶提供不同入口進行詞語概念查詢,提高用戶檢索效率。

3.4 提供多功能服務

信息檢索與信息標引作為敘詞表的基本功能,為網絡敘詞表所具備。在用戶對網絡敘詞表服務期待調查中可知,更多用戶希望網絡敘詞表能與常用學術資源平臺(網站)進行鏈接,通過查詢敘詞來直接獲取所需資源,提供“一站式”鏈接服務。在信息技術的推動下,網絡敘詞表的功能得到了進一步提升。

一是利用可視化技術,將相關隱性知識進行可視化展示成為顯性知識,提高敘詞表的易用性,幫助普通用戶實現對敘詞表的專業化使用,充分發揮敘詞表知識組織、知識導航以及知識發現等功能,提高用戶對網絡信息資源的利用率。

二是實現跨語言檢索的功能。網絡環境本身就是一個多語種環境,編制多語種敘詞表,使其作為一種中介詞典,讓用戶在使用母語的同時,可檢索到其他語種同類信息,擴大信息檢索范圍。

4 結語

在網絡環境下,敘詞表更多的是適應普通用戶更直觀的信息檢索需求,甚至機器用戶的自動標引和檢索[13]。網絡敘詞表設計的基本原則應從適應普通用戶和機器用戶的應用環境和需求出發,敘詞表的編制應更加關注入口詞范圍擴充、詞間關系變革、詞表顯示等核心內容,包括敘詞表自然語言化、控制機制智能化,以及與其他信息系統無縫交換和集成。

猜你喜歡
詞表入口檢索
高速公路入口疏堵解決方案及應用
基于VOLT的藏漢雙向機器翻譯
基于新一代稱重設備的入口治超勸返系統分析
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
瑞典專利數據庫的檢索技巧
在IEEE 數據庫中檢索的一點經驗
一種基于Python的音樂檢索方法的研究
近十年國內外專業學術詞表建立文獻綜述*
秘密入口
第九道 靈化閣入口保衛戰
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合