ChatGPT及其核心技術在科技名詞規范化中的應用潛力與挑戰

2023-09-26 00:37杜振雷劉金婷史金鵬

中國科技術語 2023年4期

杜振雷劉金婷史金鵬

(全國科學技術名詞審定委員會,北京 100717)

0 引言

科技名詞規范化是指對科學技術領域中的專業術語進行統一、規范、標準化的過程。隨著科技的飛速發展,各領域不斷涌現出大量的新概念、新技術和新方法,科技名詞規范化領域面臨著前所未有的挑戰,亟須進行深層次的革新。傳統的科技名詞規范化實踐完全依賴于專家的判斷,容易出現主觀偏差,不僅耗時耗力,而且難以適應科技名詞的動態變化和多樣化需求。

近年來,以ChatGPT(Conversational Generative Pre-trained Transformer)為代表的新一代人工智能技術取得了顯著的進展,其強大的人機交互、語言理解和內容生成能力為開展科技名詞規范化實踐提供了新的可能性。當前,科技名詞工作者需要深入研究人工智能技術帶來的影響和挑戰,并探索實現科技名詞規范化工作自動化、智能化和高效化的新方法。

本文旨在研究如何借助ChatGPT及其核心技術來優化和創新科技名詞規范化的工作模式,以期在提升工作效率的同時也能保證規范化結果的科學性和權威性。筆者首先從多個維度分析了ChatGPT及其核心技術的優勢和特點,接著論述了這些技術在科技名詞規范化工作中的應用潛力以及可能面臨的風險與挑戰,最后展望了新一代人工智能技術對于推動我國科技名詞規范化事業發展的啟示。

1 背景與研究意義

科技名詞作為科技交流和知識傳播的重要載體,在生活和工作中扮演著日益重要的角色。規范化的科技名詞有助于提高科技信息的傳播效率和準確性,減少人們交流與合作的障礙,對于國家科技創新和經濟發展有著重要的基礎性和支撐性作用。我國長期以來高度重視科技名詞規范化工作。早在1950年,政務院文化教育委員會就設立了學術名詞統一工作委員會,為新中國全面系統開展科技名詞規范化活動奠定了基礎。1985年,國務院專門成立了全國自然科學名詞審定委員會(現稱全國科學技術名詞審定委員會),標志著科技名詞規范化事業邁入新的歷史階段[1]。全國科學技術名詞審定委員會負責組織和協調各類學科領域的名詞審定、公布和推廣工作。截至2023年5月,已經審定公布規范名詞159種,覆蓋基礎科學、工程與技術科學、農業科學、醫學、人文社會科學、軍事科學等各個領域,強有力地推動了我國科技名詞規范化事業的發展。

隨著科技的迅速發展,科技名詞規范化工作的內容和模式都相應做出了很大的調整,同時也面臨著越來越嚴峻的挑戰。在新媒體環境下,推廣和普及權威、規范的科技名詞的難度更是越來越大,而確保更多人能夠及時、正確地理解和應用規范科技名詞具有重要意義。為了應對科技名詞規范化過程中不斷增長的挑戰,借助新一代人工智能技術優化和創新現有工作模式尤為必要。

ChatGPT是OpenAI公司研發的一款生成式人工智能對話系統,其主要目標是通過深入學習和理解自然語言,實現與人類的有效交互對話[2]。這款產品被廣泛認為是通用人工智能發展的重要里程碑,同時也被贊譽為具有標志性的人工智能生產力工具。其影響力之大,可以與蒸汽機相提并論,甚至被視為第四次工業革命的序幕[3]。它具備在不同領域和任務中生成連貫且語義正確回復的能力,其不同版本已被廣泛應用于學術界和工業界[3-6]。在對話機器人方面,ChatGPT可以讓用戶自然提問,實現了從理解到生成,模擬人類進行對話,在客服、輔導、調研等方面提高了服務質量和效率[7]。在新聞生成方面,ChatGPT可以分析輸入的素材和數據,提取關鍵信息,并生成高質量的摘要和報道[8]。在廣告營銷方面,ChatGPT可以根據語境和用戶需求提供創意內容[9]。在信息檢索方面,ChatGPT可以理解用戶提問的意圖,進行檢索并給出精準的回答。在文本處理方面,ChatGPT也展現出優異的性能,在摘要、情感分析、翻譯、詞義消歧、命名實體識別等應用中都有一定的表現[10-11]。盡管ChatGPT在眾多任務上表現出色,但在不同領域的可靠性仍存在較大差異,這意味著在某些特定的任務或應用中,需要對其進行持續的評估和優化,以確保其在各種情況下都能提供高質量的輸出。

ChatGPT及其核心技術(以下簡稱ChatGPT技術)是指構建ChatGPT系統所需的一系列關鍵技術、模型和工具。它包括大規模預訓練模型(large-scale pretraining model,LSPM)、強化學習、多模態學習、多語言處理、上下文建模、用戶個性化建模、內容過濾、文本生成等多種自然語言處理和深度學習技術[6]。ChatGPT技術使得聊天機器人能夠理解和生成自然語言,進行智能化的內容創作,自動生成特定主題或類型的文本。其核心是一種名為InstructGPT的人工智能語言模型,使用了基于人類反饋的強化學習(Reinforcement Learning with Human Feedback,RLHF)技術,使模型的輸出更好地符合人類的需求和價值觀[12]。

2 ChatGPT技術在科技名詞規范化中的核心優勢

ChatGPT技術相較于傳統的人工智能技術具有更高的通用性、自適應性和可擴展性。它不僅可以深入地理解和分析文本,還能結合語境和背景,對相關問題進行概括和歸納,并采用多種形式進行回答和反饋。引入ChatGPT技術進行科技名詞規范化工作有許多優勢,主要體現在以下六方面。

2.1 內容生成

ChatGPT技術擁有卓越的內容生成能力,可以自動生成高質量、連貫一致的文本。通過調節模型的設定和參數,該技術能夠適應不同的對話場景、用戶需求和領域應用,并給出滿足特定要求的答復[13]。

對于科技名詞規范化這樣的任務,ChatGPT技術能夠借助海量的語料庫,自動學習各領域的專業術語和使用規范,從而理解和生成更加精確和專業的內容。經過定制化訓練,ChatGPT技術還能夠掌握科技名詞審定原則和方法,自動提取、生成和呈現語料中的科技名詞及其相關信息,或根據專家需求生成一個包含相關科技名詞及其關系、屬性、分類等信息的知識圖譜,從而降低人工參與的成本和難度。

2.2 信息處理

ChatGPT技術具備快速且準確地處理龐大文本信息的能力[14]。其核心在于運用了一種預先訓練的模型,可以推導出輸入文本中可能蘊含的語義信息。

在科技名詞規范化實踐中,經常需要處理大量的文本。ChatGPT技術在信息處理方面展現出高效、自動化和準確的優勢。借助其強大的自然語言處理能力,可以對龐大的規范語料進行分詞、標注、抽取、分類、聚類和挖掘,能夠自動、快速、精確地提取有價值的信息和知識,為科技名詞規范化工作提供便利的資源和保證。筆者使用的北京大學高志軍研發的基于GPT-3.5模型的術語提取工具,在醫學領域術語提取的實驗中展現了良好的效果[15]。

2.3 問答模式

ChatGPT技術實現的問答模式使得人機對話過程更加流暢和智能。它能夠利用更豐富的語言和領域知識,以及更復雜、靈活的對話策略,展現出更高的自然性和智能性。其長時段、非連續性的對話特性,突破了傳統對話系統在即時性和無記憶功能方面的局限性[16]。反饋循環機制又能夠使對話系統自動學習上下文并優化其回答的準確性和流暢度。在某些高度專業化和復雜的領域中,與人類專家實時協同工作,ChatGPT技術還可以通過收集專家的反饋和使用數據,持續進行模型的迭代和改進,以保證科技名詞規范化結果的專業性和準確性。

2.4 多語種支持

ChatGPT技術在多語種支持方面表現出色,它通過運用多種語言預訓練,能夠掌握跨語言的知識,并將其應用于不同語言的任務中[17]。此外,ChatGPT技術在多語對齊方面能夠更好地理解和處理不同語言之間的關系,識別和理解不同語言之間的語法和結構差異。這些能力使得ChatGPT技術能夠應用于各種語言環境中的術語概念對照,對不同語言的科技名詞進行自動翻譯和解釋,從而實現真正的跨語言科技名詞規范化。

2.5 數據分析

ChatGPT技術擁有出色的數據分析能力,它能夠根據用戶需求自動提取數據、生成分析代碼并輸出分析結果,甚至進行聚類、預測和因果推斷等高級數據分析[18]。

通過綜合運用ChatGPT技術在數據挖掘、機器學習和統計分析等方面的優勢,對科技名詞規范化工作的效果進行自動量化、評價和報告,實現對科技名詞規范化成果的監測和反饋,可以為科技名詞規范化工作提供更客觀和全面的參考依據。與傳統的方法相比,ChatGPT技術具備分析和處理大規模數據集的能力,可以自動學習新出現的科技名詞和變化趨勢,可以幫助專家發現潛在的規范化問題和模糊性,從而保證科技名詞規范化工作的可信度和一致性。

2.6 可定制化

ChatGPT技術提供方便的接口和工具,可以讓開發者輕松地使用和定制系統,為各種應用和平臺提供自然和對話式的界面,滿足不同的場景和用戶需求[2]。

利用ChatGPT技術做科技名詞規范化工作,可以利用接口和框架系統實現對各領域科技名詞規范化工作中的特定數據或反饋,自動調整或優化預訓練好的模型參數或結構,實現對不同平臺和設備的支持和適配,從而滿足不同終端、階段和任務的個性化需求和偏好,使專家可以在任何地點和時間,使用任何方式和工具,進行科技名詞規范化工作,為用戶提供更便捷和更舒適的使用體驗。

3 ChatGPT技術在科技名詞規范化中的應用場景

結合前文所述, ChatGPT技術對開展科技名詞規范化工作大有裨益,它可以作為一個基礎平臺,為各種應用場景提供支持和賦能。結合科技名詞審定公布與宣傳推廣的工作任務和工作模式,下文將從五個方面分析ChatGPT技術的應用潛力。

3.1 優化審定流程

為了充分發揮ChatGPT技術在提高信息獲取速度、增強信息處理能力以及優化內容創作質量和效率方面的潛力,筆者建議從科技名詞規范化工作的起點開始,優化名詞審定的工作流程。這個過程中,機器的推薦和專家的判斷將被融合在一起[19],人機協作完成科技名詞審定工作任務,如圖1所示。

具體來說,首先運用ChatGPT技術搭建的系統對大量學術論文、專利文獻、科技報道等語料進行動態監測,自動識別和提取新出現的科技名詞。之后,系統可以根據語義信息和專業知識庫給出初步的領域分類,從而形成一個初步的候選術語庫。接下來,專家對這些候選術語進行人工篩選和修訂,同時參照系統提示的與已有規范術語庫的協調結果,以確保定名的準確性、科學性和系統性。專家可以通過一個在線平臺查看候選術語及其相關信息,并對其進行確認、修改或刪除。再利用人工智能生成簡潔、準確的術語定義和多語種對照名稱,供專家參照和審定。最后,由專家為新詞所代表的科技概念確定一個規范名稱,并附上定義,最終完成科技名詞規范化和統一的審定任務。

3.2 提高效率與準確性

3.2.1 新詞識別

傳統的新詞識別方法在處理大規模文本數據時,面臨著效率低下和準確性不足的問題[20]。ChatGPT技術可以通過自動學習文本中的語言規律和語義關系,高效識別出潛在的術語新詞,尤其在前沿交叉領域,與傳統人工方法相比,能夠大大縮短新詞發現的周期。例如,在量子科學領域,新的術語和概念不斷涌現,利用人工智能自動挖掘出其中的新興術語,可提高科技名詞審定的效率和準確性。還可以通過進行大量規范科技名詞的訓練,讓系統能夠理解不同學科領域的術語和概念,自動發現潛在的新詞與規范名詞之間的關聯,為術語協調提供更加全面的參考依據。

3.2.2 術語消歧

在科技名詞審定過程中,術語消歧是一個關鍵環節。由于很多科技名詞存在多種含義,而且不同領域的科技名詞也可能存在相似的定義,傳統的方法主要依賴于人工的經驗和判斷,耗時且容易出現主觀偏差。而ChatGPT技術則可以利用對自然語言的理解能力,自動分析上下文信息,確定科技名詞的正確定義,實現快速準確的術語消歧,從而降低人工審定過程中的錯誤率。另外,ChatGPT技術還可以根據不同領域的特點,建立專門的模型來提高消歧效果。

結合知識圖譜技術,還可以將科技名詞和相關項以圖的形式進行表示和存儲,這種結構化、可視化的呈現方式,能夠更為深入地揭示科技名詞間的關聯和依賴關系,進一步提高術語消歧的準確性和效率。同時,也可以為科技名詞規范化工作中跨學科術語的協調提供重要支持。

3.2.3 術語定義

在科技名詞審定過程中,為新發現的科技名詞加注定義是非常重要的一環。傳統的術語定義方法主要依賴于人工撰寫,這樣的方法效率較低且容易受到個人經驗和認知的影響。而ChatGPT技術可以通過訓練來學習、掌握內涵定義和外延定義的方法,從文獻資料中提取術語的釋義、性質和應用等信息,并根據知識庫自動生成能夠反映科學概念本質特征的結構化定義,為后續的專家修訂提供參考,提高術語定義的效率。此外,ChatGPT技術還可以對比同一概念在不同領域的定義描述,確定本領域的概念界定條件和正確的“種差”“屬”,以確保生成的術語定義具有更高的科學性和系統性。

3.3 促進多語種對照

3.3.1 術語翻譯

從其他學者的評估來看,在生物醫學領域ChatGPT模型的多語種翻譯已經取得了良好效果[20]。按照全國科學技術名詞審定委員會制定的《科學技術名詞審定原則及方法》,在科技名詞規范化實踐中,需要附注與其概念相對應的英文名稱(必要時可加其他外文名稱)。傳統的科學概念的外語對照方法通常依賴于人工翻譯和詞典資源,難以適應日益增長的新術語和跨領域知識的需求。引入ChatGPT技術做跨語言模型的訓練,可用于完成多語種語義信息的分析任務,實現科學概念的多語種對照,為專家提供可信的譯名參考。值得注意的是,在涉及種族、宗教、文化等敏感問題的跨語言的術語翻譯時,仍需要專家不僅要考慮語言之間的差異和特點,還要充分考慮跨文化問題,以確?？萍济~規范化結果能夠符合不同的文化、知識結構和地域背景。

3.3.2 術語管理

在術語管理的工作中,更新和維護規范的術語數據庫是必不可少的任務,包括錄入、更新、監測和調用等各方面。引入ChatGPT技術支持下的自動化系統,可以有效地提升術語管理的效率和質量。使用對話式交互能力,這些系統能夠智能地與用戶進行術語檢索和推薦,同時根據用戶的反饋,實時調整和優化術語庫。此外,借助于人工智能的自我學習能力,系統能夠輔助檢查術語庫中存在的錯誤、不一致性和過時術語,并提供相應的修正建議。這為確?？萍济~規范化工作成果的一致性、權威性、科學性提供了強大支持。

3.4 提供新思路與方向

ChatGPT技術的實際應用不僅可以提高工作效率和準確性,還可以為科技名詞規范化發展提供新的思路和方向。

3.4.1 推導科技名詞規范體系

傳統的科技名詞學科體系制定通常依賴于專家的經驗和判斷,容易受到個人認知和主觀因素的影響。而基于深度學習的ChatGPT技術可以自動學習知識結構和語義關系,為科技名詞學科體系制定提供數據支持。例如,在制定某一領域科技名詞的規范體系時,可以利用人工智能分析該領域內大量文本數據,挖掘出共性和規律,形成科學合理的科技名詞規范體系。

科技名詞規范體系與學科體系稍有不同,前者通常需要首先考慮術語協調的問題。然而,基于深度學習的ChatGPT技術可以提供一個新的解決方案,通過自動學習知識結構和聚類分析,為科技名詞規范體系的制定提供強大的數據支持。舉例來說,當需要制定某一領域的科技名詞規范體系時,可以利用人工智能來分析該領域內的大量文本數據,從中挖掘出共性和規律,幫助實現更精確、系統的科技名詞體系的制定,提高制定效率,同時也能減少個人因素的影響,增強規范體系的科學性和權威性。

3.4.2 跨領域知識整合

科技名詞規范化實踐正向著前沿學科和交叉領域的方向發展,這需要更廣泛的跨領域知識的整合和共享。ChatGPT技術可以成為專家實現跨領域知識整合的強大工具。比如,可以使用ChatGPT技術來分析不同領域的語料庫,從中挖掘跨領域的術語關聯和科學概念的融合點,打破學科領域之間的壁壘,為推動科技名詞規范化工作的全領域覆蓋提供強大支持。

3.4.3 動態跟蹤發展趨勢

科學的認知是不斷深入的,科技名詞所承載的科學概念也是動態變化的,需要實時跟蹤和更新。傳統的科技名詞更新方式通常依賴于人工收集和整理,這往往難以滿足實時更新的需求。而基于ChatGPT技術可以實現動態追蹤科學認知的發展態勢,為科技名詞規范化提供即時的信息支持。例如,我們可以利用人工智能定期分析學術論文、專利文獻、技術報告等數據源,自動發現新詞應用的變化趨勢,從而為科技名詞規范化工作提供實時更新的基礎。

3.5 賦能宣傳普及

3.5.1 術語科普

通過運用ChatGPT技術可以根據不同的語境和目的,使用規范科技名詞生成不同風格和角度的內容,以適應不同的場合,例如科普文章、報告、新聞等。更為重要的是,ChatGPT技術具備生成交互式科普內容的能力,如問答、小測驗等,這種方式能有效提升用戶的參與度和學習效果,個性化引導受眾深入地理解和掌握這些專業名詞。當然,現階段還需要專家們對這些自動生成的內容進行審查、修改和補充,以保證科普內容的準確性、易理解性和適用性。此外,在籌備推廣活動或展覽中,利用ChatGPT技術可以協助制定活動方案和宣傳文案,提升科技名詞推廣普及的趣味性、創新性和多樣性。

3.5.2 術語培訓

借助ChatGPT技術強大的信息分析能力,可以量化學員的知識背景、興趣和需求,設計并開發出適合不同領域和層次的科技名詞培訓課程,以此來滿足學員的個性化需求,提升培訓效果。在課程設計階段,可以利用人工智能自動生成科技名詞解釋和示例,配合專家和教師共同編制教學大綱和教材,以實現內容的深度和豐富度。同時,ChatGPT技術具備提供實時反饋和答疑的能力,使學員在學習過程中得到及時的指導和幫助,為他們推薦最適合的資源和學習方法。通過將ChatGPT技術引入術語培訓中,我們能夠實現更高效、更有針對性、更加令學員滿意的培訓體驗。

3.5.3 對話系統

基于ChatGPT技術構建術語知識對話系統,可以通過自然對話方式和用戶互動,增加用戶對規范名詞的興趣和記憶,提高用戶的學習效率和效果,同時避免人工交流術語知識時可能出現的單向、晦澀、專業等問題。通過對話系統還可以收集用戶對科技名詞理解和使用的反饋,一方面可以統計分析用戶的知識背景、興趣和需求,智能推薦最符合需求的科技名詞,實現用戶的個性化服務;另一方面,還可以以此來跟蹤和評估科技名詞審定質量和推廣普及的程度,發現需要改進的地方。

4 ChatGPT技術在科技名詞規范化應用中的挑戰與對策

雖然ChatGPT技術在科技名詞規范化方面具有很大潛力,但客觀地說,ChatGPT技術處于發展的初級階段,在實際應用過程中面臨諸多風險和挑戰,只有充分認識和應對這些挑戰,我們才能充分利用這些技術。

4.1 數據質量和偏見問題

ChatGPT模型的性能和準確度在很大程度上取決于訓練數據的質量[21]。如果訓練數據中存在眾多的誤差、不一致或不完整的科技名詞,就可能會大幅影響生成的科技名詞規范化建議的質量。因此,在利用ChatGPT技術輔助進行科技名詞規范化時,我們必須保證訓練數據的質量和完整性,以避免數據質量導致的輸出結果不準確的問題。如果訓練數據中存在某種程度的偏斜或不平衡,就可能會導致規范化輸出的偏差和不公平。因此,我們必須在數據收集和模型訓練過程中考慮到數據的多樣性和代表性,以盡可能降低潛在的偏見和不公平現象。

4.2 語言歧義和領域專業性

自然語言處理中的語言歧義問題一直是一個棘手的難題,尤其是對于漢語,其語言特性使得歧義情況更加錯綜復雜。漢語中存在大量的多音字、同義詞和近義詞,以及詞語邊界模糊的情況。雖然ChatGPT技術擁有出色的語境理解能力,但在處理高度相似或含有多重含義的科技名詞時,仍可能產生誤判或不準確的結果輸出。這主要是由于當前的模型很難完全掌握復雜的語境,同時,對于領域專業性強的科技名詞,可能缺乏足夠的知識支持。因此,在系統生成輸出后,還需借助專家的審核判斷,以確保規范化輸出的精確性和專業性。

在高精尖的專業領域中,科技名詞的專業性和復雜性都極高,其含義和用法可能深奧難解。在實踐中,提升ChatGPT技術的領域適應性可能需要對模型進行有針對性的調整和優化,才能滿足不同領域科技名詞規范化的需求。

4.3 信息安全和隱私保護

利用ChatGPT技術的同時,必須警惕其可能產生的信息安全和隱私保護的風險[6]。潛在的攻擊者或許會濫用系統生成虛假或誤導性的科技名詞,散播虛假信息,給科技名詞規范化工作的準確性和可靠性帶來負面影響。此外,盡管在人工智能模型訓練過程通常會采取去標識化和匿名化的措施,但模型仍有可能從訓練數據中學習到與特定個體或組織關聯的信息,并在其生成的文本中無意中侵害個人隱私、知識產權或商業秘密,導致隱私泄露的風險。因此,在使用ChatGPT技術時要特別關注并尋找有效的解決方案,如實施更加嚴格的數據脫敏策略,建立安全的訓練和部署環境,設置嚴格的模型審查和驗證機制,確保用戶的身份認證和授權,并進行持續的安全漏洞監測和修復。

4.4 倫理與責任的挑戰

在ChatGPT技術的應用過程中,首先,需要重視倫理和責任問題[22-23]。我們需要審查和評估人工智能算法的公平性和透明性。例如,可以通過檢查算法的訓練數據和優化過程來確保其不會產生偏見。如果忽視這些問題,可能會影響ChatGPT技術在科技名詞規范化中的可信度和權威性。其次,還需要關注知識產權保護的問題。在使用ChatGPT生成科技名詞解釋和例子時,必須尊重原創研究成果,并避免侵犯他人的知識產權。只有建立嚴格的規則和監控機制,才能確保ChatGPT技術在科技名詞規范化的應用過程中,既能有效地滿足用戶的需求,又能遵守相關的法律和道德規范。

綜上所述,ChatGPT技術在科技名詞規范化方面面臨著諸多挑戰。在實際應用中,需要重點關注技術的局限性和風險點,以確保ChatGPT技術能在科技名詞規范化工作中發揮出持續且有效的積極作用。

5 未來發展趨勢與策略建議

在人工智能的發展浪潮中,ChatGPT技術作為一種前沿發展方向,正逐步改變人們的生活和工作方式,包括科技名詞規范化的實踐工作。對于這種先進的生產力,應鼓勵并引導其在科技名詞規范化工作中的應用,以充分發揮其在自然語言處理、內容生成和智能交互方面的優勢。將ChatGPT技術融入科技名詞規范化的各個環節,可以充分利用人工智能知識表示和推理的能力,從而在人類知識生產的過程中發揮綜合作用,顯著提升科技名詞規范化的效率和質量。

ChatGPT以及類似的人工智能技術將為解決科技名詞規范化工作的困境帶來全新的解決思路和手段。這些技術的引入將開啟一種全新的工作模式,這種模式將更加自動化、智能化、個性化和社會化。但人工智能的應用并非無懈可擊。為了應對這一變革,必須做好充分準備,以開放的心態擁抱新技術,享受新技術帶來的紅利。

5.1 健全資源體系

引入人工智能服務科技名詞規范化工作,我們需要大量的高質量的科技語料和關鍵詞表的資源體系,以及制定相應的標注、校對、更新和維護的標準。這個資源體系將成為保證科技名詞規范化工作質量和效率的基礎。目前國內外對于科技語言的資源體系建設還不夠完善,存在數據量不足、數據質量不高、數據分散、數據標準不統一等問題。這些問題終會影響科技名詞規范化工作的準確性和一致性。為了建立健全資源體系,需要從以下幾方面著手:(1)收集和整理各個領域和語種的科技文獻和專業詞典,構建多語言多領域的科技語料庫;(2)利用知識圖譜技術處理科技名詞與相關概念、屬性和知識的關系,形成術語知識體系;(3)建立和完善科技名詞規范化工作的評估和反饋機制,持續監測和改進資源體系的質量和效果。

5.2 優化和改進模型

加強新一代人工智能技術的應用,以推動科技名詞規范化的自動化和智能化,模型優化和改進至關重要?，F階段大語言模型針對高精尖領域的泛化能力并不強,需要針對特定的場景和需求進行模型的定制化和適應性訓練,提高模型的適應性,才能使其更好地應對不同領域和語言的科技名詞規范化需求。另外,由于科技名詞規范化工作涉及專業知識和標準規范,需要模型能夠給出清晰可靠的理由和依據,以增強專家們的信任度和滿意度。目前的模型還缺乏有效的解釋性機制,難以向用戶展示模型的內部邏輯和推理過程。后續需要通過研究和開發新的技術和方法,提高模型的可解釋性,以便研究人員和用戶更好地理解和評估其在科技名詞規范化過程中的表現和決策過程。

5.3 建立人機協作機制

科技名詞規范化需要運用大量的專業背景和領域知識來處理復雜的科學概念問題,人工智能和專家的協作機制將是關鍵。專家具有深厚的領域知識和經驗,而人工智能則能夠高效、并行處理大量的數據,并從中學習和提取有用的信息。為發揮人工智能和專家各自在實踐中的優勢,需要進一步完善人機協作機制。首先,需要建立一個反饋機制,讓專家能夠對人工智能的輸出進行評估和修正。這個反饋機制應該是雙向的,也就是說,人工智能也應該能夠向專家提供反饋,例如,指出哪些領域的知識需要更新或者哪些名詞的定義需要更清晰。其次,還需要建立一個持續學習的機制,讓人工智能能夠從專家的反饋中學習,不斷提高其處理復雜概念問題的能力。這個持續學習的機制應該包括監督學習和無監督學習兩種方式,以適應不同的學習場景。通過這種可控的人機協作機制,可以推動人工智能的發展,使其能夠更好地理解和處理復雜的科技概念,進而提高科技名詞規范化工作的效率和質量。

5.4 制定安全和共享政策

在使用人工智能技術進行科技名詞規范化的過程中,制定嚴格的安全措施和開放共享的政策至關重要。首要任務是確保數據的安全和隱私,這涉及建立精細的數據篩選系統,避免使用含有個人、敏感或版權信息的數據。同時,也需要制定全面的數據保護規定,明確數據處理的全過程,包括收集、存儲、使用、分享和刪除。防止數據丟失或篡改,需要有效的加密和備份手段。在保障數據安全的基礎上,推動科技名詞規范化成果的開放共享能夠充分實現其潛在效益。此外,積極參與制定全球人工智能輔助術語工作的相關標準,推動各國和地區在該領域的交流和合作,是實現這一目標的重要策略。

6 結語

本文通過全面深入地分析在科技名詞規范化領域ChatGPT技術的優勢、應用場景、風險挑戰以及未來的發展方向,得出以下幾點結論:

(1)ChatGPT技術在科技名詞規范化領域具有巨大潛力。運用這一技術可有效提升科技名詞審定的效率和準確性,推動多語種科技名詞的翻譯與對照,增強科技名詞審定成果的規范性和一致性,以及促進科技名詞的推廣普及應用。因此,ChatGPT技術有望成為科技名詞規范化領域的重要支持工具。

(2)盡管ChatGPT技術具有巨大潛力,但在實際應用中我們仍面對許多挑戰,包括數據質量與偏見問題、語言歧義和領域專業性、信息安全和隱私泄露、倫理責任等方面。為克服這些挑戰,需要在資源建設、模型設計及優化、機制政策等多個層面進行準備和防范。

(3)新一代人工智能技術作為先進的生產力,其在科技名詞規范化領域的應用是大勢所趨。堅定信心,盡快部署相關政策,鼓勵、引導并監管人機協作的工作模式是當務之急。將專家的專業知識、創新思維和經驗,同人工智能的數據處理、快速學習和高效率能力相結合,共同推動科技名詞規范化工作的跨越提升。

總之,隨著技術的持續演進和完善,新一代人工智能技術正在成為我國科技名詞規范化事業的強大推力。受篇幅所限本文未對技術實現展開詳細討論,在今后的研究中,筆者將持續關注ChatGPT技術的最新進展,積極探索專家與人工智能緊密協作的工作模式,為我國科技名詞規范化事業的高質量發展做出積極貢獻。