?

人智交互新體驗:基于ChatGPT的學術問題求解過程分析

2023-04-20 04:14李子運
電大理工 2023年4期
關鍵詞:學術人工智能文本

李 悅 李子運

(江蘇師范大學,江蘇徐州 221000)

0 引言

人工智能已然成為當今最熱門的研究領域之一,在人工智能的眾多應用領域中,自然語言處理技術顯得尤為重要。自然語言處理是(Natural Language Processing,NLP)指將人類自然語言轉化為機器可讀的形式,以便計算機可以理解和處理,而且自然語言處理研究實現人與計算機之間用自然語言進行交流的各種理論和方法,是計算機科學領域與人工智能領域中的一個重要方向[1]。人工智能寫作也是人工智能發展的重要產物,按照其智能化程度可以進一步細分為自動寫作和輔助寫作[2]。在這方面,ChatGPT 預訓練語言模型因其優秀的表現在學術問題求解過程中備受關注。

20世紀60年代,人工智能領域的第一次發展高潮出現,孕育出自然語言處理和人機對話技術。70 年代開始,基于統計的方法逐漸代替了基于規則的方法。90 年代中期以來,計算機的運行速度和存儲量大幅度增加,為自然語言處理技術的飛速發展提供了硬件基礎[3]。本文通過對ChatGPT 在學術問題求解過程中的應用進行分析,探討其實現過程、應用效果和未來發展方向,為研究和應用ChatGPT 在學術問題求解領域的讀者提供參考和借鑒。學術問題的解決是科研工作者和學者生活中重要的研究行為。依托于人工閱讀大量的書籍文獻和資料,不僅費時費力,而且會很容易出現漏洞,Chat-GPT 作為自然語言處理領域的一個重要模型,其在解決學術問題中具有獨特的優勢。

1 ChatGPT 模型的基本原理、特點與應用

ChatGPT 是一種由OpenAI 所推出的基于Transformer 結構的預訓練語言模型,它在2018年被首次提出,目前已經發展到了第三代。

與傳統的神經語言模型不同,ChatGPT 利用了Transformer 結構中的自注意力機制,能夠更好地捕捉句子中的上下文關系。ChatGPT 模型的預訓練過程主要分為兩個階段,分別是語言建模和文本生成。在語言建模階段,模型使用海量的未標注文本數據進行訓練,學習對語言的理解。在文本生成階段,模型通過對一個給定的前綴文本進行自動生成,進一步提高其語言生成的能力。而且,ChatGPT 在自然語言處理中也有著廣泛的應用,如文本分類、情感分析、機器翻譯和問答系統等。與此同時,在學術領域中,ChatGPT是基于transformer模型的一種自然語言處理技術。該技術主要包括三個部分:輸入編碼、transformer 模型和輸出解碼。輸入編碼主要負責將輸入的自然語言文本進行編碼,轉換為計算機可以理解的向量形式;transformer 模型主要負責對輸入的文本進行理解和推理,并生成相應的輸出;輸出解碼主要負責將輸出向量轉換為自然語言文本,使得用戶可以方便地閱讀和理解。

語言文化存在著差異,當前市面上混雜著各式各樣的單一語言的系統軟件。在任何一種系統中,開發多種語言字體的支持環境勢在必行。這不僅滿足國際化市場的需要,也是系統軟件自身發展的趨勢[4]。由于ChatGPT 在預訓練階段就是采用的無標注的文本數據,所以能夠很好地適應不同語種的文字。因此,ChatGPT在跨語言、跨文化的傳播方面有著巨大的潛在價值,將會使其在更廣闊的領域中得到更多應用。

ChatGPT 可以用于對話系統中,通過生成自然語言來回答用戶的提問,實現智能對話。比如,可以使用ChatGPT 來構建聊天機器人,實現智能客服、問答等場景。也可以用于生成代碼。例如,可以輸入自然語言描述的任務要求,ChatGPT 會生成相應的代碼,自動實現任務。但也只限于文本式的輸入形式,無法達到對圖片類數據的識別和解析。

智能問答系統是一種能夠理解用戶提出的用自然語言表述的問題,并能夠自動、準確地給出用戶答案的軟件系統[5]。ChatGPT 便是一個基于自然語言處理技術的問答系統,可以回答用戶的各式各樣問題。

它的應用場景包括但不限于以下幾個方面:一是常識性問題:ChatGPT 可以回答與日常生活、科技、文化等領域相關的常識性問題,例如“太陽為什么會發光?”“中國的首都是哪里?”二是搜索性問題:ChatGPT 可以根據用戶的提問,在網絡上搜索相關的信息,并給出相應的答案,例如“如何瘦身?”“如何學習編程?”三是對話式問題:ChatGPT 可以與用戶進行自然的對話,例如“你好”“今天天氣怎么樣?”四是語言翻譯:ChatGPT 可以將一種語言翻譯成另一種語言,例如將英文翻譯成中文或者將中文翻譯成英文等。

總之,ChatGPT 是一款功能強大的問答系統,其經過大量的語料庫訓練,具有廣泛的知識儲備,能夠對多領域的問題進行回答,可以為用戶提供全方位、多樣化的信息和服務。

2 學術問題求解過程

2.1 問題提出

問題提出是學術問題求解過程的第一步。在這個環節中,需要明確問題的研究領域和問題的具體內容。而問題理解的關鍵在于問題語義特征的提取和表示,以此來明確用戶所提出的自然語言問題的真實意圖[6]。ChatGPT 擅長于理解自然語言,并能夠提供與之相關的信息,但它需要用清晰、精確的語言描述準確的問題才能提供有效的回答。而且,在輸入問題之前,用戶需要對所詢問的問題進行足夠的思考,并盡可能提供其詳細的背景信息,只有這樣Chat-GPT 才能給出有用的答案。此外,ChatGPT 可能會對問題進行重述,以確保它正確理解了用戶的意圖。問題重述通常是為了使問題更加清晰,或者以不同的方式表達問題,以提高回答的質量。例如,一個關于人工智能的問題可能是:“人工智能技術的現狀和發展趨勢是什么?”

2.2 語言理解

在問題提出后,需要對問題進行語言理解,將問題轉化為機器所能夠理解的形式。在自然語言處理幾十年的發展歷程中,文本表示方法經歷了從離散符號表示到連續向量表示的體系轉變[7]。而ChatGPT 是一種基于神經網絡的自然語言處理模型,它使用深度學習技術進行語言理解。具體來說,ChatGPT 是一種預訓練語言模型,它在大規模的文本數據集上進行訓練,以學習自然語言的規律和結構。當用戶輸入一個問題時,ChatGPT 首先將其轉換為一個數字向量表示,并將其輸入到模型中。具體體現為:ChatGPT 使用詞嵌入技術將文本中的單詞或子詞(例如字母、詞根)映射到向量空間,以便模型能夠理解詞匯。然后,文本通過多層編碼器(通常是Transformer 編碼器)來捕獲不同層次的語義信息。編碼器是深度神經網絡的一部分,它將輸入文本的每個位置上的詞嵌入進行組合,以捕獲上下文信息。

模型還通過多個自注意力層和前饋網絡層對輸入進行處理,以學習輸入序列中的上下文信息和語言規則。模型還可以考慮先前的對話歷史或上下文信息,以更好地理解用戶的問題。除此以外,在進行語言理解時,ChatGPT 還可以使用其他技術來提高其性能。ChatGPT 可以使用語言模型微調技術來進一步改進其對特定任務或領域的理解能力。還可以使用預處理技術,例如分詞和去除停用詞,以減少輸入數據中的噪聲和冗余信息,從而提高模型的準確性和效率。例如,ChatGPT 輸入“人工智能技術的現狀和發展趨勢是什么?”是機器無法理解的語言組織形式,可以將其改成“請描述人工智能技術目前的狀態和未來的發展趨勢?!?/p>

2.3 知識檢索

在語言理解后,需要對問題進行知識檢索,獲取與問題相關的知識和信息。ChatGPT 是一個基于機器學習的自然語言處理模型,它的知識來自于被訓練時接觸的文本數據。在訓練期間,為ChatGPT 提供了大量的文本語料庫,例如維基百科、新聞報道、互聯網上的博客和論壇等,以學習和理解自然語言。在處理用戶的問題時,ChatGPT 會使用一種稱為“前饋神經網絡”的技術。用戶可以輸入檢索內容,經過語義理解將輸入內容轉化為機器可識別的內容[8]。這種技術將輸入的文本轉換為數字形式,然后使用預先訓練好的模型來預測最可能的答案。ChatGPT 可以根據用戶提供的關鍵詞、問題或查詢來執行基本的關鍵詞檢索操作。它可以搜索其預訓練的文本語料庫,找到包含相關關鍵詞的文本段落或句子。接著,ChatGPT 可以從檢索到的文本中提取信息、事實或知識。它可以分析文本并識別其中的關鍵信息,然后將這些信息組織為回答問題或生成響應的一部分。

模型的預測基于其先前接觸的文本數據,以及對文本數據的理解和上下文的理解。當用戶提出問題時,ChatGPT 將嘗試在其訓練數據中找到最相關的信息,并利用這些信息來生成一個回答。如果ChatGPT 無法找到相關的信息,則它可能會給出一個無法回答的答案或者詢問用戶是否需要更多信息。因此,ChatGPT 的知識檢索和回答生成能力是由其訓練數據的質量和數量決定的。針對此類問題,可以通過搜索引擎或學術數據庫等途徑獲取與該問題相關的研究文獻或知識點。

2.4 答案生成

知識檢索后,需要將獲取到的知識和信息進行答案生成,得到與問題相關的答案。在這個過程中,ChatGPT 模型可以通過生成式方法或選擇式方法進行答案生成。這是通過深度學習模型和自然語言處理技術實現的,通常使用遞歸神經網絡(如Transformer)的結構來生成自然語言文本。而且ChatGPT 提供的回答可能包含多個信息來源和角度,需要仔細解讀并理解。如果回答不夠清晰或者不符合預期,可以嘗試重新提問或者重構問題,以獲得更準確和有用的回答。

在進行答案生成時,ChatGPT 可以利用各種技術來提高其性能和效果。例如,ChatGPT可以使用文本生成微調技術來進一步改進其生成答案的能力。而且ChatGPT 還可以使用多模態數據,例如圖片和語音,來生成更加豐富和全面的回答。同時,ChatGPT 還可以使用多語言技術來支持不同語言的輸入和輸出。需要注意的是,ChatGPT 的答案生成能力是有限的,它通常依賴于其預訓練模型中包含的知識。對于一些問題,可能需要結合ChatGPT 與其他知識庫或外部信息源,才能提供更全面的回答。此外,答案生成還需要模型在不斷微調和改進中不斷發展,以提供更高質量的回答。

2.5 結果評價

最后,需要對答案進行評價,判斷答案的準確性和完整性。評價可以基于人工標注、自動評價指標等多種方式進行。例如,對于上述問題,“請描述人工智能技術目前的狀態和未來的發展趨勢”,可以通過專家評估或自動評價指標,判斷生成的答案是否準確、完整。同時,用戶也應該需要使用多個來源渠道和資源驗證答案的準確性和可靠性。除此以外,還可以通過收集用戶反饋來評估ChatGPT 對問題回答的質量。用戶的滿意度和反饋可以提供有價值的信息,幫助改進模型的性能。

對于生成問題的答案需要多方考證,而ChatGPT 作為人工智能發展到一定程度的產物,其為教育評價提供虛擬開放的評價空間、人人平等的評價思維、數據互通的教育評價平臺等。最重要的是,人工智能時代的教育評價應該消除主體單一、錯位等不利影響,激發多元評價主體參與的積極性[9]。與此同時,教育教學依據收集到的數據和設計好的評價指標建立符合實際情況的評價模型,綜合運用算法建模和數據挖掘等技術對學生的學習成果和表現進行量化評價[10]。然而,我們也需要認識到,ChatGPT在各領域中的應用尚處于初始階段,技術的作用并未得到充分發揮,也并沒有實現真正意義上的人工智能。因此,要實現人工智能對于學術問題求解的應然之態,還需要夯實人工智能時代技術發展的支撐體系。

綜上所述,ChatGPT 在學術問題生成過程中其嚴密的步驟促進了答案的有效性和準確性。雖說ChatGPT 作為人工智能系統的功能性價值彰顯已經無需贅述,但其是否具有原本意義上的價值生成和價值創造的意義仍需討論。盡管ChatGPT 在一定程度上加深了人類對于社會和未知事物的理解,但我們仍需考慮新一代人工智能所存在的倫理道德隱患以及其可能對社會各方面所產生的影響和變革,將其更好地與社會結合起來,打造一個更加和諧的人工智能時代。

3 應用策略建議

本文基于ChatGPT 模型,通過提出學術問題求解的案例,分析其在學術問題求解中的優勢和不足。ChatGPT 模型具有快速、自動化回答問題,廣泛的知識庫,靈活性等優點,但也存在模型精度不夠高、受限于知識庫、無法進行推理和思考等不足之處。在實際應用中,我們需要結合其優勢和不足,進行科學合理的使用,以提高學術問題求解的效率和準確性??蓮囊韵氯齻€方面進行改進。

3.1 技術干預修正

可以考慮通過增加知識庫的規模和豐富度,提高知識的覆蓋廣度和深度;同時,也可以考慮引入多模態信息(如圖片、視頻等),豐富問題和答案的表現形式和內容;可以將該方法應用到其他更廣泛的領域,如醫學、法律等,滿足人們對于知識的更多需求;還可以進一步探索如何將基于ChatGPT 的學術問題求解方法與人類專家相結合,提高答案的可信度和權威性。例如,可以將模型生成的答案交由人類專家進行審查和評估,以確保答案的正確性和可靠性。另外,ChatGPT 模型還可以通過增加數據集、優化模型結構等方式進一步提高模型的性能和效果,從而更好地滿足學術領域的需求。此外,還可以考慮將該方法與在線教育、知識圖譜等技術結合,打造更加完整和全面的知識服務平臺??傊?,基于ChatGPT 的學術問題求解方法具有很大的應用潛力和推廣價值,未來可以進一步完善和優化,滿足人們對于知識獲取和解決問題的更多需求。

3.2 倫理風險規避

在訓練和微調ChatGPT 模型時,確保使用的數據集是清潔和合法的,排除不當、惡意或不符合倫理規范的數據。定期審查和監控模型生成的內容,以檢測并糾正不當內容,把控數據的過濾和審查工作。實施文本生成的限制,以確保生成的內容符合倫理標準。這可以包括設置最大文本長度、添加關鍵詞過濾、限制敏感內容的生成等,有助于防止不適當的內容生成。與此同時,ChatGPT 的運行應該是透明的,用戶應該了解它是一個自動化生成模型,提供有關模型如何工作的信息,以增加用戶對模型操作的信任。社區和利益相關者提供模型的信息,包括數據來源、訓練方法和微調策略。公開透明性可以幫助評估模型的倫理合規性。更重要的是,在部署ChatGPT 時,建立審查機制,對生成的內容進行人工審查或監督學習。審查員可以干預模型生成的內容,以確保符合倫理和法律要求。

3.3 評價體系分級

由于讀者對快餐化出版物的強烈需求,機械式出版物的大量出現已經是大勢所趨,這是彌補出版市場空缺的一個新的增長點。但是,機器生成內容主要基于已有的數據和模式,而不具備創造新知識的能力。這意味著機器生成的內容可能會顯得相對缺乏創意和原創性。為了使機器生成的內容能夠更好地與傳統人類出版物競爭,確實需要制定兩套評價體系,以改善機器生成和人類創作的現狀。評價體系分級將有助于確保機器生成內容的質量,并為出版業提供了一種與傳統出版物并存的途徑。機器生成內容可以填補市場空白,但也需要以更高的標準來評估和監管,以滿足讀者和行業的需求。同時,這也促使內容創作者更好地使用技術,以創造更有價值的出版物。此外,還可以考慮制定專門的評審標準和建立相關的認證機構,以確保內容的質量和合規性。這將有助于創造一個更公平和透明的出版市場,同時鼓勵創造性思考和知識傳播。

4 結束語

當今時代,隨著人工智能愈演愈熱,Chat-GPT 一經面世便對各領域產生了顛覆性影響,現有研究對其進行了全面剖析,并取得了一系列有價值的研究結果。本文基于人智交互視角,對ChatGPT 的學術問題求解過程進行研究,發現該項人工智能技術仍不成熟,存在著知識有限、缺乏深層情感理解以及風險偏好等問題。因此,作為ChatGPT 等智能工具的創造者、使用者,人們要秉持“科技向善”的理念,持續改進技術,提高自身在利用人工智能生成技術上的專業素養,積極參與人工智能技術、數據挖掘等領域的專業培訓,要主動與其他部門或學科協作,應對挑戰,未雨綢繆,制訂規劃,為發展創造有利條件,使ChatGPT 能夠更好地服務人類。

猜你喜歡
學術人工智能文本
如何理解“Curator”:一個由翻譯引發的學術思考
在808DA上文本顯示的改善
對學術造假重拳出擊
2019:人工智能
基于doc2vec和TF-IDF的相似文本識別
人工智能與就業
數讀人工智能
下一幕,人工智能!
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何快速走進文本
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合