?

人工智能新時代下教學改革的新思考

2024-03-04 09:00翟紅林張曉昀曹晶晶
大學化學 2024年1期
關鍵詞:信息學化學人工智能

翟紅林,張曉昀,曹晶晶

蘭州大學化學化工學院,蘭州 730000

關鍵字:人工智能;化學信息學;教學改革與實踐

自從2017年5月圍棋系統AlphaGo機器人以3 : 0擊敗了當時的世界圍棋冠軍以來,人工智能的理論、技術與應用進入了一個蓬勃發展的新階段。特別是,ChatGPT-4的推出引發了人們極大的震撼。大數據、大算力、大模型所導致的智能涌現使得人工智能從傳統的辨識模式走向了生成模式,因而受到了高度的關注。有人為此歡呼,有人感到恐慌。毋庸置疑的是,人工智能的快速發展已經在不同層面、不同程度上影響著人們生活、學習及工作的思維和習慣,不僅正在深刻地改變著科學研究的范式,也必然地促使我們對現代科技人才的培養進行新的思考。

1 人工智能與機器學習

人工智能(Artificial Intelligence,AI)是指用于模擬、延伸和拓展人類智能的理論、方法與技術,其本質特征在于,基于已有的信息資源、采取復雜的數據挖掘算法建立可用于預測分析的數學模型。機器學習(Machine Learning, ML)則是實現人工智能最重要的策略之一,其發展可大致分為三個層面(圖1):

圖1 人工智能發展的三個層次

1) 基于有限樣本數據、主要采用數理統計等方法建立預測模型。從數據的預處理、特征信息的提取到模型的建立等各個環節與步驟均由人工完成設計,機器僅“依計而行”,也被稱為淺層機器學習。

2) 利用大量樣本數據、以人工神經網絡(Artificial Neural Network, ANN)為主要基礎的復雜模型建立。機器能夠通過自己的學習實現從原始數據中完全自動地篩選、提取所需的特征信息并完成與目標的映射關聯,因而也被稱為深度機器學習(簡稱深度學習,Deep Learning, DL)。

3) 采用海量的大數據樣本、以深度學習為基礎建立大型或超大型模型。大模型不僅可以更加精準地辨識、預測目標,而且還可以通過自主的學習去探索更大的信息空間而具備新的技能,即具有生成特性。其在諸多領域的應用取得了前所未有的突破,對人類生產與生活的眾多方面帶來變革性影響,也讓人們再一次感受到了危機。

2 人工智能對化學研究的變革

傳統認知上,化學工作是在有試管、燒瓶、分析儀器等等的實驗室中進行的,而化學研究則是“Chem-is-try”。然而,受益于量子化學與分子力學的發展,以理論計算與模擬為主的計算化學(Computational Chemistry)取得了長足的進步,不僅能夠從分子、原子水平對實驗結果加以解釋、提供理論支撐,而且還可為更加高效地開展實驗工作提供有益的指導。另一方面,各種數理統計的建模與分析方法也被大量地應用于化學信息的挖掘,以揭示化學變化的內在規律、助力化學實驗研究。本質上,無論是理論計算與模擬還是統計建模與分析,都可歸屬于各種機器學習方法與技術在化學研究中的應用。不可否認的是,隨著大數據的快速擴充、大算力的持續增強、人工智能大模型的不斷涌現,基于實驗和物理模型的化學研究與基于機器學習的人工智能正逐漸進入深度的融合。

例如在合成化學中,采用逆合成分析法進行合成路線的設計是最常用的策略。然而,即便是具有豐富經驗的合成化學家也難以完全掌握并清晰記住數不勝數的化學反應。盡管借助化學文獻數據庫(如Reaxys),化學家們只需通過分子結構、化學反應的輸入便可篩選并設計出可能的合成路線,但要發現真正適合的、高效的合成反應新路線,仍然要依賴于化學家的知識與經驗。計算機輔助合成路線設計(CASP)的研究由來已久[1],并取得了可喜的進展[2]。2016年,韓國蔚山國家科學技術學院(UNIST)公布了一款名為Chematica的逆合成分析軟件(現已更名為Synthia?)[3];經過不斷的改進與訓練,該軟件可用于設計復雜天然產物的全合成路線,并且已在實驗室中成功地驗證了其中的三種合成方法[4]。2018年,上海大學和德國明斯特大學的研究人員報道了一款設計分子合成路線的人工智能新工具,只是基于已經報道的單步反應即可自行學習化學轉化規則,并進行快速、高效的逆合成分析[5]。2019年,麻省理工學院(MIT)研究人員研發了一種結合人工智能方法設計合成路線及機器人執行的自動化合成平臺,能夠為設定的目標分子提出多條合成路線及其反應條件等,并根據合成的步數及預測產量推薦最佳路徑;同時,該平臺擁有一個靈活的機器人手臂,可執行所有合成操作流程、實現自動化合成,已成功用于15個化學小分子藥物的合成路線設計和自動化合成[6]。同年,英國格拉斯哥大學的Leroy Cronin課題組采用Chemputer系統進行三種藥物的合成,其產率與文獻報道的人工合成相當[7]。2020年,利物浦大學Andrew I. Cooper課題組研發的自動化合成機器人在八天內進行了688次連續反應(圖2),發現了光解水產氫的光催化劑[8]。2023年,中山大學陳語謙團隊依據反應轉化的簡易機理提出了一種基于圖神經網絡的Graph2Edits,用于逆合成預測[9]。當然,相對于合成化學的復雜性、藝術性而言,目前的人工智能還難以滿足人們所有的需求。

圖2 自動化合成機器人

盡管尚處于起步階段,以生成式為主要特征的大模型構建與應用成為了人工智能發展的重要方向?;瘜W的魅力之一在于不斷的發現與創新,但以往的研究思路仍然局限于已知的化學事實,而這僅僅是化學信息空間中極其有限的一小部分。由于能夠突破原有訓練樣本數據的局限而探索更大的信息空間,基于各種變分自動編碼器(VAE)的生成式模型已經在分子設計與優化[10,11]、化學反應研究[12]、材料發現[13]等方面顯示出了巨大的應用前景。

2021年5月,上海交通大學聯合Science雜志發布了全球最前沿的125個科學問題(“125 questions:Exploration and discovery”)。其中第10個問題是,人工智能會重新定義化學的未來嗎?(Will AI redefine the future of chemistry?)

該來的終究要來,誰也阻擋不了時代前進的腳步。

3 人工智能新時代下的人才培養

2007年,圖靈獎得主Jim Gray在NRC-CSTB大會上提出了科學研究的四類范式[14]:實驗科學是第一范式,在研究方法上以歸納為主,帶有較多盲目性的觀測和實驗;理論科學是第二范式,偏重理論總結和理性概括,在研究方法上以演繹法為主;計算科學是第三范式,主要根據現有理論的模擬仿真計算,再進行少量的實驗驗證;數據密集型科學即第四范式,以大量數據為前提,運用機器學習等數據挖掘技術從大量已知數據中探索未知(圖3)。

圖3 科學研究四范式

顯而易見,現代科技發展隨著人工智能新時代的到來已經進入到了第四范式,而化學研究則全面覆蓋四個范式,形成了以實驗、理論與計算三方面相互支持與促進的新特點。因此,對人才的培養提出了更新、更高的要求,主要體現在以下三個層面:

(1) 注重信息素養、迎接AI挑戰。

信息素養不僅僅是指能夠進行計算機搜索、百度搜索、網上購物、智能支付等日常的簡單操作,還應該在更高的水平上更深入地理解信息獲取、轉化、加工及應用的思維特點與技術實現,把握信息技術的優勢與風險,并將其合理應用、有效地融入到生活與工作之中。這種思維習慣只能通過多維度、多層面的反復錘煉而養成。在這個大數據、大模型的新時代里,良好的信息素養已經成為現代專業人才極其重要的基本技能之一。因此,必須更加注重學生信息素養的提升,并貫穿于所有的教學活動之中。特別是面對AI大模型,要順應時代的發展,引導學生迎接AI的挑戰。

雖然AI技術的發展與應用讓人瞠目結舌,但我們也應該清楚地認識到,真正的智能是以理解、分析為基礎的感知與決策,而非僅僅是數據的驅動!人類決定性的主導地位難以憾動。當然,隨著AI技術的不斷進步,越來越多基礎性、事物性甚至具有一定智力性的工作會由作為助手的AI取代完成;未來化學領域的AI應用可以將研究人員從繁瑣的手工勞動中解放出來,使之有更多的時間和精力開展更高端的研發與創新。因此,AI技術的發展與應用不是人們躺平的理由,而是對人的能力提出了更高的要求??梢灶A見到的是,AI加持下人所表現出來的能力才是新時代里最為重要的能力。

(2) 更新教學思維、優化教學體系。

盡管我們都認同“授人以漁”、問題導向等教學理念,然而在實際的教學過程中卻太多地關注了知識體系完整的傳承,唯恐遺漏了某些重要的知識點而虧待了學生,從而導致了目前的教學體系大多仍以知識匯集為主。孰不知,知識是在源源不斷地產生與更新的,學無止境;僅就掌握知識而言,人類難以超越經過訓練的AI模型。能力的培養的確離不開知識點的支撐,但并非知識的豐富就直接等同于能力的高強。

教學講授不同于學術報告,其關注點與方式方法各有不同。學術報告須體系完整、細節清晰;教學工作則必須要遵從人的認知規律、知識的傳授應該是為學生思維的發展而服務的。我們以為,通過精心選取、有效組織少量的、必要的知識點為作支撐,著重于理論與方法、思考與判斷的講授及訓練,引導學生自行延伸到其它更多相關的知識點。這樣,不但可以減輕教與學的負擔、緩解教學內容多與教學時數少的矛盾,更有利于激發、提高學生的學習熱情和學習能力,拓展學科的交叉,提高教學效率。當然,這種新型教學體系的構建與優化是一個涉及多學科、多課程的系統工程,不僅要破除各學科課程間的人為界限,更需要加強思維發展的綜合訓練。這是教學改革中最重要、也是最大的改革方向,對教師的專業水平與教學能力提出了更高的要求。

(3) 運用AI工具,助力教學改革。

習總書記強調,“中國高度重視人工智能對教育的深刻影響,積極推動人工智能和教育深度融合,促進教育變革創新”。國務院印發的《新一代人工智能發展規劃》,明確利用智能技術加快推動人才培養模式、教學方法改革;教育部出臺《高等學校人工智能創新行動計劃》,并先后啟動兩批人工智能助推教師隊伍建設試點工作。7月8日,2023年世界人工智能大會教育論壇在世博中心舉行,主題為“引領學習變革 智創教育未來”??梢钥隙ǖ氖?,人工智能技術的發展與應用將為教育教學改革提供巨大的空間及技術支撐;“人工智能+教育”在教、練、考、評、管等各環節會不斷碰撞出新的火花,將加速實現更加個性化、精準化、高效化的教育教學,為人才創新培養注入強勁動能。作為教師,我們必須積極順應AI發展、充分學習并利用AI技術助力教學改革,以滿足現代人才培養的需要。

在未來,AI不會取代教師職業,但很可能會取代不懂運用AI的教師。

4 《化學信息學》課程教改的探索與實踐

化學信息學作為化學專業人才培養的重要組成部分,一直受到我院的高度重視。隨著入學大學生信息水平與能力的提高及信息技術類課程體系改革的深入,根據學院人才培養目標及化學信息學的發展,我們通過合并、撤換相關課程及內容,重新組建了《化學信息學》課程的教學體系[15]并編寫出版了相應的本科生教材[16]?!痘瘜W信息學》內容繁多且涉及多學科的交叉,屬化學專業信息素養類課程。經過幾年的教學實踐,針對《化學信息學》課程的特點,我們進行了多方探索并取得了良好的教學效果:

(1) 關注最新動態——追蹤前沿。

化學信息學是信息學等相關技術與方法在化學領域中的應用,而新技術、新方法、新思維的不斷出現,特別是各種AI大模型的持續推出,對化學學科的發展產生巨大的影響。作為《化學信息學》課程的教學,必須關注信息學方法及其在化學等領域中應用的研究進展及最新成果,并及時將其吸納、融入到課堂教學之中,引領學生不僅了解信息技術的最新發展與應用,而且能夠逐步地、更加深刻地認識與理解科技發展新時代下化學研究的新特點與新范式。如,隨著ChatGPT-4的推出,適時地在課堂教學中介紹人工智能的新發展及其在化學研究中的新應用,引導學生緊跟時代發展,同時避免認知中的各種誤區,正確理解AI大模型的運用及注意防范其帶來的風險等。

(2) 提升信息素養——思維發展。

充分關注學生信息分析思維的建立、拓展及對信息處理的基本方法與工具的了解與掌握。在建模分析中,要讓學生認識到從一階數據到二階數據可以描述更多、更全面的化學信息,同時也包含了更多的干擾。在數據處理方法上,從較為簡單的一階數據線性回歸(多元、逐步、主成分、偏最小二乘等)入手,結合化學信息獲取技術的進步,擴展到針對二階數據發展起來的多道偏最小二乘、平行因子分析、多元曲線分辨-交替最小二乘等建模方法,再拓展到人工神經網絡、深度機器學習。在分子模擬的教學中,使學生能夠理解不同的基組、力場是基于不同的代表性樣本集、通過不同的建模方法而獲得,因而具有相應的適用體系及預測精度。通過教學使學生體會到建模分析的本質就是通過數據操作對化學信息進行變換以利于獲得內在的關聯或規律;人工智能、機器學習等各種模型的建立與應用乃至科學研究的基本思路與方法都類似于一個人的成長。所不同的是,人的成長是基于多層面、各角度、大跨度對社會與自然的綜合感知與訓練。

(3) 研究內容特點——分類施教。

化學信息學屬多學科交叉,其特點之一是內容繁雜。在教學中,我們仔細地研究了不同內容具有的特點,采取不同的教學方式。如,對于化學信息學的起源與發展,采用在學生自行查閱相關資料的基礎上,通過歸納總結引導學生理解科技的進步是需求與技術雙輪推動的結果;在化學文獻計算機檢索部分,以學生實操教學為主,使學生在熟悉網站資源的同時,理解并掌握關鍵字檢索與引文檢索兩大策略的特點與優勢;在數據處理教學模塊中,重點講解化學信息的數據組織形式、處理與分析方法之間的關系及其實現,培養學生從實驗、數據處理到結果分析的探究思維能力。此外,我們充分利用網絡資源、線上教學平臺、微信教學群等以實現不同教學內容的特性化教學。

(4) 加強實操訓練——學以致用。

《化學信息學》課程的教學目標就是要在建立并強化學生專業信息素養的同時,進一步提升信息處理的能力,因而具有較強的工具類課程特征。通過實操訓練,使學生易于理解相關的理論與方法。如在建模分析的課堂教學中,以Excel應用為主、MATLAB函數調用為輔加以實現,同時也鼓勵學生使用他們熟悉或易學的SPSS、Python等工具。在ChemOffice及HyperChem軟件的教學中,除了分子結構、化學反應式等的繪制外,通過分子優化、單鍵旋轉自由能變化、LUMO與HOMO能量、光譜模擬等計算,學生對于分子空間位阻、前線軌道理論、能級躍遷等有了更加形象、直觀的認識,為相關課程的學習提供支持。與此同時,我們還注意將化學信息學的技術方法擴展到其它領域以拓寬學生的視野與思維、加強多學科知識的融合。如,主成分分析方法不僅可以用于化學數據,還可以用于諸如大學排名、單位績效考核、城市綜合實力評價;因子分析方法還可應用于大氣污染物的溯源;聚類與判別技術可用于新冠等諸多疾病的診斷等等。

對學生而言,掌握了有效的、好用的工具,就是為理想的實現插上了翅膀。

(5) 多種考核形式——全面客觀。

根據不同教學內容的特點,采用不同的考核形式;在真實反映學生學習情況的同時,也引導、促進學生的學習。我們目前采用的考核形式主要有課堂提問(檢查預習)、隨堂測驗(檢查聽課)、課后作業(復習、鞏固與思考)、討論課(拓展思維)、翻轉課堂(檢查課外小組學習成果)、課程小論文(考查信息處理綜合能力)及期末考試等,實現過程性、階段性學習的全面評價。另一方面,在對學生的考核過程中,教師也對教學工作進行不斷地分析與反思并加以及時的調整;力爭做到在因材施教的同時,對《化學信息學》課程體系進行不斷的完善與優化。

5 結語

人工智能的發展無論是對人們的生活還是化學工作者的科研都必將產生深遠的影響。在歷次科技革命中,最終受益的都是敢于創新和擁抱變革的人,而那些忽視和拒絕接受改變的人,其結局往往會被時代拋棄。人工智能新時代的到來既是挑戰、更是機遇:對于人才培養而言,信息素養的提升及思維能力的增強愈加重要;作為教師,要不斷更新教學理念與思維、建立合理的課程體系,積極探索AI技術在教學活動中的應用,助力教學改革。

猜你喜歡
信息學化學人工智能
雞NRF1基因啟動子區生物信息學分析
2019:人工智能
初論博物館信息學的形成
人工智能與就業
數讀人工智能
奇妙的化學
奇妙的化學
奇妙的化學
奇妙的化學
下一幕,人工智能!
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合