?

文獻計量視角下學習分析的研究熱點與趨勢分析*

2023-03-02 00:59許佳欣
廣西廣播電視大學學報 2023年6期
關鍵詞:圖譜聚類領域

元 帥 許佳欣 黃 煥

(1.湖北第二師范學院 計算機學院,湖北 武漢 430205;2.基礎教育信息技術服務湖北省協同創新中心,湖北 武漢 430205;3.中南民族大學 教育學院,湖北 武漢 430074)

學習分析技術作為教育技術領域的新技術,融合了教育學、心理學、計算機科學與技術、人工智能等多學科知識[1],是交叉學科研究的熱點,也是技術賦能教育的重要體現。2011 年,首屆學習分析技術與知識國際會議將學習分析定義為“測量、收集、分析和報告有關學習者及其學習情景的數據集,以理解和優化學習及其發生情景”。十多年來,它一直受到相關領域研究者的密切關注,并有力地推動教育數字化轉型和教育評價改革。近年來,我國教育數字化的發展,進一步推動了對學習分析的研究與發展。本研究對中國知網2013-2023 年北大核心期刊中有關學習分析的文獻進行可視化分析,旨在了解學習分析技術的研究現狀和熱點,總結學習分析的發展階段,并在此基礎上預測其未來發展趨勢,為相關研究和實踐提供參考依據和經驗借鑒。

一、研究設計

(一) 研究方法

本研究采用關聯分析、社會網絡分析、聚類分析、知識圖譜、共現網絡分析、統計分析等方法對文獻進行定量分析。關聯分析是對數據集中反復出現的關系進行挖掘提取,從而根據一個數據項的出現預測其他數據項的出現。社會網絡分析是在關聯分析的基礎上,揭示各類數據之間的關系,社會網絡分析和關聯分析可以用來展示不同學術研究團隊之間的合作關系。聚類分析根據大量文獻中的描述對象及其關聯的信息,進行信息對象分組,可用于對關鍵詞的分析,可以挖掘關鍵詞所反映的熱點和主題。共現網絡分析用于揭示不同關鍵詞之間的共現次數和網絡關系,并分析共現關鍵詞之間的聯系。知識圖譜是以可視化的形式展現知識發展進程與結構關系,統計分析則用于數據頻次的統計,這兩種方法共同融入不同的研究結果中[2]。

(二) 研究數據

為保證文獻資料的全面性和準確性,本研究選用中國知網學術期刊數據庫作為文獻數據來源。在數據收集過程中,首先通過高級檢索的方式,將主題、篇名、關鍵詞(三者關系為或) 設定為“學習分析”進行精確匹配,檢索時間設置起始年為2013 年,結束年為2023 年,限定期刊來源類別為北大核心,共檢索出2 875 篇相關文獻。其次,為保證文獻數據的典型性,減小后期分析誤差,共進行了三次人工篩查和剔除,第一次剔除了不符合檢索條件的文獻,第二次剔除了與主題內容不符合的文獻,第三次通過閱讀文獻摘要剔除不符合學習分析研究領域的文獻,最終得到650篇樣本文獻。

(三) 數據處理

經過文獻下載、文獻格式化、文獻清洗三個環節進行數據處理。首先,對中國知網數據庫搜索到的文獻進行篩選,并以文本格式導出文獻信息。其次,以中國知網數據庫的字段標識符為標準格式,以Refworks 格式導出文獻信息。最后,對地區、單位、作者、關鍵詞等進行相關性的批量合并,將預處理完成的文本數據進行規整以供后續分析。

(四) 研究過程

研究過程主要包括6 個方面。一是下載文獻信息:從選定的數據庫中下載有關學習分析的文獻和題錄信息;二是轉化數據格式:將下載的題錄數據進行格式的轉換和統一,以匹配后續使用的工具軟件來進行定性與定量分析;三是抽取字段信息:將字段中包括標題、作者、地區、關鍵詞、發表年限、參考文獻等有效信息進行抽??;四是統計條目頻次:根據抽取的字段信息運算頻次排列表中的條目元素,統計完成后進行擴展區域的降序排列;五是構建共現矩陣:將所分析題錄信息的數據導入相應的軟件中,運算相應條目元素的數量并將其作為矩陣知識單元,進而得到相應知識單元的共現矩陣;六是生成網絡圖譜:篩查共現矩陣數據,并基于此矩陣導入相關的可視化分析軟件,生成共現網絡知識圖譜。

二、學習分析的期刊文獻研究現狀

(一) 發文量分析

通過對歷年發文量的分析,有助于研究學習分析領域的理論水平和發展趨勢。筆者將650 篇樣本文獻繪制成橫軸為發文時間、縱軸為發文數量的發展趨勢圖,可以得出近十年我國關于學習分析的研究熱度處于較高水平,說明學習分析研究受到廣泛關注,但波動較大,如圖1 所示。2013-2023 年共有兩次研究熱潮,分別是2016 年和2019 年。通過進一步分析,我國學習分析研究可以分為如下三個階段。

圖1 2013-2023 年學習分析研究相關發文量趨勢圖

1.研究萌芽階段(2013-2014 年)

學習分析的概念一經提出,就受到我國研究者的廣泛關注。盡管該時期我國的學習分析研究主要處于教育理論研究階段,缺少實際應用,研究成果不多,但已初步探索了該領域的研究方向。李青、王濤[3]辨析了學習分析的基本概念,剖析了學習分析技術在教學實踐中的優勢和不足,為后續的研究提供了參考。

2.穩步發展階段(2015-2017 年)

數字化時代,云計算、大數據、物聯網、移動計算等新技術逐步廣泛應用,學習分析得到了有力的技術支持。同時,國家加強對教育信息化的建設,2016 年印發的《教育信息化“十三五”規劃》指出,推動形成基于信息技術的新型教育教學模式與教育服務供給方式,提升教育治理體系和治理能力現代化水平,形成與教育現代化發展目標相適應的教育信息化體系,充分發揮信息技術對教育影響和作用。在技術的支持和政策的引導下,我國關于學習分析的研究迅速發展,2016年,有71 篇相關文獻關注了學習分析的理論研究,并且逐步探索學習分析的應用場景[4]。

3.創新發展階段(2018-2023 年)

在這一階段,為適應新時代的要求,教育領域進行了綜合改革,尤其是人工智能技術的融合創新發展,加快了教育數字化、教育信息化、教育現代化的進程。該階段有關學習分析方面的論文呈現爆發性增長,并迎來了第二次研究的熱潮。2019 年,中共中央、國務院印發的《中國教育現代化2035》,全面推進了教育信息化,同年,學習分析類文獻發表量達到112 篇。研究者對學習分析的研究逐漸系統化,更多集中于人工智能技術與大數據技術在學習分析領域的創新應用[5]。

(二) 核心作者分析

通過分析作者的發文量可以了解該作者在相關學科領域的研究持續性、深入程度以及對學術界的貢獻度[6]。篩選后的650 篇有效文獻來源于315 名作者,其中發文數量超過5 篇的作者有23人,占總人數的3.54%。例如趙蔚(24 篇)、姜強(19 篇)、武法提(17 篇)、顧小清(16 篇)、劉清堂(14 篇)、劉三女牙(10 篇) 等是學習分析領域的高產作者。利用Citespace 對學習分析研究的核心作者進行可視化分析,生成核心作者合作知識圖譜。其中,共形成了315 個節點、220 條連線,整體網絡密度為0.0044。圖譜中節點大小與作者發文數量有關,作者之間的連線粗細表征合作強弱。從該知識圖譜中可以發現,作者間的合作關系表現較為離散。盡管形成了多組規?;难芯繄F隊,有一定的緊密合作關系,但合作發文大多是同一所高校、機構的合作,缺少有凝聚力的科研團體。今后需要廣泛加強跨學校、跨機構的合作,形成研究團隊,共同推動學習分析研究的快速發展。

(三) 研究機構分布

對學習分析領域的研究機構進行分析,統計出發文量前十的研究機構,如表1 所示。

表1 學習分析研究發文量排名前十的研究機構一覽表

由表1 可知,該領域的科研力量主要集中在以北京師范大學為代表的重點師范院校,具有鮮明的行業特征。其中,北京師范大學發文量最高,共82 篇,表明其在該領域具有較強的研究實力和影響力。排名前十的研究機構集中分布在北京、廣東、江蘇、浙江等地區,說明教育資源和研究環境對學習分析的發展起到了重要作用,但也表明學習分析的研究存在地域差異。未來,各個機構應當加強地域間的合作交流。

三、我國學習分析研究熱點

(一) 關鍵詞共現分析

關鍵詞可以高度凝練一篇文章的主要內容和中心思想。對關鍵詞進行共現分析,可以反映當前學習分析領域研究熱點。本研究提取與統計關鍵詞,生成關鍵詞共現分析圖譜。如果關鍵詞的節點越大,表征其出現的頻次越高。統計出現頻次大于10 次的關鍵詞見下頁表2 所示。學習分析作為領域內的直接關聯詞,共出現260 次,其次是在線學習(63 次),接著是大數據(40 次)、學習行為(37 次)、學習投入(36 次)、人工智能(35 次),這些都是領域內的研究熱點。中心性指代節點在網絡結構中的重要程度,中心性越大說明該關鍵詞對信息的流動和傳遞的作用越大。其中,中心性大于0.1 的節點稱為關鍵節點,大數據(0.61)、在線學習(0.56)、人工智能(0.48) 是聯系其他關鍵詞的關鍵樞紐。

表2 學習分析研究關鍵詞頻次和中心性一覽表

(二) 關鍵詞聚類分析

關鍵詞聚類分析是一種探索性的數據挖掘技術,其主要目的是識別和區分某一領域的關鍵詞,可以反映該領域的主題分布。通過關鍵詞聚類分析得到知識圖譜,該聚類的聚類模塊值Q 是0.8686>0.3,聚類平均模塊值是S=0.9568>0.8,據此說明該網絡結構劃分顯著,聚類結果合理。本研究選取了具有代表性的前10 個聚類類別,包括“學習分析”“協作學習”“在線學習”“人工智能”等主題詞。

通過分析關鍵詞聚類圖譜以及深入閱讀文獻,可以歸納學習分析的研究熱點為學習者特征研究、教學實踐研究、技術層面研究三個方面。

1.學習分析的學習者特征研究

結合聚類結果,本研究將“學習行為”“學習投入”“在線學習”等關鍵詞歸為一個主題。近年來,隨著教育信息化的發展,大規模的在線學習環境已經形成。越來越多的研究者利用學習分析技術收集學習過程數據,從而對學習者的特征進行研究,幫助研究者理解學習者的內在規律,以期提高學習成效,創新學習方式[7]。例如,在研究學習者的學習行為特征方面,將學習行為作為學習分析技術的數據來源,通過學習分析技術構建學習行為模型,為學習者的個性化學習提供指導建議,從而改善學習效果,為智慧學習分析奠定基礎[8]。

2.學習分析的教學實踐研究

結合聚類結果,本研究將“精準教學”“虛擬現實”“深度學習”等關鍵詞歸為一個主題。學習分析可以體現教育教學規律和特點,在教學實踐中發揮重要作用。將學習分析與教師教學進行結合是教育信息化發展的必然要求,也是教育改革發展的必然結果[9]。對于教師的教學來說,可以使用學習分析技術收集教學過程數據,對課堂教學、教學設計等方面進行分析,提供有效的教學策略和方法,幫助教師完成教學實踐,提高教學質量,進而實現精準教學,為智慧教育奠定基礎[10]。

3.學習分析的技術層面研究

結合聚類結果,本研究將“人工智能”“大數據”等關鍵詞歸為一個主題。隨著技術的發展和學習分析應用場景的擴大,可以發現學習分析的發展和創新變革離不開人工智能技術的支持,而大數據作為學習分析的基礎和重要驅動力,也為學習分析的發展賦能[11]。例如,在個性化教育應用中,借助人工智能技術和大數據技術可以更深入地了解學生的學習行為和需求,通過分析學生的在線活動、作業和測試結果等數據,教師可以更好地掌握學生的學習進度,并為其提供相應的指導。同時,大數據技術可以幫助教師更好地評估學生的學習效果,進而制定更加科學的教學計劃[12]。

四、我國學習分析的研究趨勢

突顯詞解釋可以幫助理解聚類中的關鍵詞,從而更好地把握研究的重點,合理預測未來發展趨勢。本研究基于關鍵詞圖譜,分析近10 年間在學習分析的相關文獻,以起始年份選取排名前11位的突顯詞(見下頁表3)??梢钥闯?,“學習投入”“人工智能”“智慧課堂”等關鍵詞在2013-2016 年出現,且延續至今,可以預測其將成為未來學習分析領域的研究重點。

表3 學習分析研究關鍵詞突顯分析表

五、結語

本研究以中國知網學術期刊數據庫近10 年(2013-2023 年) 有關學習分析的650 篇相關文獻為研究對象,采用關聯分析、社會網絡分析、知識圖譜等方法進行數據處理與可視化,直觀展示學習分析領域的研究現狀、熱點,把握學習分析的發展趨勢,為學習分析的后續研究提供參考。通過研究近10 年以學習分析為主題的相關文獻發現,我國學習分析領域的研究主要有以下三個方面的特點。

第一,近10 年我國學習分析領域的理論研究水平有一定深度,總體上呈現動態上升的趨勢,大致可以分為三個階段,2014 年前為研究萌芽階段,2015-2017 年為穩步發展階段,2018-2023 年為創新發展階段,在政策驅動下出現了快速增長。學習分析領域的研究者形成了小規模的研究群體,但未能打破單一院校之間的界限,形成更大的、有凝聚力的研究團隊。目前的研究機構類型多樣,但是研究視角比較單一,研究主體以師范院校為主。同時發現,研究成果存在地域差異,跨地區、跨機構的研究成果較少。

第二,我國學習分析領域的研究熱點大致可以分為三個方面:基于學習分析的學習者特征研究、基于學習分析的教學實踐研究、基于學習分析的技術層面研究,一些研究項目取得了較好的研究成果,而且具有一定的創新意義。

第三,在研究趨勢的預測方面,研究者將更多關注學習投入、人工智能、智慧課堂等方面的研究。此外,在研究和實踐過程中,要注意隱私保護、數據安全等技術問題,使學習分析更好地服務于人類社會[13]。

為了預測學習分析領域的研究趨勢,本研究基于關鍵詞分析,提取未來研究熱點相關的突顯詞。其中,“學習科學”“多模態”等關鍵詞在近幾年出現,由于相關理論知識尚待完善,適用技術尚未成熟,研究有待進一步深入,但隨著理論和技術條件的發展,這些內容會成為未來研究的重點之一;“學習投入”“人工智能”“智慧課堂”等關鍵詞在近三年出現,相關研究不斷增多,也是未來學習分析的研究熱點。

猜你喜歡
圖譜聚類領域
繪一張成長圖譜
領域·對峙
基于DBSACN聚類算法的XML文檔聚類
補腎強身片UPLC指紋圖譜
基于高斯混合聚類的陣列干涉SAR三維成像
主動對接你思維的知識圖譜
新常態下推動多層次多領域依法治理初探
一種層次初始的聚類個數自適應的聚類方法研究
自適應確定K-means算法的聚類數:以遙感圖像聚類為例
肯定與質疑:“慕課”在基礎教育領域的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合