?

用聚類分析和時間序列模型對音樂因素進行定量分析

2021-07-19 00:45李春雨石虔韓伍尚樂
理論與創新 2021年6期
關鍵詞:聚類分析

李春雨 石虔韓 伍尚樂

【摘? 要】本文基于2021年美賽建模D題。為了量化音樂的影響,首先,我們創建一個表示音樂影響的加權鄰接矩陣,在這個矩陣網絡中,我們關注最后兩個指標:總和和出圈率。然后,我們創建一個子網絡來顯示我們的“音樂影響力”指標揭示了什么。下一步為了找出音樂的相似度,我們采用了聚類分析的方法。該方法首先對給定的數據進行預處理和距離歸一化。然后,利用歐幾里德距離對相似度進行量化,距離越短,音樂家(或流派)之間就越相似。最后運用時間序列模型分析音樂是如何隨著時間的推移而變化的。

【關鍵詞】鄰接矩陣;聚類分析;時間序列模型

1.概述

音樂自古以來就是人類文化的一部分。有時,音樂會發生進化和革命性的變化,這在音樂的發展過程中具有重要意義。因此,我們有必要建立一個衡量音樂影響的模型,并應用它來研究音樂是如何隨著時間而變化的。首先,我們需要構建加權鄰接矩陣來連接影響者和被影響者,并創建一個子網絡來顯示我們的“音樂影響”度量所揭示的內容。然后,我們需要探討同一流派和不同流派音樂家的相似度,不同流派的相似度以及影響者和追隨者的相似度。最后我們需要分析音樂是如何隨著時間而發展的。

2.加權鄰接矩陣

2.1加權鄰接矩陣說明

鄰接矩陣是表示不同流派之間關系的方陣,其維度數是流派的個數,而加權鄰接矩陣是賦予數值不同權重的鄰接矩陣。我們用Wij表示i行類型影響j列類型的次數,用wij表示加權鄰接矩陣的條目,它對應于i行類型對j列類型的影響程度。

說明:(1)取流派名稱的前幾位字母表示(2)wij由Wij加權后乘以10000獲得;(3) Sum是一行wij的和,Per是對其他流派的影響程度占總影響程度的百分比,即出圈率;(4) 大于20的數值標為粗體。

2.2子網

使用上面的加權鄰接矩陣,我們現在創建它的子網絡。如表2所示:

說明:(1)SI是指對流派內的影響程度;(2) OI是指對其他流派的影響程度;(3)TI表示影響的總程度。

通過對加權鄰接矩陣和子網絡的分析,得出結論:TI(Sum)越大,總影響程度越大;Per值越大,對其他流派的影響程度的占比越大,即越出圈。比如前衛派(A),它的TI值很小,Per值最大,也就是說,這個流派雖然影響很小,但是主要是對其他大多數流派的影響。

3. 歐幾里德距離矩陣

聚類分析是多元統計分類學的一種形式,其基本思想是根據表征樣本的特征變量的相似度,將具有相似性質的變量歸為一類,將具有不同性質的變量歸為另一類。在對變量進行排序之后,我們可以直接分析類別。該方法首先對給定的數據進行預處理和距離歸一化。然后,利用歐幾里德距離對相似度進行量化。距離越短,音樂家(或流派)就越相似。

3.1預處理

在預處理過程中,我們首先排除了一些不太相關的變量,如藝人姓名、藝人編號、人氣、發行日期和歌曲標題。因此,我們得到了我們需要的12個樣本指標,它們是可舞性、能量、配價、節奏、響度、模式、音調、聲學、樂器性、活性、言語性。注意,因為音調中沒有-1,即不存在缺失數據的情況,我們可以直接統一進行下一步。

3.2 距離歸一化

我們注意到不同值之間的數量級不同,因此,我們對上述12個樣本指標數據組執行范圍歸一化。范圍歸一化是對一系列值(x1,x2,…,xk,…,xn)進行歸一化的過程,其中max{x},min{x}分別表示最大項和最小項,我們使用以下公式將xk轉換為xk?:

其中xk 屬于 [0,1].

3.3音樂相似性度量

在這一部分中,我們使用歐幾里德距離來量化相似度,相似度的計算公式如下:

3.4音樂家歐幾里德距離矩陣

為了探討音家之間的相似程度,我們隨機選取10位音樂家來計算他們的歐幾里德距離。它們是blink-182 (a1), Misfits (a2), Coldplay (a3), The Replacements (a4), Sarah Vaughan (a5), Julie London (a6), Michael Jackson (a7), The Isley Brothers (a8), John Lee Hooker (a9), and Johnny Cash (a10)。然后得到歐幾里德距離矩陣,如表3所示:

歐幾里德距離越小,音樂家就越相似。根據我們的計算,同一流派的平均歐氏距離為0.663,而不同流派的平均歐氏距離為1.178,這意味著同一流派的音樂家比不同流派的音樂家更相似。

3.5流派歐幾里德距離矩陣

為了進一步探討不同流派之間的相似度,我們利用歐幾里德距離公式來計算不同流派之間的歐幾里德距離。然后得到流派之間的歐幾里德距離矩陣,如表4所示。同樣地,歐幾里德距離越小,流派間就越相似。因此,我們認為歐幾里德距離的數值是區分流派的指標。例如,藍調(B)和兒童音樂(CH),藍調(B)和鄉村音樂(COU),它們的歐幾里德距離很小,因此它們相對更相似。另一方面,宗教音樂(REG)和古典音樂(CL)、流行搖滾(P)和新生代音樂(N),它們的歐幾里德距離很大,因此它們的相似性相對較小。以圖1用樹狀圖進行詳細展示:

3.6影響者和追隨者的歐幾里德距離

下面為了探討影響者與追隨者的相似度,我們使用歐幾里德距離公式來計算他們的歐幾里德距離。對于同一流派的影響者和追隨者,我們只是隨機選擇一對,而對于不同流派的影響者和追隨者,我們隨機選擇一對來自不同流派的影響者和追隨者。然后,我們得到了影響者和追隨者的歐幾里德距離,如表5所示:

從表5可以看出,同一流派和不同流派的影響者和追隨者的歐幾里德距離平均值分別為0.656和0.831,表明影響者確實影響追隨者,但影響程度不同。同一流派內的距離較小,表明影響程度較高,而不同流派的距離較大,影響程度較低。

4.時間序列模型

為了分析流派如何隨著時間的推移而變化,我們采用了時間序列模型。通過該模型,我們可以很容易地了解流派的變化趨勢。為了消除偶然因素影響下隨機波動的影響,我們采用歷史數據進行統計分析,并對數據進行適當處理,預測趨勢。對于序列{t1,t2,…,tn}和α屬于(0,1),令t1?=t1,我們應用以下公式,其中α=0.45:

因為音調的變化雜亂且與時間無關,可舞性和節奏等6種指標相對穩定,因此我們主要關注四個指標:能量、響度、人氣和聲學??梢钥吹侥芰?、響度和人氣呈上升趨勢,而聲學指標呈下降趨勢,表明音樂的確隨時間變化。如圖2所示:

5 .模型評價

(1)通過歸一化,成功地將因子轉換為同一維度[0,1]。因此,可以通過歐幾里德距離來衡量音樂家和流派之間的相似性。

(2)利用時間序列模型得到了一些因素的變化趨勢,消除不規則波動。

參考文獻

[1]黃家慶。論音樂在社會文明發展中的作用[J]。新疆師范大學學報(哲學社會科學版),1990(02):92-95+105.

[2]鄒璐。音樂教育在社會發展中的作用[J]?,F代傳播,2012(01):255.

[3]錢小剛、朱志強。聚類分析[J]。栽培與栽培,1987(06):44-48.

[4]司守奎、孫兆良。數學建模算法及應用[M]。Beijing:National Defense 工業出版社,2020:167-171.

猜你喜歡
聚類分析
基于譜聚類算法的音頻聚類研究
基于Weka的江蘇13個地級市溫度聚類分析
我國中部地區農村居民消費行為階段特征分析
基于聚類分析的無須人工干預的中文碎紙片自動拼接
淺析聚類分析在郫縣煙草卷煙營銷方面的應用
農村居民家庭人均生活消費支出分析
基于省會城市經濟發展程度的實證分析
基于聚類分析的互聯網廣告投放研究
“縣級供電企業生產經營統計一套”表輔助決策模式研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合