?

依據SIFT 算法的排球運動員急停起跳動作識別方法

2023-12-27 05:05侯皖東
新鄉學院學報 2023年12期
關鍵詞:輪廓排球代表

侯皖東

(安徽文達信息工程學院體育教學部,安徽 合肥 230000)

通過對運動過程的細致觀察和精確測量,可以更好地理解運動員的動作和技巧,進行改進和提高。排球運動要求運動員具備高度的技巧和策略, 急停起跳是排球比賽中常用的一種技術動作, 它對于運動員的爆發力、協調性和反應速度都有很高的要求。在排球運動員的訓練中, 準確識別和評估運動員的急停起跳動作是非常重要的。 它可以幫助教練員和運動員更好地理解運動員的技術缺陷, 從而進行有針對性的訓練和改進。 細致觀察和精確測量運動過程不僅可以用于排球運動員的訓練和比賽, 還可以廣泛應用于其他運動項目的科學訓練和比賽策略的制定。

目前相關領域學者對人體動作識別研究成果很多:文獻[1]提出了一種基于改進3D 卷積網絡的人體動作識別方法。融合多級特征和多組通道注意力特征,對3D 卷積網絡進行改進, 建立了視頻人體動作識別模型,實現人體動作識別。 文獻[2]提出了一種基于三維卷積神經網絡(3DCNN)的人體動作識別方法。 采用Leaky ReLU 激活函數, 實現對靜態神經元的修復,深度提取影像間時空信息, 以豐富網絡的特征結構。 同時, 結合分批規范化過程, 對信息素點進行規整再分配, 從而有效地實現了特征的抽取, 加快了算法的收斂。然而,上述兩種方法在處理長時間序列的效率和復雜動作的魯棒性, 以及數據樣本質量和數量對識別精度方面存在一定的局限性。為此,本文提出一種基于尺度不變特征轉換(SIFT)算法的動作識別方法。 針對排球運動員急停起跳動作區域,提取多元動作特征數據,并結合SIFT 算法,提取急停起跳動作特征,實現動作識別,提高動作識別的效率。

1 基于SIFT 算法的排球運動員急停起跳動作識別方法

1.1 排球運動員急停起跳動作區域提取

為對排球運動員急停起跳動作進行有效識別,首先通過構建圖像獲取模型, 對急停起跳動作的運動區域進行提取,并將識別動作與背景進行分離處理,從而提高識別效果。通過設置圖像閾值,將目標識別動作與背景圖像進行分割,有效提高后續識別的精度[3-5]。 對此,需要對排球運動員急停起跳動作的圖像進行采集,通過綜合動作信息數據庫、設備模型以及其他模型,獲取急停起跳動作的結構數據以及邊緣特征。 通過對特征進行掃描,并與動作標識信息進行匹配,從而實現識別對象的圖像獲取。對此,構建出的圖像獲取模型具體工作流程如圖1 所示[6]。

圖1 圖像采集流程

通過上述圖像采集流程可以看出, 從動作信息數據庫中提取到人體結構動作數據, 并與識別對象動作的輪廓識別結果進行標識匹配[7]。 通過將文字標識以及急停起跳動作的分解動作輪廓數據進行匹配, 將標識匹配結果作為同一組數據進行存儲, 方便后續對動作進行識別時可以直接將輪廓匹配結果與識別對象進行對比。在急停起跳動作的輪廓提取中,需要先將識別對象動作的輪廓從圖像中進行抽?。?]。 為提高輪廓抽取效果,針對圖像邊界點進行膨脹操作處理,擴充完成后的動作視頻序列為

其中,u代表動作視頻序列,v代表膨脹操作擴充參數,b代表人體結構動作要素,ω代表排球運動員動作圖像邊界點,z代表圖像輪廓腐蝕參數。通過上述操作不僅提高輪廓的抽取效果, 也能對動作區域的尺寸進行統一調整,從而得到大小相同的運動區域圖像數據。由于排球運動員在做急停起跳動作時,動作幅度較大,運動視頻中每幀圖像的動作均有所不同。 因此為保證動作區域的提取效果, 采用幀間差分法對運動視頻中的圖像進行處理

其中,xk+d和xk分別代表排球運動員視頻序列中的第k+d幀圖像以及第k幀圖像,T表圖像靜止閾值。 當D>0 時, 表示第k+d幀圖像與第k幀圖像的像素值為非靜止狀態,此時需要對其進行二次分幀處理,從而得到新的分幀圖像。 當D=0 時,表示此時分幀處理后的圖像像素值均為靜態, 可以對其進行動作區域提取處理。 通過上述操作獲取到的圖像即為差分圖像, 可以從該圖像集合中選取一組具有動作變化的圖像作為提取對象[9]。 考慮到每個差分圖像中所包含的動作信息數據均有所不同, 因此通過權重分配的方式, 將動作區域與圖像位置信息進行匹配處理。 處理公式為

其中,和分別代表向前傳播與向后傳播的動作視頻序列,ut代表提取完動作區域的視頻序列,和分別代表輸入參數和輸出參數,bi代表動作像素的坐標位置信息,?代表差分圖像數據的位置分布權重。 通過上述步驟即可將位置分布權重重新分配給不同的差分圖像,以保證每組差分圖像中,動作區域與背景區域的權重具有明顯差異。 通過對位置分配權重設定閾值, 即可實現對于動作區域的有效提?。?0]。

1.2 基于SIFT 算法的急停起跳動作特征提取

由于SIFT 算法具備較高的匹配性能,可以針對圖像之間的平移或變化情況進行特征點匹配。 因此針對上文中劃分出的動作區域圖像,采用SIFT 算法對排球運動員的急停起跳動作特征進行提取。 通過生成尺度空間,并對極值點進行定位,從而生成關于急停起跳動作的關鍵點描述。為方便提取,首先構建出人體有向時空骨架圖,通過提取人體骨骼線條以及關節節點位置,將急停起跳動作圖像中的動作結構進行簡化處理。 以常規的人體骨架為例, 通過將人體骨架簡化為一個軀干以及兩條腿和兩條手臂,突出關鍵關節節點,來描述運動員的動作信息。 人體骨骼關節的具體簡化效果如圖2 所示。

圖2 人體有向時空骨架圖簡化效果

將人體骨骼進行簡化處理,得到關鍵關節節點,然后采用SIFT 算法生成二維尺度空間,即

其中,I(x,y)代表運動區域原始圖像,σ代表圖像變化尺度,G(x,y,σ)代表高斯卷積核。 圖像變化尺度越大,說明尺度空間中整體特征越明顯,對于其他噪聲的抵抗能力也就越強。則在該二維尺度空間中,可以求出運動區域原始圖像中每個像素點對應的SIFT 特征點信息

其中,m(x,y)代表SIFT 特征點對應的灰度梯度幅值,θ(x,y)代表灰度梯度方向,Lx和Ly分別代表像素點(x,y)對應的二維尺度。 通過上述公式即可求出運動區域圖像中每幀圖像對應的灰度梯度幅值以及灰度梯度方向,然后對極值點進行定位處理。通過檢測二維尺度空間中的極值大小, 將對比度較低或不明顯的極值點進行剔除,保留極值較為明顯的點,從而獲取關鍵點的尺度空間值。 由此構建出的急停起跳動作特征矩陣表達式為Eedge=[lmn]M×N,其中,M×N代表矩陣尺寸,lmn代表矩陣中的動作特征元素。以關鍵特征點為中心的二維尺度空間中, 通過對特征點的梯度進行集成處理,可以得到動作特征參數

其中,λ代表急停起跳動作特征參數,Lm代表梯度集成尺度,K代表特征維度,ξ代表圖像邊緣強度。 通過上述步驟即可提取出急停起跳動作特征, 獲得動作特征參數,為后續的動作識別提供幫助。

1.3 急停起跳輪廓檢測與動作識別

在完成了對于急停起跳動作的特征提取后, 通過檢測動作的輪廓曲線,并對輪廓波域進行平滑處理,從而實現動作識別。由于在排球運動員的運動視頻中,存在非急停起跳動作的其他運動動作, 為保證對于急停起跳動作的識別效果,引入動作相關度這一參數,用于表征急停起跳動作與其他動作之間的相關程度。 在二維尺度空間內,將獲取到的急停起跳動作特征向量進行組合,獲得急停起跳動作圖像的輪廓波域矩陣

其中,H代表急停起跳動作圖像的輪廓波域矩陣,γi代表動作特征向量,Ip代表識別對象動作與非識別對象動作之間的相關度,λi和λj分別代表識別對象動作特征以及錯誤動作特征。 對上述公式進行一階泰勒展開, 可以得到急停起跳動作輪廓波域的特征函數

其中,P(i)代表急停起跳動作的輪廓波域偏導函數,d代表人體動作的協方差,p m(m)和p n(n)分別代表特征概率密度函數以及噪聲概率密度函數。 通過上述公式即可構建出急停起跳動作的輪廓波域特征函數,從而實現對識別動作的輪廓檢測。 為獲取更為準確的動作識別結果, 通過求取識別動作輪廓邊緣特征的跟蹤信息,對輪廓波域進行平滑處理,即

其中,a代表信息熵向量,G代表輪廓平滑參數,R代表動作輪廓線的角點特征參數,υ(i)代表平滑處理結果。 通過上述步驟即可完成對于急停起跳動作輪廓波域的平滑處理, 從而得到更為清晰的動作輪廓曲線。 將急停起跳動作的輪廓曲線與原始視頻中動作序列中的輪廓曲線進行對比,結合動作相關度這一指標,即可從原始視頻序列中識別出急停起跳動作[15]。

完成排球運動員急停起跳動作的有效識別后,后通過對動作輪廓波域進行平滑處理, 得到識別對象動作的輪廓數據。 將動作區域提取以及特征提取等相關內容進行結合,設計基于SIFT 算法的排球運動員急停起跳動作識別方法。

2 實驗論證

2.1 實驗說明

為驗證提出的基于SIFT 算法的排球運動員急停起跳動作識別方法的有效性, 實驗選取了2 種常規的急停起跳動作識別方法作為對比對象, 分別為基于計算機視覺的急停起跳動作識別方法和基于分層運動姿態的急停起跳動作識別方法。通過構建實驗平臺,采用3 種識別方法對同一組動作視頻進行識別, 對比不同識別方法的實際性能。

2.2 實驗準備

實驗選取的實驗數據集為KTH 數據集,該數據集是目前規模較大的人體動作數據集。 數據集中針對不同的人體動作均包含1 000 組以上的動作數據, 且每組動作數據均有不同的運動場景, 具體包括固定室內場景、固定室外場景、人體穿著變化場景以及室外光照條件變化場景。 數據集中的人體動作姿態數據以視頻數據為主,視頻圖像大小為160×120。 為保證實驗結果的可靠性,實驗從KTH 數據集中隨機選取不同運動場景下, 包含急停起跳動作的運動視頻數據作為實驗對象,采用仿真軟件對視頻中的肢體動作進行建模,具體建模效果如圖3 所示。

圖3 數據集人體肢體動作建模結果

圖4 圖像幀數為60 時動作識別延遲對比結果

圖5 圖像幀數為90 時動作識別延遲對比結果

圖6 圖像幀數為120 時動作識別延遲對比結果

為保證實驗效果, 實驗針對建模完成的人體肢體關鍵部位進行編號, 方便對不同的動作進行分類以及規劃處理。 人體關鍵點的編號結果如表1 所示。

表1 人體關鍵點編碼結果

實驗從原始數據集中, 共采集2 400 條排球運動員運動數據,動作類型包括跨步急停、跳步急停以及并步急停,每組運動數據均包括4 種不同的運動場景,具體數據集如表2 所示。

表2 排球運動員四種不同的運動場景數據

實驗共分為2 個階段進行, 分別為算法訓練階段以及樣本測試階段。在算法訓練階段,通過隨機調取原始數據集中的動作視頻數據, 針對3 種識別方法進行訓練,并將訓練集輸出的數據作為網絡輸入值,對算法進行迭代優化處理。針對提出的動作識別算法,將算法迭代次數設為150 次, 將灰度直方圖中的方向數量設為4,方向角?的取值范圍設為[-90°~+90°],每個SIFT 描述算法中均包含64 個梯度直方圖。 待算法訓練成熟后, 采用3 種識別方法對實驗測試樣本數據進行識別。

為保證實驗結果的科學性, 本次實驗通過改變原始數據集中的圖像幀數, 將其分別調整到60、90 和120 幀,從而提高算法對于樣本數據的識別難度。 對于幀數越高的樣本數據圖像, 算法識別出急停起跳動作的延遲時間也需要延長。 最后通過對比不同算法的識別延遲, 比較不同方法對于急停起跳動作的實際識別性能。

2.3 識別效率對比結果

實驗選取的對比指標為急停起跳動作的識別效率,具體衡量指標為動作識別延遲,延遲越低代表識別方法的識別效率越高。 具體識別結果如下圖所示。

根據實驗結果可以看出, 隨著圖像幀數的不斷增加,動作識別方法的識別延遲明顯增加。通過觀察動作識別延遲曲線可以明顯看出,基于SIFT 算法的排球運動員急停起跳動作識別方法的識別延遲明顯低于2 種常規的識別方法,且識別延遲曲線變化較為平緩,未出現較大浮動的波動。 可以證明提出的動作識別方法在識別效率上具備更大的優勢。

3 結束語

對于排球運動員來說, 掌握準確的起跳技術和動作是至關重要的,它直接影響到發力和攻擊的效果。為了提高排球運動員急停起跳動作識別效率, 提出了基于SIFT 算法的排球運動員急停起跳動作識別方法。膨脹操作處理圖像邊界點, 提取排球運動員急停起跳動作區域。構建人體有向時空骨架圖,基于SIFT 算法,提取排球運動員急停起跳動作特征, 通過平滑處理動作輪廓波域,識別排球運動員急停起跳動作。實驗結果表明, 提出的方法能夠有效提高排球運動員急停起跳動作識別效率。

猜你喜歡
輪廓排球代表
詮釋代表初心 踐行人大使命
排球正面雙手墊球教案
四季的代表
OPENCV輪廓識別研究與實踐
“代表通道”新觀察
這個代表咋這么拗
氣排球與硬式排球技術教學實驗對比研究
小學排球教學策略芻議
基于實時輪廓誤差估算的數控系統輪廓控制
氣排球的大眾文化屬性探析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合