?

多分類器融合的移動用戶行為識別模型

2016-06-29 12:00賀炎張航
科技視界 2016年16期

賀炎 張航

【摘 要】移動設備放置位置多樣化以及不同用戶行為的差異性,大大增加了用戶行為識別的難度。為了提高移動用戶行為識別的準確率,本文提出了一種多分類器融合的移動用戶行為識別模型(BRMMCF)。該模型根據融合算法將多個基分類器的識別結果進行融合處理,得到行為識別的最終結果。該模型分別采用SVM和決策樹作為分類算法,基于數據集XUPT-AAD進行了驗證。實驗結果表明,該模型對靜止、步行、跑步、上樓、下樓的平均識別準確率達到95.05%。

【關鍵詞】行為識別;基分類器;多分類器融合

0 引言

隨著科技發展以及人們生活水平的提高,智能手機已經成為了日常生活的必需品。集成在智能手機內的加速度傳感器,具有體積小、功耗低和靈敏度高等特點,為利用智能手機實現移動情景識別提供了必要條件。作為移動情景識別的一個重要研究方向,專家學者們就如何根據智能手機內部各種傳感器采集的數據進行人體行為識別展開了廣泛研究,越來越多的研究人員通過移動設備內嵌傳感器來采集數據,并對原始數據進行預處理、特征選擇、分類器訓練,得到用戶行為模型,運用該模型分析、確定未知用戶的行為,并根據行為識別結果為用戶提供所需要的各項服務。該技術在兒童和老年人安全監護、智能監測、生物醫學、智能視頻監控等方面具有極其廣闊的應用前景。

1 已有研究

用戶行為本身具有較大差異性,數據采集過程中移動設備放置位置多樣化,以及采集環境多樣化等因素,都將大大增加用戶行為識別的難度。國內外研究者們在這一方面做了大量研究。Zhang等人[1]提出一種基于粗糙集理論的知識增益方法來選擇特征,進而用于人體行為識別。趙海勇等人提出了一種以人的動作序列圖像的輪廓為特征、基于隱條件隨機場的行為識別方法,利用背景差分法和陰影消除技術提取運動人體輪廓[2]。謝立東提出了一種采用分層方法來研究人體行為識別技術的方法[3]。范琳等人提出了一種與穿戴位置無關的手機用戶行為識別模型[4],對走路、跑步、上樓、下樓等日常行為識別的準確率最高達88.32%。王忠民等人提出了一種多頻段時域分解的行為識別特征優選方法[5],對日常行為的識別準確率最高達89%。衡霞等人提出了一種依據手機內置三維加速度傳感器采集的人體日常行為數據來進行識別分類的方法,平均識別正確率為87.17%。陳益強等人將智能手機放置位置細分為:右褲子口袋、右手、右上衣口袋、左褲子口袋、左手、左上衣口袋6種,從加速度數據中提取最大值、最小值、標準差、能量、均值等特征,采用ELM算法,建立手機放置位置交叉的自適應行為識別模型,對靜止、下樓、走路、跑步、上樓進行識別,其平均識別準確率能提高12%左右。

為了進一步提高移動用戶行為識別的準確率,本文提出了一種基于多分類器融合的行為識別模型。

2 行為識別模型

2.1 數據處理流程

本文根據內嵌在智能設備中的三軸加速度計實時采集人體日常行為加速度信號,從中提取出常用時域特征,生成特征數據集T后,劃分為訓練集X和測試集Y。根據訓練集X訓練出k個基分類器,并用測試集對各基分類器進行測試。測試結果經融合器處理后,得到最終的行為識別結果(圖1)。

2.2 基分類器

基分類器的生成主要有神經網絡、決策樹、支持向量機、Bayes準則等方法,基分類器的性能對行為識別有重要影響。本文選用決策樹算法和支持向量機來訓練基分類器。

2.3 融合算法

集成學習的思路是在對未知的實例進行識別時,把若干個基分類器的行為識別結果通過某種規則進行融合,確定最終識別結果,以取得比單個分類器更好的識別效果。本文采用多數投票法作為融合算法(如圖2所示),所構建的行為識別模型如圖3所示。

3 實驗設計及結果分析

3.1 實驗環境及數據集

本文所用數據集是XUPT-ADD,是課題組成員使用內嵌三軸加速度計的智能手機實時采集的靜止、行走、跑步、上樓、下樓等日常行為數據。數據采集時,智能手機分別放置在手中、包里以及褲子前口袋。參與此次數據采集的一共有15人,每人分別采集三種不同位置下每種行為的加速度數據,共1973個樣本。從原始加速度數據中提取平均值、中位數、方差、標準差、最大值、最小值、范圍、均方根、直流分量、系數和、頻譜能量等特征值,生成特征數據集T。

行為識別模型訓練和測試所用軟件環境為MATLAB R2010b。

3.2 實驗設計及結果分析

為了驗證多分類器融合的行為識別模型的有效性,本文首先將特征數據集T劃分為五組,訓練出5個采用SVM算法的基分類器和5個采用決策樹算法的基分類器,然后將各基分類器的測試結果和融合后的測試結果進行對比分析。

(1)數據集劃分

將特征數據集T隨機分為三個人一組,共五組數據,每組數據都包含了五種行為。訓練基分類器時,根據以下方式將特征數據集再細分為訓練集和測試集:第一種,是分別提取每組數據中每一種行為的前一半作為訓練集,而剩下的一半作為測試集;第二種,是每組的全部數據作為訓練集,第五組數據作為測試集;第三種,是取每組數據的奇數行作為訓練集,偶數行作為測試集。

每種數據分組方式都將分別訓練出5個采用SVM算法的基分類器(ClassifierS1~ClassifierS5)和5個采用決策樹算法的基分類器(ClassifierD1~ClassifierD5)。

(2)基分類器與多分類器融合的行為識別結果分析

按照上述三種方式將特征數據集劃分為不同的分組后,在 MATLAB中分別訓練決策樹和支持向量機的基分類器模型,并采用對應的測試集作為輸入數據來測試基分類器。將上述基分類器的行為識別結果根據多數投票法進行融合處理,得到多分類器融合的行為識別結果。對上述識別結果進行比較,其識別準確率如表2所示。

表2中,從12個基分類器的行為識別結果來看,由于不同用戶的行為差異較大,因此第二種數據分組方式中,分別采用其他組的數據(第五組除外)來訓練基分類器而用第五組數據來測試時,不論是采用SVM還是決策樹分類算法,行為識別的準確率都比較低。三種數據分組凡是相比,第三種分組方式的行為識別準確率較高。

總的來說,不論采用哪種數據分組方式,多分類器融合的行為識別模型結合了各個基分類器的優點,其行為識別準確率比單個基分類器的識別準確率高,在第三種數據分組方式中,行為識別準確率最高提高了25.99%。

4 結論

為了提高移動用戶行為識別的準確率,本文提出了一種基于多分類器融合的行為識別模型。本文將特征數據集按照三種不同的方式分別劃分為訓練集和測試集,采用SVM算法和決策樹算法分別訓練基分類器,并對各基分類器和多分類器融合后的行為識別結果進行了對比分析。實驗結果證明,多分類器融合的行為識別模型能夠提高行為識別的準確率,最高達25.99%,充分驗證了改模型的有效性。

【參考文獻】

[1]Zhang B,De Natale F G B,Conci N.Recogition of social interactions based on feature selection from visual codebooks[C]//Image Processing,2013 20th IEEE International Conference on, 2013: 3557-3561.

[2]趙海勇,賈保先.基于輪廓特征的人體行為識別[J].計算機科學,2013,40(2):312-315.

[3]謝立東.基于分層方法的復雜人體行為識別研究[D].廈門:廈門大學,2014.

[4]范琳,王忠民.穿戴位置無關的手機用戶行為識別模型[J].計算機應用研究, 2015,32(1):63-66.

[5]王忠民,王斌.多頻段時域分解的行為識別特征優選[J].計算機應用研究, 2015,32.

[6]衡霞,王忠民.基于手機加速度傳感器的人體行為識別[J].西安郵電大學學報,2014,19(6):76-79.

[7]CHEN Yiqiang, ZHAO Zhongtang, WANG Shuangquan and CHEN Zhenyu. Extreme Learning Machine based device displacement free activity recognition model[J]. Soft Computing. Volume 16, Issue 9: 1617-1625. Springer-verlag 2012.

[責任編輯:楊玉潔]

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合