?

基于GPS軌跡數據進行分析改善城市交通擁擠

2017-01-06 12:10沈麗娜程介虹馮丹
中國新通信 2016年21期
關鍵詞:R語言數據分析

沈麗娜+程介虹+馮丹

【摘要】 城市化促進了社會經濟的發展,同時為人們提供了方便,但也帶來了交通擁堵、出行耗時長等問題。為了了解出行情況,緩解交通問題,交通管理部門將越來越多的傳感設備安裝在出租車上,如GPS等。利用GPS設備采集得到了大量出租車載客數據。由于得到的出租車載客數行建模,建模的目的是為了利用數據處理軟件將復雜且量大的數據用圖形表示,可以更直觀的看到居民的出行,利用這種方法改善交通擁擠的問題從而優化交通,為人們的出行提供方便。

【關鍵詞】 出租車軌跡 R語言 數據分析 數據建模

一、設計內容

在本設計中我們將利用GPS設備得到出租車的在載客數據,在得到的數據非常的復雜,而且數量非常的大,在對數據進行分析之前,要對數據進行預處理,把不合適的數據進行數據,之后找到數據之間的關系,對數據分析和建模。

二、本設計的組織結構

(1)出租車軌跡數據分析和處理。在得到出租車的數據時,通過對軌跡數據的分析,在對數據的采集的情況下,由于可能因為外界的因素,造成數據的采集出現問題,因此在數據處理之前要對數據進行預處理,將不合適的數據進行刪除或者修改。

(2)搜索和可視化。在數據導入時,完成了對數據的分析和處理,之后通過R語言軟件對數據進行匯總統計和繪圖,數據更好的理解是為之后正確的建模做準備。

(3)分析和建模。在使用匯總統計和圖形能更好的幫助我們理解數據,但他們有一定的局限性。統計數據不能告訴你數據的形狀,而圖形不能擴展到多個變量,他們在數量上也不能擴展,而且統計數據和圖形都不能從數據中預測什么,所以通過建模,對相關數據進行定量判斷而做出預測,構建可視化圓形系統,實現出租車軌跡數據的可視化分析。

三、數據來源及基本特征

數據的來源很多,R內置有很多數據集而在其他的附件包中能找到更多的數據,在本設計中的數據時利用GPS設備,將GPS設備安裝在各個出租車上,將采集得到城市出租車的載客的數據,其中可以采集得到一個固定地點的出租車的載客數據,也可以得到在流動的地點的出租車的載客數據,以及在同一個時間的不同出租車的載客數據,一個出租車的在不同時間的相同地點的運行狀態。

四、數據處理結果

4.1 k-means算法

k-means算法有k個輸入量;然后將n個數據對象劃分為k個聚類以便使得所獲得的聚類滿足:同一聚類中的對象相似度較高;而不同聚類中的對象相似度較小。聚類相似度是利用聚類中各個對象的均值來獲得一個中心的對象,以及來計算中心對象的坐標。

k-means算法的工作過程說明如下:首先從n個數據對象任意選擇 k 個對象作為初始聚類中心;而對于所剩下其它對象,則根據它們與這些聚類中心的相似度(距離),分別將它們分配給與其最相似的(聚類中心所代表的)聚類;然后再計算每個所獲新聚類的聚類中心(該聚類中所有對象的均值);不斷重復這一過程直到標準測度函數開始收斂為止。一般都采用均方差作為標準測度函數. k個聚類具有以下特點:各聚類本身盡可能的緊湊,而各聚類之間盡可能的分開。

4.2模型的建立

假設給定數據集X={,i=1,2,,4…n}其中還有m個樣本描述。

K個聚類中心分別為

兩樣本之間的歐氏距離為d( )=

再有評價準則函數T=

最后得到k個聚類中心

4.3模型求解

根據出租車載客的數據,對數據進行分析,篩選出擁擠的路段和時段,而擁擠的標準可以自己設定,根據整個蘭州城市的交通考慮,給出擁擠的標準和時間段,根據所有數據通過excel篩選出需要的時間段,并對數據進行分析,根據excel篩選出的數據應用matalb仿真軟件對在確定的時間段畫出速度圖,根據速度的大小標準來確定交通的擁擠狀況。

五、結論

在周末節假日的出租車的全天的任務量,載客的距離(任務量),運營時間,明顯的高于平常,因此城市的相關部門應該對數據分析,找到合適的出租車的調度,和運行措施來減少出租車的空駛,提高出租車的運行比率,以及減少出租車的空駛浪費。來解決群眾上下班時段一車難求、高峰時段還常遇拒載、等問題,同時群眾可以根據分析得到的數據進行分析,自己選擇相應的出行方式與時間。

總結:本設計采用數據分析及處理,在將得到的GPS軌跡數據進行分析,處理,借助可視化的方法,利用地圖匹配,matalb軟件,R語言軟件對數據進行分析,在不同的時間段內,人們的出行狀況,以及在不同地方交通的狀況,交通潛在的規律及其特征進行分析,在所得到數據很難看到這個,所以利用這些軟件對數據可視化分析,分析得到的結果可以直觀的看到出租車的變規律,為人們的出行提供更方便的條件。

參 考 文 獻

[1]李釗,彭勇,謝豐等.信息物理系統安全威脅與措施.清華大學校報,2012.

[2]黎作鵬,張天馳,張菁.信息物理融合系統研究綜述.哈爾濱工程大學計算機科學與技術學院.2011.

猜你喜歡
R語言數據分析
基于R語言的Moodle平臺數據挖掘技術的研究
新常態下集團公司內部審計工作研究
淺析大數據時代對企業營銷模式的影響
基于讀者到館行為數據分析的高校圖書館服務優化建議
基于R語言的湖南產業結構對其經濟增長貢獻分析
注重統計思維培養與應用為主導的生物統計學課程建設
人民幣匯率的均值回復檢驗及Hurst指數計算
R語言及ggplot2在環境空氣監測數據可視化中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合