?

基于“互聯網+”背景下的出租車與乘客供求匹配分析

2015-10-21 16:40楊澤林馮靖何楓
基層建設 2015年36期
關鍵詞:主成分分析互聯網+

楊澤林 馮靖 何楓

西南交通大學交通運輸與物流學院 611756

摘要:本文針對基于互聯網技術的打車問題,建立合理的指標,并分析不同時空出租車資源的供求匹配程度。首先查找了不同時間、不同地點下的數據,為了去除因相關性給評價結果帶來的影響,并且降低計算難度,使用主成分分析法得到主因子,建立評價模型對不同時間、不同地點的供求匹配程度進行排序,以成都市為例,得到在早高峰、午飯時間、下班時間和夜生活高峰這四個時間段的供求匹配程度得分最低;針對不同空間得到成都市一環二環的供求匹配程度在各個時間段普遍低于市中心和三環。

關鍵詞:打車軟件;主成分分析;MATLAB

1.背景分析

出租車是市民出行的重要交通工具之一,“打車難”是人們關注的一個社會熱點問題。隨著“互聯網+”時代的到來,有多家公司依托移動互聯網建立了打車軟件服務平臺,實現了乘客與出租車司機之間的信息互通,同時推出了多種出租車的補貼方案,本文通過分析不同時空出租車資源的“供求匹配”程度,來為打車軟件公司制定補貼方案提供理論支持

2.模型的建立

2.1供求匹配的意義及評價指標的確認

供求匹配是指在市場活動中買方向市場發布了自己需要某種商品或服務的信息,買方通過某種信息識別系統判斷買方發布的信息成分從而為買方匹配與其需求相同的商品或服務。針對本題所謂的供求匹配應該是乘客的乘車需求與出租車司機的載客需求相匹配的含義。

結合目前世界各國衡量出租車供給數量是否符合需求主要采取五種指標,以及本題背景下的打車軟件服務平臺所提供的出行建議數據,我們從乘客和司機兩方面出發,確定衡量供求匹配程度與兩個指標相關聯:出租車可獲得性(一般以乘客等待時間衡量)和出租車利用率(一般以實載率衡量)。過查閱相關文獻我們確定本題的評價指標為:乘客需求量、出租車供應量、乘客預期打車難易度、呼叫回應時間(搶單時間)、乘客等待時間、出租車有效載客率。

2.2數據的預處理

1、數據的采集和整理

1)數據采集的內容:由上述分析得知我們要建立的評價指標主要是成都市不同地點某一天24小時內的乘客需求量、出租車供應量、乘客預期打車難易度、呼叫回應時間、乘客等待時間、出租車有效載客率。在數據采集過程中我們主要采集成都市中心、一環、二環、三環的指標數據這里我們以市中心為例,其余數據見附錄。

2)由于滴滴出行在國內的市場份額最高,因此本文數據來源均為滴滴出行提供的大數據平臺,其余部分數據為四川省統計局數據。

2、相關性分析和偏相關分析

為了能過表達更多的信息,最理想的情況是希望我們所選取的指標之間不存在相關性。因此我們對所搜集的數據采用SPSS軟件進行相關性分析,判斷各個指標之間的相關性。從得到的相關性結果,可以看出多個指標之間存在一定的相關性。

2.3基于主成分分析法的多指標綜合評價模型

本問題中可供評價分析的變量共有6個數量較多,并且通過數據處理我們發現6種指標之間存在一定的相關性,我們知道在評價時具有相關性的兩個指標會對結果造成重復的影響,是結果不夠準確,因此我們選取主成分分析法對數據進行降維處理,通過得到的主成分回歸分析來克服數據矩陣存在多重共線性時的不穩定性。

我們以市中心為例,其他地點計算過程見附錄,首先用分別表示第區域的乘客需求量、出租車供應量、有效載客率、呼叫響應時間、乘客等待時間和乘客心理預期打車難易度。用分別表示一天的1點到24點,第個小時的取值分別為。

進行主成分分析:

對原始數據進行標準化處理,即將各類數據無量綱化。將各個指標值轉化成標準化指標,有

其中為第個指標的樣本均值;表示樣本的標準差。部分標準化結果如表1所示;

表1市中心6種指標標準化

時間

項目 6:00 7:00 8:00 9:00 10:00 11:00 12:00

出租車供應量(輛) 0.0184 0.1759 0.0236 0.0341 0.0105 0.0079 0.0472

乘客需求量(人) 0.0148 0.0938 0.0222 0.1235 0.0049 0.0074 0.0296

有效載客率(%) 0.0577 0.064 0.0414 0.0464 0.0063 0.0038 0.0263

乘客等待時間(分鐘) 0.0254 0.1049 0.0445 0.0668 0.0048 0.0032 0.0493

打車難易度 0.0065 0.0497 0.0654 0.0667 0.0065 0.0039 0.034

被搶單時間(分鐘) 0.0558 0.1052 0.0805 0.0026 0.0026 0.0039 0.0273

設相關系數矩陣,則有:

其中:,。是第個指標與第個指標的相關系數。

計算相關矩陣的特征值,及對應的標準化特征向量,其中,由特征向量組成6個新的指標變量

其中:是第1主成分,是第2主成分,…,是第6主成分。選擇個主成分,將其按照特征值大小排序,特征值大的說明其為主要因子,得到計算特征值的貢獻率和累積貢獻率。

稱為主成分的貢獻率;且稱為主成分的累積貢獻率。

給出總方差分解表如表2:

表2總方差分解表

因子 特征值 貢獻率(%) 累計貢獻率(%)

被搶單時間(分鐘) 4.1643 62.267 69.267

打車難易度 0.913 14.446 83.713

乘客等待時間(分鐘) 0.4389 6.988 90.701

有效載客率(%) 0.2488 4.763 95.463

乘客需求量(人) 0.1633 2.743 98.206

出租車供應量(輛) 0.0717 1.794 100.000

當接近于1,一般取時,選擇前個指標變量作為個主成分,代替原來的6個指標變量,從而可對個主成分進行綜合分析。

由表3可知前3個指標變量的累計貢獻率大于90%,因此我們選取前三個指標量作為主成分,代替原來6個指標變量。前三個主成分特征向量構成如表3所示:

表3前三個主成分的特征向量

指標1 指標2 指標3 指標4 指標5 指標6

成分1 -0.3936 -0.5315 -0.2009 0.5186 0.4685 -0.1842

成分2 -0.4276 -0.1995 -0.3650 0.0919 -0.6799 0.4166

成分3 -0.4237 0.2778 0.4484 0.2687 -0.3723 -0.5757

下轉第636頁

猜你喜歡
主成分分析互聯網+
基于NAR模型的上海市房產稅規模預測
主成分分析法在大學英語寫作評價中的應用
江蘇省客源市場影響因素研究
SPSS在環境地球化學中的應用
服務貿易結構優化路徑研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合