?

上海市二手房價格影響因素研究

2022-04-02 05:32胡夷蔡近近張敬鴻袁鵬程
經濟研究導刊 2022年4期
關鍵詞:上海市

胡夷 蔡近近 張敬鴻 袁鵬程

摘 要:收集上海市14個區的11 195條有效二手房成交數據作為樣本,首先對樣本進行相關性檢驗并選擇9個變量,分別用線性模型和半對數模型對樣本進行初步分析,通過比較模型的擬合優度等最終選取半對數模型對樣本進行回歸分析建模,由此得到模型的常數值和各變量相關系數。根據此模型分析得到各自變量對上海市14個區的單位面積房價的影響程度,其中房源所處的行政區對單位面積房價的影響較大。此外,運用該半對數模型可對指定特征信息的房源進行房價預測。

關鍵詞:上海市;二手房價格;單位面積房價;虛擬變量

中圖分類號:F299.23? ? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2022)04-0070-03

引言

據報告統計,2020年,上海二手房市場量價走勢與新房市場基本一致。全年二手住宅成交約30.2萬套,同比增長27%,達近4年來新高。其中,2020年12月上海二手房的成交量刷新了近幾年來的新高,二手住宅月度成交套數約為3.9萬套,環比增長20.3%,同比增長96.2%。由此可見,二手房交易在上海市房地產市場逐漸占據重要地位。

在此前提下,對于二手房價格影響因素的研究越來越多。如戴瑗、鄭傳行通過Python對南京市二手房數據進行了收集和分析,經過可視化分析從中提煉出能幫助人們做出購房決策的信息[1];黃明宇、夏典收集了合肥市二手房交易數據并進行分析,建立了多元線性回歸模型,為合肥市二手房交易提供了一個有實用價值的房價參考定價工具[2];傅行行利用ArcGIS分析了上海市二手房價格空間分布特征,探索影響二手房價格的可能因素[3]。

本文以上海市的14個區(除金山區和崇明區外)為研究對象,對其進行數據收集和處理,并建立了多元線性回歸模型和半對數模型,通過比較得出各因素對二手房單位面積房價的影響程度,最終選擇了半對數模型進行房價的預測。

一、數據收集和變量選擇

本文通過數據收集工具“Gooseeker”從鏈家網站上爬取了上海市14個區的二手房成交數據,共采集了12 316條2020年上海市成交的二手房數據,經過初步相關性檢驗,剔除了房屋結構和廚房數等無關變量,最終選取了9個變量,其中單位面積房價為因變量,其余為自變量,具體變量如表1所示。

二、變量處理和描述性分析

對采集的數據進行預處理:一是刪除數據異常和存在無關信息的數據條;二是對于數值型缺失值,采用平均數代替;對于虛擬變量型缺失值,采用眾數代替。通過異常值篩選和缺失值填充處理后,有效數據共11 195條。

所有樣本數據中,單位面積房價最高為100 977元/平方米,對應于黃浦區士林華苑的一套住房,此住房2室2廳,面積90.12平方米;單位面積房價最低為20 842元/平方米,對應于奉賢區金水苑的一套住房,此住房3室1廳,面積103.4平方米。面積最大為586.15平方米,對應為青浦區的圣安德魯斯莊園,成交總價為1 940萬元;面積最小為19.6平方米,對應為黃埔區尊德里的住房,此住房為1室0廳。

上海市14個區的平均房價為54 358.72元/平方米。平均單位面積房價最高的行政區為黃浦區,高達96 675.5元/平方米。黃浦區為上海市中心城區,擁有南京東路,人民廣場和外灘等比較繁華的地段。平均單位面積房價最低的行政區為奉賢區,低至23 305元/平方米。奉賢區位于上海南部,距離上海市中心較為遙遠,且經濟發展較為緩慢。

部分變量樣本分布情況如表2所示,可以看出,配備電梯的二手房樣本相對較少,且低樓層和中樓層占比較高,經查閱資料可知其主要原因是上海市大部分老舊小區樓層較低,沒有配備電梯設施。

三、模型建立

(一)創建虛擬變量

本文將單位面積房價作為因變量,面積,臥室數等作為自變量,其中是否有電梯,裝修情況,樓層,地區為定性變量,對于是否有電梯引入0—1虛擬變量來處理;對于裝修情況和樓層這兩個3種取值的變量,分別以毛坯和高樓層為基準,各引入兩個0—1虛擬變量;同樣對于行政區這一定性變量,該變量有14個取值,以奉賢區為基準,引入13個0—1虛擬變量進行處理。其中,1均表示是,0均表示否。

(二)模型選擇和擬合結果比較

本文選擇多元線性回歸模型和半對數模型這兩種模型對上海市的二手房單位面積房價進行分析建模,表現形式分別為:

其中,P為單位面積房價,a為常數項,bi為各影響因素的特征系數,?著為誤差項。

將因變量和所有自變量導入SPSS 26.0,分別建立線性模型和半對數模型,分析結果如表3所示。

通過比較可知,線性模型和半對數模型的調整后R2分別為0.967和0.976,擬合優度均較好,其中半對數模型更接近于1,且半對數模型的估計標準誤差為0.05871,遠遠小于線性模型的估計標準誤差,因此半對數模型對該二手房房價樣本解釋能力更好。

(三)模型建立和顯著性檢驗

經過上述分析,本文選擇半對數模型對樣本進行回歸分析,其中因變量為單位面積房價,其余為自變量,各變量回歸系數和顯著性如下頁表4所示。

模型F值為18 779.693,對應的P值為 0.000<0.05,說明引入的22個自變量在a=0.05的顯著水平下總體上對因變量單位面積房價有顯著性影響,且每個自變量對應的P值均小于0.05,說明每個自變量在a=0.05的顯著水平下均對因變量有顯著性影響。同時由共線性檢驗可知,各自變量的方差膨脹因子(VIF)均遠小于10,說明此半對數回歸分析模型不存在多重共線性的問題。

綜上分析可得本文建立的回歸模型如下:

LnP=11.437-0.009x1-0.002x2+0.007x3+0.008x4+0.011x5+0.006x6+0.016x7+0.005x8+0.006x9+0.326x10+0.417x11+0.801x12+0.629x13+0.694x14+0.253x15+0.566x16+0.685x17+0.757x18+0.539x19+0.207x20+0.737x21+0.931x22

由模型可知,面積和房齡與單位面積房價為負相關,其余特征變量均為正相關。

(四)結論和預測

通過控制變量可以得到以下結論:一是面積每增加1平方米,單位面積房價下降約0.9%;房齡每增加1年,單位面積房價下降約0.2%。二是臥室數每增加1個,單位面積房價增加約0.7%;客廳數每增加1個,單位面積房價增加約0.8%。三是單位面積房價中,有電梯比無電梯增加約1.1%。四是單位面積房價精裝比毛坯增加約1.6%,單位面積房價簡裝比毛坯增加約0.6%。五是單位面積房價低樓層比高樓層增加約0.5%,單位面積房價中樓層比高樓層增加為0.6%。

由于模型擬合度較好,且變量總體和個體均通過顯著性檢驗,因此可以利用此模型來進行預測。假設楊浦區有一套3室2廳的120平方米的精裝修房,房齡10年,樓層處于中樓層,有電梯,根據此模型預測的單位面積房價為66 237元/平方米,總價約795萬元。

結語

本文以上海市11 195條有效二手房數據為樣本,經過相關性檢驗確定了8個自變量,并通過對比分析選擇了半對數模型對樣本進行回歸分析,可以得出8個特征變量對單位面積房價的影響程度,其中行政區對單位面積房價影響較大,房齡對單位面積房價影響較小,最后,根據此模型對假設房源進行了房價預測并驗證。由于房價影響因素較多,未來可以引入是否臨近地鐵、月收入水平等因素進一步完善模型,使模型更加精準。

參考文獻:

[1]? 戴瑗,鄭傳行.基于Python的南京二手房數據爬取及分析[J].計算機時代,2021,(1):37-40+45.

[2]? 黃明宇,夏典.合肥市二手房價多元線性回歸預測模型[J].合作經濟與科技,2019,(9):80-82.

[3]? 傅行行.上海市二手房價格空間分布及其影響因素研究[J].上海房地,2020,(7):11-15.

猜你喜歡
上海市
上海市能源經濟相關信息
——2022年1-6月
上海市能源經濟相關信息
——2022年1-5月
上海市能源經濟相關信息
——2022年1-4月
上海市能源經濟相關信息
——2022年1-3月
上海市能源經濟相關信息
——2022年1-2月
上海市能源經濟相關信息
——2021年1-12月
上海市能源經濟相關信息
——2021年1-11月
上海市房地產學校
下期見
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合