?

基于網絡問政平臺的城市問題挖掘與對策研究

2021-11-02 12:53劉貴文袁媛韓青葉
中國房地產·綜合版 2021年9期
關鍵詞:文本挖掘空間分布城市建設

劉貴文 袁媛 韓青葉

摘要:基于人民網“地方領導留言板”上21個城市在城市建設領域的海量公眾留言,采用LDA(Latent Dirichlet Allocation)主題模型、情感分析算法進行文本挖掘。研究發現:熱點主題留言量整體呈逐年上升趨勢,其中以房產開發主題的關注度最高;在情感傾向方面,公眾表現為消極情感色彩,物業管理主題的負面留言量占比最高,從空間角度來看,不同城市居民對于不同主題表現出的情感態度存在較大差異。據此,結合城市建設過程中存在的問題,提出了相關對策建議。

關鍵詞:城市建設;網絡問政;文本挖掘;空間分布

中圖分類號:F293 文獻標識碼:A

文章編號:1001-9138-(2021)09-0044-52 收稿日期:2021-08-16

作者簡介:劉貴文,重慶大學管理科學與房地產學院教授。

袁媛,重慶大學管理科學與房地產學院碩士研究生。

韓青葉,重慶大學管理科學與房地產學院弘深青年教師。

基金項目:中央高?;究蒲许椖縉O.2020CDJSK03PT23。

伴隨我國新型城鎮化的發展,城市人口規模不斷擴大,常住人口城鎮化率不斷提高。與此同時,人與人、人與自然、精神與物質等方面之間的關系出現失衡,不同社會群體間利益格局分化導致矛盾激增,城市公共事務日趨復雜,經濟、社會、環境等層面的城市問題逐步深化,對于現代化城市建設產生了制約,阻礙城市的高質量發展。城市建設是貫徹落實新發展理念、推動城市高質量發展的重要載體,因此,對城市建設領域進行重點分析,從公眾的角度探尋城市發展過程中存在的問題,作為政府制定政策和實施行動計劃的依據,有助于增強居民的獲得感與價值感,提高城市承載能力和內生動力,走出一條內涵集約式發展的新路。

隨著互聯網使用率的逐步上升、政府職能的精簡以及公民意識的覺醒,實現基于網絡數據的科學決策,進而提升城市治理能力和政府服務水平引起了廣泛關注。近年來,國內外學者對網絡數據及文本挖掘技術的研究成果較為豐富,在城市建設研究領域,主要應用于城市空間設計、形象與品質改善等。陳映雪等采用新浪微博的簽到數據,將文本分析法與空間分析法結合,著眼于城市空間結構、土地使用、場所分布與居民活動的互塑關系研究。龔言浩等以微博數據為基礎,通過文本挖掘等方法,對“一帶一路”倡議的空間格局進行了分析。Munawir等基于谷歌地圖上的用戶評論,使用文本挖掘分析和總結在線評論文本,確定游客對萬隆市主題公園的看法和評價,旨在探討主題公園在萬隆市發展地方品牌的有效性。而縱觀研究尺度,大都集中于單一城市。謝永俊等基于北京市的微博簽到數據,采用空間聚類和文本分析挖掘城市的熱點區域和主題,進而深度挖掘市民對北京市的總體意象。Wang等通過自動文本分析,對北京市的上訪案件進行了分析,旨在總結和探討北京市民普遍關注的問題。彭曉等通過提取海南省三亞市市民服務熱線數據,利用高頻詞分布和相關性網絡分析在城市公共管理中的主要問題。

綜上,盡管現有研究取得了豐碩成果,但總體上仍存在不足。第一,城市是一個涵蓋經濟、環境和社會的復雜系統,城市建設也涉及多個層面,是不同要素有機結合的綜合體,而大多數學者聚焦于城市建設的特定主題或偶發事件,忽視城市不同層面的關系,對城市建設缺乏系統的實證分析。第二,城市的地理特性、資源稟賦有所差異,但現有研究多集中于單一城市,較少開展多個城市的比較研究。因此,本文基于人民網“地方領導留言板”的公眾留言,對城市建設狀況進行總體分析,旨在通過挖掘熱點主題及公眾情感,識別不同城市在建設過程中存在的問題,作為政府進行城市治理、政策參考的重要依據。

1 研究數據與方法

1.1 數據來源與篩選

研究數據來自全國性網絡問政平臺人民網“地方領導留言板”的網民留言記錄,該問政平臺2006年試運行,2008年功能升級后正式運行,信息覆蓋面廣,遍布城建、教育、醫療、文娛等領域。相較于各地政府自設的公眾留言平臺,人民網的“地方領導留言板”由中央媒體管轄,具有真實保留歷史數據、完整公開原始信息等優勢,是系統研究公眾意見及其價值取向的重要文本資料,也為相關的學術研究提供了不可多得的數據來源。

通過Python代碼語言,爬取了從2014年1月1日至2020年9月30日各省會城市的市委書記及市長接受的所有留言記錄。因政府網站對于爬蟲技術存在一定的限制,故將留言量爬取不足的城市進行剔除,最終選取長春、沈陽、石家莊、哈爾濱、上海、重慶、昆明、福州、呼和浩特、烏魯木齊、貴陽、濟南、廣州、銀川、南昌、西寧、南京、長沙、杭州、???、拉薩21個城市作為研究對象。以領域中的“城建”作為關鍵詞對留言進行篩選,得到29013條留言記錄。

1.2 研究方法

目前國內外對于大數據與政治學相結合的研究已經十分成熟,研究主題通常為公共政策、政治傳播、社會運動等。面對海量的政務數據,文本挖掘的方法多種多樣,包含自動文本分析、社會網絡分析、可視化和空間分析等。

對于獲取到的文本數據,首先進行數據清洗及預處理,包括刪除重復性留言、去除停用詞、文本分詞等步驟,使用Python環境中的模塊“jieba”庫進行分詞處理,之后對數據進行人工調整以確保分詞的準確性。留言文本內容為城建領域相關的詞語,故在采用哈工大停用詞表的基礎上,擴充了城市建設、城市規劃、城市管理等相關自定義詞,達到精確化分詞的目的。自動文本分析是利用計算機對非結構化文本數據進行機器學習分析和挖掘的一系列技術,本研究采用自動文本分析方法下的LDA主題模型和情感分析算法進行文本挖掘。LDA模型是一種無監督機器學習的文本挖掘方法,通過判斷文本數據庫中的高頻詞來判斷該文檔庫中所包含的主題。在此,設計4個研究主題,每個主題有8個主題詞,根據主題詞對主題內涵進行人工標記,得到城市建設領域的研究熱點;情感分析是對不同主題的意見、情緒和態度進行檢測、提取和分類的任務,采用機器學習算法對公眾留言進行情感得分,根據每條留言的得分值進行歸類,進而分析公眾留言的情感傾向和強度。

2 研究結果與分析

2.1 熱點分析

2.1.1 主題總體描述

經過預處理操作,去除243條不完整及重復性留言,最終保留有效留言28770條。對留言文本進行分詞、詞頻統計等步驟后,繪制了圖1所示的詞云圖。顯然,在城市建設領域,公眾最關心的主體為“開發商”和“物業”,這也是與市民日常居住息息相關的事情。由詞云圖中的字號大小可得,被頻繁提及的關鍵詞有“拆遷”“規劃”“施工”“違建”等。公眾在城建領域的關注點多以民生問題為主,聚焦市民自身的根本利益。

在詞云圖可視化體現的基礎上,采用LDA主題模型進行主題分類,選取討論熱度最高的4類主題展開研究。結果顯示,房產開發、城市規劃、拆遷改造、物業管理是社會公眾關注的熱點。

如表1所示,房產開發主題留言數最多,占所有留言數的比例為35.14%。房地產開發是城市建設規劃的有機組成部分,對國民經濟及城市的發展起著不可估量的作用。從具體留言內容來看,購房過程中產權證、房產證的及時下發問題是市民留言的主要內容,房屋質量問題、合同違約、交房時間過晚等現象也頻頻出現。

其后3個熱點主題的留言數量相差不大,分別占比23.34%、21.91%、19.61%,城市規劃主題涵蓋范圍較廣,留言主要內容為違章建筑及臨時設施的擺放,在建工程項目及不合理的規劃建設造成了噪音擾民、環境污染、交通堵塞、基礎設施安全隱患等重大問題,影響到居民的美好生活及城市的市容市貌,阻礙了宜居城市的建設及城市高質量發展的進程。拆遷改造主題下,棚戶區改造、老舊小區改造等住房保障項目與城市中低收入群體休戚相關,有效改善了居民的生活質量。但在拆遷改造的過程中存在眾多爭議,如拆遷改造時點滯后,改造房屋質量有缺陷,安置房的供暖、供水、燃氣等基本住房保障的不及時落實,近年來熱議的老舊小區加裝電梯等問題引起了中低收入階層的不滿,“惠民工程”遭到了人民群眾的質疑。此外,物業管理也是居民關注的熱點主題,留言內容從社區單元封閉到社區車位安排,從電梯費用的分攤到停車費用的規定,從公眾設施的維修到物管公司的內部混亂及無作為等,深入到市民的日常社區生活。

2.1.2 時間演化趨勢

整體來看,四類留言主題存在一定的共性,留言數量均呈上升趨勢,前期緩慢增長,從2018年開始增長幅度變大,尤其是房產開發主題,不僅留言數量最多,上升幅度也最為顯著。由此可見,未來我國公眾通過網絡問政這一形式參與城市建設的熱情會保持高速增長的勢頭,在線留言將成為政府進行城市建設的重要參考依據,為城市發展奠定了穩固的民生基礎。

如圖2所示,2014、2015年房產開發主題留言數低于城市規劃和拆遷改造,2016年有所增長,留言量居于首位,雖然在2017年出現小幅下降,但數量依然高于其他三類主題。結合國家相關政策來看,2014年樓市庫存嚴重,房價進入盤整期,一些城市房價集體下降,在這種情況下,地方政府紛紛開始救市,部分地區撤消住房限購政策。2015年“去庫存”政策出臺,釋放了大量改善性需求,大部分城市的成交量和房價快速上漲,但同時,購房問題頻發,業主與開發商的爭端逐漸顯現。2016年是去庫存政策落實的一年,房地產市場呈現了新局面,政策環境出現了新變化,中央層面多次表態抑制房地產泡沫、防范金融風險,堅持穩中求進的工作總基調。同時,租購并舉政策的提出使住房租賃市場拔尖而出,緩解了部分市民的購房壓力。為了促使房地產市場的平穩健康發展,從中央到地方各級持續收緊,強調“房住不炒”“住有所居”,多項政策的出臺也引發了公眾的廣泛討論。在此背景下,開發商更加注重民生問題,完善合同交易,提升房屋質量,社會輿論逐漸有所收緩,留言數量在2017年出現微弱下降。從2018年開始,房產開發的留言數依然維持高速增長的趨勢,盡管國家在不斷進行宏觀調控,但房地產業作為我國國民經濟的支柱產業,依然是城市居民最為關注的主題。

城市規劃和拆遷改造兩大主題具有相同的發展趨勢,折線圖近乎重合,直至2020年間發生差異,拆遷改造出現下降趨勢,而城市規劃增長幅度減緩??赡茉蚴菙祿刂箷r間為2020年9月30日,之后3個月的留言數未加入統計,造成數據量偏少。城市規劃主題下的留言內容多為違章建筑及臨時設施的擺放問題,不僅侵占了安全通道與城市公共空間,很多違建還隱藏在合法建筑里面,使不知情的公眾對政府部門產生不滿,損害了政府公信力,嚴重制約了城市規劃建設的進度。拆遷改造主題在2014、2015年的數據量占據首位,隨后一路小幅增長。在城市高質量發展的戰略需求下,城市建設告別外延擴張,轉向內涵式發展,通過對既有建筑的部分拆除,達到資源的合理利用,使城市風貌得以完善。2014年國務院提出完善舊城改造機制,優化提升舊城功能,全面改善人居環境?;诖?,自2009年啟動的棚戶區改造在2014年進行政策加碼,2015年進入攻堅之年,部分城市結合自身實際進行了創新性的探索,積極推進改造工作。然而,在拆遷改造工作陸續開展的同時,不可避免地會產生沖突爭議。省市政府往往過度關注物理層面的改造,注重績效競爭,忽視市民基本需求,拆遷行為不當、補償標準不高、安置房屋質量堪憂等問題引發公眾不滿。

相比較,物業管理主題的上升趨勢較為平緩,前期留言數較低,后期受關注度較多。隨著我國城市化水平的不斷提高,現代化社區拔地而起,住進小區的居民不再僅限于以往的權錢者,普通市民包括原來居住于農村的群眾也可住進現代化城市小區,加深了小區的復雜程度與多樣化;同時,社區的原始居住功能也逐漸轉變為投資功能,小區內隨處可見出租告示,出租房現象越來越多,社區充斥著各類人群。而居民有著不同的需求與利益傾向,小區環境、配套設施、物業管理水平的高低等影響著居民的幸福感與獲得感,因此,物業管理工作的開展愈加困難,業主與物業管理人員的矛盾不斷深化。

2.2 情感分析

2.2.1 總體性描述

如圖3所示,從留言類型來看,投訴留言占比較高,為45.82%,求助留言占比35.17%,該兩大類型均表現消極情感色彩,體現了公眾的不滿與無助。感謝留言占比僅為0.37%,公眾普遍對于城市建設狀況較不滿意,在城市發展過程中存在著明顯的民生問題,城市建設還有很大的提升空間。

為深入了解公眾訴求,探尋公眾情感傾向程度,進行情感極性分析。在機器學習算法識別情感傾向的過程中,正向情感留言被賦值為1,負向情感留言賦值為0。由于中性情感的研究意義不大,故將情感得分小于等于0.5的留言歸為負面情感留言。由表2可得,負面留言占比最高,為83%;正面留言僅占總數的17%。

經過前文的留言主題分類后,在此對每個熱點主題進行情感分析,比較主題之間的差異。統計每個主題正、負面情感留言占該主題留言總數的比例,繪制如圖4所示的極端情感比例圖。

由圖4可得,4個熱點主題的負面留言比例明顯超過正面留言,居民消極情緒較為突出。其中物業管理主題的負面留言占比最高,為87%,表明居民對于物業管理服務較不滿意,社區物業管理水平有待提高。雖然房產開發的總留言數最多,但負面留言以86%的比例低于物業管理。拆遷改造主題的消極留言也居于高位,占比83%。只有城市規劃的負面留言未超過80%,相較其他3個主題,該主題下公眾情緒有所緩和。

2.2.2 空間分布特征

公眾的消極情感聚積到一定程度必然會影響社會的和諧穩定,故將負面情感傾向與地理空間尺度相結合,統計不同城市每個熱點主題的負面留言數占該城市總體負面留言數的比例,繪制空間分布圖,進行城市間的對比分析。如圖5~圖8所示。

在城市居民生活由“小康型”向“富裕型”過渡的過程中,必然要對城市住宅、基礎設施、文娛設施和整體物質環境提出更高的要求。石家莊市的房產開發主題負面留言占比高于其他20個城市,住房問題最為嚴重。昆明、重慶位列其后,房產開發主題的負面留言數占總負面留言數比例均高達50%。東南沿海城市諸如福州、上海、廣州等地分級符號較小,負面留言數占比較小,房產開發狀況較為良好??臻g格局差異主要與城市自身的政策導向相關。2014年9月,石家莊市撤消住房限購,2016年采取調控土地供應措施,開展商業服務業用房去庫存,并發展房屋租賃市場,2017年實施樓市限購政策,2018年進行樓市嚴查,維護群眾的合法權益,以上政策使房地產市場產生了較大震動,石家莊房地產市場發展起伏較大,直接影響居民的情緒波動。城市規劃主題與房產開發主題恰好相反,負面留言占比最高的3個城市為福州、廣州和上海,南昌、南京、杭州緊隨其后,形成“東多西少”的空間格局。福州市歷史文化底蘊濃厚,在保護文化名城的壓力下,老城難以實現功能轉移,新區發展也較為遲緩,城市路網結構不合理一直以來為市民詬病。東南沿海地區經濟發展水平較高,但在城市快速發展的過程中,城市規劃者往往忽略了城市“質”的發展,部分規劃方案不合理,公眾整體認同度較低,項目實施過程中的違建現象對市民的日常生活造成了極大的負面影響。相比之下,位于中西部地區的呼和浩特、銀川、烏魯木齊等城市的負面留言占比較小,處于10%左右。東北地區的哈爾濱市、長春市關于拆遷改造主題的負面留言占比最多,拆遷過程中容易產生矛盾沖突,公眾抵制心理較強。東北地區作為老工業基地,經濟發展勢頭曾經一度高漲,但以資源性產業為主導的結構單一性決定了城市功能的單一性,進而制約著東北地區城市競爭力的提升和經濟轉型的潛力。盡管我國開展了振興東北老工業基地的戰略實施,并進行了相應產業結構的調整,但東北地區的經濟發展依然落后于東南沿海城市,城市建設狀況較為滯后。昆明、拉薩等西部地區公眾情感較為積極,在該主題下較少產生負面留言。物業管理問題主要集中在西寧、拉薩兩地,東北地區的哈爾濱市、沈陽市問題也較為嚴重,物業服務體系尚未完善。而中部、東部地區城市物業管理服務水平較高,居民的社區幸福指數相對較高。

3 結論與建議

通過對人民網的城建留言進行文本挖掘,得出以下結論:

第一,熱點主題提取發現,公眾對于房產開發的關注度最高,城市規劃與拆遷改造主題次之,物業管理的討論熱度相對較低,且四大主題的留言量整體呈逐年上漲的趨勢,其中房產開發主題的增長速度最快。

第二,情感分析結果表明,對于城市建設情況,公眾呈現消極情緒,物業管理主題的負面留言量占比最高,房產開發和拆遷改造次之,城市規劃主題占比較小。

從空間角度來看,房產開發主題下,石家莊市負面留言最多,福州市的城市規劃問題最多,拆遷改造問題最為顯著的是哈爾濱市,物業管理則是西寧市。由此可見,不同城市居民對于不同主題表現出的情感態度存在較大差別。

根據以上研究結論,圍繞促進民生改善,助力城市高質量發展,結合城市建設中存在的問題,提出以下對策建議:

(1)不斷完善社會輿情引導機制,將各項政策措施進一步落實,化解社會公眾的不滿和質疑,營造積極正面的社會氛圍。圍繞城市居民關注的城建熱點問題,及時采取有效、規范的整治措施,減少矛盾與沖突;完善公眾參與機制,調動市民參與城市建設的積極性,增強公眾對于政府的信任感,提升政府的公信力。

(2)健全網絡保障體系,逐步提高城市數據的開放和共享程度,消除“數字鴻溝”現象。利用大數據和智能技術,建立城市各個部門的溝通與合作機制,減少部門條塊化分割帶來的信息封閉與重復行動。統籌東中西部及東北地區的協調發展,促進區域互聯網建設的聯動,對資金投入、基礎設施建設、網絡應用推廣等事項進行整體規劃與協調推進。

(3)加快產業結構調整,培育新興產業,以經濟發展動能推進城市高質量發展;加強第二產業和第三產業的互動,形成多元支撐的現代產業體系。在發展城市經濟水平、加大城市化基礎設施的同時,也應該反思城市的發展模式,注重保障民生,保護和優化城市生態環境,用嚴格的制度、嚴密的法治,促進建立“低能耗、低物耗、低排放”的產業體系,維持經濟、社會、環境的協調發展,實現城市發展動力、發展質量和發展公平的有機統一。

城市化的根本目的是為人類生活創造更美好、更有效的生存環境,人是城市的主體,不了解人們的現實訴求與價值理念,就無法滿足人的需要,也無法去建設一個人性化的城市,因此,從公眾的角度探尋城市發展路徑,對城市建設進行多主題的系統分析,對于不同城市建設的實際情況,認清自身發展的薄弱點,制定針對性的發展戰略,走各具特色的發展路徑;利用城市區域間的相互影響,促進產業融通、資源共享,著力解決城市建設過程中的不平衡、不充分問題,可有效提高城市的承載能力和內生動力。

參考文獻:

1.陳志成 王銳.大數據提升城市治理能力的國際經驗及其啟示.電子政務.2017.06

2.Fu X, Tang Z.Planning for drought-resilient communities: An evaluation of local comprehensive plans in the fastest growing counties in the US.Cities.2013.32

3.Seok H, Joo Y, Nam Y.An Analysis of the Sustainable Tourism Value of Graffiti Tours through Social Media:Focusing on TripAdvisor Reviews of Graffiti Tours in Bogota, Colombia. Sustainability.2020.12 (11)

4.陳映雪 甄峰.基于居民活動數據的城市空間功能組織再探究——以南京市為例.城市規劃學刊.2014.05

5.龔言浩 甄峰 席廣亮.“一帶一路”倡議關注與響應的空間格局——基于新浪微博數據的分析.地域研究與開發.2017.38 (02)

6.Munawir, Koerniawan M D, Dewancker B J. Visitor Perceptions and Effectiveness of Place Branding Strategies in Thematic Parks in Bandung City Using Text Mining Based on Google Maps User Reviews.Sustainability.2019.11 (7)

7.謝永俊 彭霞 黃舟 等.基于微博數據的北京市熱點區域意象感知.地理科學進展.2017.36 (09)

8.Wang Z, Zhong Y.What were residents' petitions in Beijing-based on text mining.Journal of Urban Management.2020.02

9.彭曉 梁艷 許立言 等.基于“12345”市民服務熱線的城市公共管理問題挖掘與治理優化途徑.北京大學學報(自然科學版).2020.56 (04)

10.孟天廣 李鋒.網絡空間的政治互動:公民訴求與政府回應性——基于全國性網絡問政平臺的大數據分析.清華大學學報(哲學社會科學版).2015.03

11.Su Z, Meng T.Selective responsiveness: Online public demands and government responsiveness in authoritarian China.Social Science Research.2016

12.孟天廣 郭鳳林.大數據政治學:新信息時代的政治現象及其探析路徑.國外理論動態.2015.01

13.Grimmer J, Stewart B M.Text as Data:The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts.Political Analysis.2013.21(3)

14.Blei D M, Ng A Y, Jordan M I. Latent Dirichlet allocation.Journal of Machine Learning Research.2003.03

15.Montoyo A, Martinez-Barco P, Balahur A. Subjectivity and sentiment analysis: An overview of the current state of the area and envisaged developments.Decision Support Systems.2012.04

16.張平宇.城市再生:我國新型城市化的理論與實踐問題.城市規劃.2004.04

17.董鎖成 李澤紅 李斌 等.中國資源型城市經濟轉型問題與戰略探索.中國人口·資源與環境.2007.05

18.彭曉 梁艷 許立言 等.基于“12345”市民服務熱線的城市公共管理問題挖掘與治理優化途徑.北京大學學報(自然科學版).2020.56 (04)

19.王曉楠 孫威.黃河流域資源型城市轉型效率及其影響因素.地理科學進展.2020.39 (10)

20.文軍.回到“人”的城市化:城市化的戰略轉型與意義重建.探索與爭鳴.2013.01

21.馬溯川.城市發展趨勢的哲學意蘊——從“人”的本質論中國城市發展動力.現代城市研究.2010.25 (04)

猜你喜歡
文本挖掘空間分布城市建設
數據挖掘技術在電站設備故障分析中的應用
白龜山濕地重金屬元素分布特征及其來源分析
基于LDA模型的95598熱點業務工單挖掘分析
旅游綜合體特征分析
生態文明城市建設中花卉旅游發展策略研究
江蘇省臭氧污染變化特征
慧眼識璞玉,妙手煉渾金
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合