?

基于數據挖掘的人口及經濟發展水平與空氣環境質量關聯評價

2021-09-10 00:26吳明燦楊成徐夢婷盧春宇
商業2.0-市場與監管 2021年7期
關鍵詞:人口數量閾值空氣質量

吳明燦 楊成 徐夢婷 盧春宇

摘要:20世紀80年代以來,伴隨中國經濟發展的進程,環境污染問題日益突出,已發展成為可持續發展的最大制約因素之一。經濟增長與環境問題的兩難沖突問題,已經引起人們思考。本文將以空氣質量作為環境狀況代表,搜集中國主要城市的經濟發展數據和空氣質量,研究經濟發展水平和空氣質量之間的關系。從PM2.5(ug/m3),環境空氣質量綜合指數AQI,空氣質量等級,人口(萬人),GDP(億元)五個方面進行關聯分析,找出它們之間的聯系,對環境空氣質量進行評價并提出相應的改善方案。

關鍵詞:數據挖掘;空氣質量;AQI ;PM2.5

1.引言

自改革開放以來,我國經濟高速發展持續了30年,這期間取得了令世界為之矚目的成就,目前中國已經成為取代日本的世界第二大經濟體。然而隨著我國工業化、城鎮化的深入推進,經濟增長和人口增長引發的城市環境問題,尤其是城市大氣環境問題,得到各界高度關注。因此筆者以20個中國主要城市作為樣本,運用weka以及MSBNx貝葉斯網分類工具等軟件,分析研究不同城市,以PM2.5為代表污染物,結合各地區人口數量、經濟發展情況進行分析評價,探求之間關聯關系,為更好地貫徹“可持續發展”的方針提供數據依據,利于后續采取環境保護及經濟發展的協調措施。

2.數據來源

選取20個中國主要城市作為樣本,從城市、PM2.5濃度(ug/立方米)、AQI、空氣級別、人口數(萬人)、GDP(億元)六個方面進行數據的處理與分析。

經過調查,并收集數據,初步處理調查結果。如下表所示

3.數據分析

在數據處理分析中,運用Weka關聯規則平臺、使用Apriori算法等獲取關聯信息并進行挖掘規則的分析。通過對上表中的數據,剔除不需要的屬性值,建立關聯模型(調參,建立預測模型),并對實際調查的結果進行關聯規則挖掘。

支持度閾值為25%、置信度閾值為85%

對上表調查結果數據進行Apriori關聯規則挖掘(支持度閾值為20%、置信度閾值為85%),對挖掘的最佳關聯規則進行分析

利用Apriori關聯規則對數據進行挖掘可知:

1.人口數量小于6000人與GDP小于8869億元有強關聯(lift=1.46>1);

2.空氣質量指數大于0.8與GDP小于8869億元有強關聯(lift=1.46>1);

由此可見,人口數量與GDP呈正相關關系,人口數量越多,GDP量越大,即正常情況下,一個城市的人口規模發展地越大,經濟發展水平會越高。城市的空氣質量越好(即AQI越?。?,經濟發展水平越高。

支持度閾值為10%,置信度閾值為55%

利用Apriori關聯規則對數據進行挖掘,分析可知:

1.AQI數值越小,人口數量小于6000與GDP小于8869億有強關聯(lift=2.38>1)

2.PM2.5的濃度越小,AQI數值越小。

由此可見,PM2.5的濃度與AQI的數值呈正相關,即PM2.5濃度越小,AQI的數值越小,空氣質量越好;AQI數值越小,人口數量越小,GDP量越小。

支持度和置信度是關聯規則的兩個重要屬性,支持度確定規則可以用于給定數據集的頻繁程度,而置信度確定Y在包含X的事務中出現的概率。同時滿足最小支持度閾值和最小置信度閾值的規則稱為強規則,作用度解決了置信度忽略規則后件中出現的項集的支持度的局限性。根據關聯規則分析可粗略找出PM2.5的濃度、AQI、人口數量、GDP四者的相互關聯關系,利于后續的深入分析。

4 總結及建議

利用weka軟件對選取的數據樣本進行處理和分析,得出的結論可知:

1.PM2.5的濃度與AQI的值呈正相關,其濃度越高,AQI值越高,則空氣質量越差

2.AQI的值與人口數量和GDP的值呈正相關,說明一個城市人口規模越大,經濟發展水平越高,空氣質量越差。

要想實現可持續發展目標,人與環境要進行協調,實現共同發展。具體可參考如下建議:

1)調整產業結構,減少工業污染源的排放

2)開發新技術,提供產品環保保證

3)加減少大空氣污染環保意識的宣傳

4)控制人口增長,適當采用“計劃生育”政策,限制人口爆炸增長

本次課題利用Weka軟件對城市人口增長以及經濟發展水平和空氣質量三者之間的關系進行分析,將理論知識運用到實際問題中,發現生活中的問題,并根據分析結果提出相應的改進手段,有助于社會的可持續發展。

參考文獻

[1]朱小棟,徐欣.數據挖掘原理與商務應用.立信會計出版社.2013.3.

[2]袁梅宇.數據挖掘與機器學習——WEKA應用技術與實踐(第二版).清華大學出版社.2016.

[3]Jiawei Han.數據挖掘概念與技術(第三版).機械I業出版社,2012.

[4]徐新陽主編.環境評價教程.化學工業出版社.2019.09

[5]世界自然資源保護大綱1980.

[6]空氣質量在線監測平臺.https://www.aqistudy.cn

猜你喜歡
人口數量閾值空氣質量
烏海市霧對空氣質量的影響
非均勻光照下文本圖像分割算法研究
特斯拉發布新功能 停電期間也可充電
我國60歲以上人口數量首超15歲以下人口
利用迭代軟閾值方法抑制恒時演化類核磁共振實驗中的采樣截斷偽峰
新疆人口發展趨勢預測分析
2020年前俄人口數量將增至1.475億
兩種改進的局部閾值分割算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合