?

數據挖掘技術應用于經濟統計中的研究

2020-01-18 20:14田田山東省慶云縣常家鎮人民政府
環球市場 2020年30期
關鍵詞:決策樹數據挖掘分類

田田 山東省慶云縣常家鎮人民政府

眾所周知,經濟統計學屬于郁悶綜合性學科,與數學、統計及經濟學等聯系緊密,是圍繞大量數據采用整理、分析與建模等方法,發掘經濟領域數據規律。當前,數據挖掘領域,現代統計學還處于探索中,經濟學理論探究沒有數學成就大。然而實際上,統計與分析應用方面,對企業甚至整個社會大環境而言是非常重要的。因而,深入探究經濟統計中數據挖掘技術的應用具有非常重要的意義。

一、數據挖掘技術內涵及應用優勢

(一)數據挖掘技術內涵

社會經濟快速發展的同時,海量數據信息不斷涌現,而在經濟統計工作中,面對龐雜的數據信息如何有效處理是面臨的重要問題。當前,傳統數據處理方法明顯無法滿足數據用戶使用需求,為數據挖掘技術創造了條件。其不同于傳統數據數量方法,傳統數據處理方法是從數據分析表面入手簡單分析各項數據,數據分析與處理的深度與廣度不足。在龐大數據信息庫中,應用數據挖掘技術科學搜索到價值與品質高的數據信息,再分析并處理這些信息滿足用戶使用需求。社會經濟發展中,數據挖掘技術也可解決經濟統計難題,便于數據使用用戶充分應用此類數據。另外,應用數據挖掘技術還可有效改善數據質量,使得數據使用效率不斷提高,進一步增強了數據間的聯系。

(二)數據挖掘技術應用優勢

(1)該技術有很強的綜合能力。眾所周知,經濟發展與數據統計之間聯系緊密,兩者之間相輔相成且相互影響。因而社會經濟發展中必須要重視數據統計的應用。參考數據統計結果,企業管理部門有效制定決策制度。因各部門細化與管理方式不同,使得各類數據有不同的統計需求、類型與數據形式,導致企業無法順利進行各項運營管理活動。因而,經濟數據統計中數據挖掘技術的應用,自由轉換數據形式,滿足各部門實際工作需求,為經濟發展提供推動力。(2)數據統計效果強。經濟數據統計中,數據挖掘技術的應用是非常重要的,其可從龐大數據庫中統計分析經濟數據,使得數據從無序變為有序,數據科學性與有效性得到了保障。應用數據挖掘技術,一定程度上還可深入發掘數據庫中價值高的信息,充分發揮經濟統計數據作用,使得數據信息管理效率明顯提高,獲得更加真實而有效的經濟統計信息,為順利進行經濟數據統計活動奠定了良好的基礎。(3)數據挖掘技術有明顯的適用性且范圍廣。經濟數據統計中,數據挖掘技術可應用于各部門以此有效整合相關數據信息,符合統計需求,為企業提供有效的參考數據順利開展各項經濟活動。所以,積極推廣數據挖掘技術充分發揮其作用顯得尤為重要。

(三)經濟調查分析中數據挖掘技術作用

經濟調查分析中數據挖掘技術的作用主要表現為描述與預測作用。其中前者主要是劃分數據以及應用相關公式分析對比數據,類聚是分類處理相關數據,數據分類分析法則包含典型的數據分析方法,其是通過發現數據典型特點再對比分析。分類與回歸是兩種主要預測方法,其中分類是將數據化分成不同類型再處理,可選用貼標簽與各種算法。而回歸法不同于分類,其是分析連續數據,其包含線性與多項回歸等分析方法。聚類則屬于一種分類管理,數據統計前為了提高統計效率,分類處理所收集的數據,通過分類有機劃分數據信息,部分數據對經濟統計沒有作用分類過程中就會被淘汰;而有的數據則被分到一類繼續用于分析研究。例如,群眾消費情況研究脫出中,可分類管理收入不同的群體,參考經濟收入及消費水平進行合理分類,做好各層次群體實際消費水平的統計。此外,經濟統計中,降維方法的效果也是非常明顯的,經濟統計所需的時間、人力與物力成本比較高,且包含很多統計數據與指標,應用降維技術檢索處理。降維方法比較多,比如主成分降維以及因子分析等方法。經濟統計中數據挖掘技術應用日益廣泛,尤其是銀行信貸風險調查中取得了很好的應用效果。

二、經濟統計中數據挖掘技術具體應用

(一)應用于調查數據預處理

經濟數據統計活動中,經濟數據預處理是比較常用的處理方法。數據預處理根本原因在于挖掘技術自身受很多經濟條件影響,無法完全代替經濟系統收集作用,只是智能化分析基礎信息并在統計調查工作中獲得復雜數據。處理內容涉及很多種類,比如處理不規范、處理錯誤以及處理差距大的數據信息。本質上來講其都屬于“數據清洗”,具體方法包含插值法與均值法等,如果數據存在明顯異常且數量比較少就可直接刪除。

(1)搜集到的數據并非是完整的,有的數據不統一,有的由噪音,甚至還有的數據出現空值。作為一種基礎處理方法,數據預處理手段可體前對經濟統計數據信息進行處理。實際工作中,其主要由數據清理、集成及變換等內容構成。

數據清理。其主要指經濟統計數據信息中,采取有效方法去掉不完整的、有噪音與空值的信息。通常,主要方法為均值、平滑、預測與頻率統計等四種方法。實際工作中要根據實際情況合理選用數據信息統計分析方法。經濟統計工作中,數據存在噪音抑或是數據點是空值,可選用均值法清理數據。數據中噪音與空值,也可選用平滑法處理。其不同于均值法,平滑法是通過加權平均數代替均值法平均數,其充分考慮數據對結果權重造成的影響。該統計方法的應用利于獲得更加真實的計算結果。均值法是利用均值完善數據,以此獲得更加準確的統計數據分析結果。兩種方法有不同的特點,具體要結合實際情況合理選用數據處理方法。

(2)數據集成。其簡單來講就是數據搜集,分類整理地區內所有經濟生產總值并集中討論,這就是應用數據集成思想的過程。比如,應用該思想計算省級單位國民生產總值與區級國民生產總值。實際工作中,對于常見問題與處理方法主要為:首先模式集成。當前,互聯網技術水平不斷提高,應用計算機發掘數據是比較常見的模式。因數據庫間涉及并列與包含等復雜關系,怎樣判斷同名文件夾內容是否相同,集成模式是十分必要的,以此創造便利條件。另一方面,冗余問題。其是根據相關關系判定的,具有一定關系的具體對象,公式中代入方差等決定性因素,判斷r值與1、0之間的關系,越接近于1絕對值,相關性就越大。反之密切度就越小,比如我國房價與人民工資水平間的關系,就可采用這一方法進行研究。

(3)數據變換。其主要指采取相應的方式方法將數據變換為滿足信息挖掘要求的數據。其主要包含數據規范化與泛化兩種。其中泛化主要指應用高層次數據代替低層次數據。其包含數據連續性。當前處理方法無法對數據進行連續處理,使得數據離散。其具體是利用區間劃分,以標號代替部分數據保持數據連續性。實際計算過程中應盡可能縮減數據搜集梁,此過程也是概念分層。

(二)應用決策樹方法

統計工作中應用數據挖掘技術,首先應系統化分析相關數據,數據完成分析后進行輸出。采用該方法劃分數據類型,構建決策樹結構具有非常重要的意義。首先,分析數據基本模型,再選用訓練集構建決策樹,精簡處理數據決策樹。其次,合理劃分決策樹,從根部開始劃分數據,然后是樹干與樹丫等部分的數據分類,直到所有輸入的數據符合要求。

應用決策樹進行數據分類時,首先要構建完整的決策樹結構。(1)構建分析輸出基本模型,借助訓練集構建一顆決策樹并做好精簡。(2)對完成構建的決策樹做好數據分類,從其根本開始想樹干、樹丫延伸逐步分類,所輸入的數據與條件設置相符合后才能停止,此過程也屬于遞歸過程,逐步輸入數據。實際工作中應用決策樹方法時其停止條件主要有:即一個節點所有數據都屬于同一類別,此時數據停止;另一方面,沒有分類屬性可繼續再次分割數據。數據挖掘預測與分類中,可應用決策樹分類方法解決實際遇到的問題。構建結束后,根據用戶使用需求,用戶適當地調整構建完成的決策樹,確保決策樹分類數據信息符合用戶使用需求,減小決策樹數據輸出變化,增強其穩定性,保障信息質量。

比如某地企業每年上報數據構建序列模式,獲得企業當年預測值。對比企業上報數據與預測值得到差別率。假若該差比率高于20%,則企業為A類;差別率在10%-20%之間,就是B累;低于10%屬于C類。結合企業規模變化率與可能出現的經營事件構建決策樹。假若企業上報數據與預測值間差距比較大,就要將其做好主要調查對象。

(三)應用遺傳算法

其是根據生物自然及遺傳機理,隨意抽取的一種算法。實際應用過程中要綜合考慮各類問題,加強被指定群體信息數據采集,整合分析隱含信息前提下獲得最終結果。因該算法具有明顯的隱含性,因而可與其他模型結合起來使用采集隱含數據。然后對現有挖掘的數據信息進行深入分析,并應用于實踐中。此過程中,因經濟問題并非停止不變的,其內部聯系復雜,參考遺傳算法,從源頭向下延伸獲得有效的數據,對數據信息從整體上進行分析,保障經濟問題更加而具體,確保相關人員直觀地處理問題,有效解決各類隱性問題。在此基礎上,確保順利進行統計工作。

三、數據挖掘技術未來發展趨勢

未來社會發展中,數據挖掘技術的應用將更具有效、綜合與適用性特點。為了系統化認識數據挖掘技術價值,本文將從以下幾方面發展趨勢進行探究研究,希望未來發展中數據挖掘技術能夠充分發揮其作用,為統計工作可持續發展目標的實現提供推動力。

(一)信息管理有效性

對于數據信息應用數據挖掘技術進行深層次加工,有效開展統計工作。其有明顯的目的性,且實際應用中,統計數據長期積累過程中深處理加工基礎數據。實際應用時要結合用戶數據使用需求,從不同角度對所用數據信息進行分析,分類統計數據信息,對原有數據庫進行科學整理。利用該形式,還可提高數據信息管理效率。

(二)數據分析綜合性

從本質上來講,作為一項系統化數據統計工具,數據挖掘技術并非單一化的數據分析,可滿足不同使用者的不同信息需求。近些年,我國社會經濟保持快速發展勢頭,此種情況下經濟管理中統計分析社會內部經濟相關發展數據。此過程中要注意,不同數據信息有不同的管理權限及處理權限,所以面對多元化需求,相關經濟管理部門要合理低統計分析經濟管理內容,促使數據信息順利轉換為不同數據形式,根據信息來源與統計計算方法,對其可靠性做出科學評估,從而獲得更加準確的數據統計信息。

(三)技術適用性強

國內經濟管理部門,職權管理工作表現的不夠集中,各類經濟管理部門對數據信息需求量及類型也有明顯的不同。很多地區,對于統計活動,各經濟管理管理實施的傳統方法有明顯的局限性,難以利用經濟管理活動為其提供高品質的服務。實踐工作中,重復性統計或統計不完全的問題也是比較常見,直接影響到經濟數據分析的有效性。數據挖掘技術的應用可有效避免該問題,確保獲得的數據信息更加準確,整合處理數據挖掘技術,保障數據資源的豐富與多樣性是十分必要的。

四、結束語

綜上所述,現代社會發展中,經濟發展速度健康,行業內部數據挖掘有了更多的要求。同時互聯網技術的發展,為數據處理提供了新的渠道,更是對統計行業帶來的一次挑戰,有效應用數據挖掘技術,能夠為行業順利開展各項工作創造便利條件,從根本上推動社會經濟穩定發展。

猜你喜歡
決策樹數據挖掘分類
改進支持向量機在特征數據挖掘中的智能應用
基于決策樹和神經網絡的高血壓病危險因素研究
分類算一算
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
分類討論求坐標
決策樹和隨機森林方法在管理決策中的應用
教你一招:數的分類
說說分類那些事
軟件工程領域中的異常數據挖掘算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合