?

計算機數據挖掘技術的開發及其應用分析

2022-11-26 19:15南陽市中心醫院孟維成
電子世界 2022年1期
關鍵詞:決策樹數據挖掘神經網絡

南陽市中心醫院 孟維成

本文首先對大數據技術、大數據需求、數據挖掘技術相關概念簡要敘述,然后從傳統方法、常用算法、軸線型數據挖掘法、環形數據挖掘法、決策樹數據挖掘法、可視化技術、數據聯機處理、決策樹與神經網絡等方面闡述計算機數據挖掘技術開發技術。最后從市場、電信、金融、人事、檔案、安全、教育、開發、科技等領域闡述計算機數據挖掘技術的應用方向。

計算機數據挖掘技術極大地提高了人們的生活質量,滿足了人們對物質和精神需求,推動了社會的進步和發展。但是計算機數據挖掘技術也會對人們的生活帶來一定的困擾,人們的隱私安全在計算機數據挖掘技術下無法得到保障,因此計算機數據挖掘技術這把雙刃劍必須得到合理應用。

1 計算機數據挖掘技術概述

1.1 大數據技術

大數據或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。大數據具有大量、高速、多樣、低價值密度、真實等特點,大數據技術可以掌握龐大的數據信息,并且對這些數據進行專業化處理,最終實現數據增值盈利,信息化時代下大數據技術的重要性還會逐漸提高。

1.2 大數據需求

大數據需求必須以用戶為中心進行分析,以企業用戶為例,企業必須通過市場挖掘潛在客戶,然后通過市場操作和商業談判獲取經濟效益,大數據技術在企業中可以發揮出信息數據收集分析的作用。企業在市場操作和商業談判過程中必須對合作伙伴、競爭對手、市場行業發展方向詳細了解才能作出正確決策,大數據技術可以在此過程中信息統計匯總的方式得到準確調查結果。這樣企業管理人員才能對市場發展方向加深了解,最終企業才能研發出合適的產品,為企業創造更大經濟效益。

1.3 數據挖掘技術

數據挖掘是指從大量的數據中通過算法搜索隱藏于其中信息的過程。數據挖掘通常與計算機科學有關,并通過統計、在線分析處理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。數據挖掘技術可以將大量數據轉換成有用的信息和知識,并將其廣泛用于商務管理、生產控制、市場分析、工程設計和科學探索等領域中。

2 計算機數據挖掘技術開發技術

2.1 傳統方法

計算機數據挖掘技術開發使用的傳統方法包括抽樣分析法、多元統計分析法、統計預測法等,抽樣分析法通過抽樣分析降低數據挖掘工作量,但是最終得到的數據分析結果與總體結果差異不大;多元統計分析法通過對復雜結構和較高維數的因子和數據進行分析,最終得到比較科學準確的數據分析結果;統計預測法主要通過回歸分析和序列分析預測數據發展規律,為相關人員提供參考。

2.2 常用算法

計算機數據挖掘技術開發常用算法包括回歸算法、分類算法、聚類分析、神經網絡方法、關聯規則和Web數據挖掘,這些算法具有高效性、優越性和全面性,能夠使用當前計算機數據挖掘技術的各個應用方向?;貧w算法主要分析數據之間的規則或者相似性;分類算法主要根據數據屬性之間的不同之處對其進行分類;聚類分析主要根據數據屬性之間的相似處對其進行分類;神經網絡方法通過集中測試對數據進行處理;關聯規則通過數據之間的聯系進行數據處理;Web數據挖掘通過網頁收集各類數據。

2.3 軸線型數據挖掘法

計算機數據挖掘技術開發中,軸線型數據挖掘法指的是按照軸線總結數據挖掘信息輸入、信息處理、信息研究、信息輸出各個流程,其中信息輸入在軸線型數據挖掘法中作為起點,信息輸出在軸線型數據挖掘法中作為終點,從起點到終點即可完成數據挖掘。軸線型數據挖掘法的優點是時效性強、技術原理簡單、操作便捷,但是該技術沒有對挖掘的數據進行分類,因此數據挖掘時間過長是該方法的缺點,總體來說軸線型數據挖掘法在開發中的應用比較普遍。

2.4 環形數據挖掘法

計算機數據挖掘技術開發中,環形數據挖掘法指的是將信息輸入、信息處理、信息研究、信息輸出各個數據挖掘流程與實時操作聯系起來,將每個數據挖掘流程分別打造成不同的數據挖掘閉環,最終信息輸出流程可以得到相對精準的信息數據。環形數據挖掘法的優點是持續性強、目標性強、數據挖掘效率高,但是該方法的環形數據挖掘流程相對于軸線型數據挖掘流程來說更加復雜,因此該方法的缺點是對開發技術人員的要求較高且實際應用可行性低。

2.5 決策樹數據挖掘法

計算機數據挖掘技術開發中,決策樹數據挖掘法指的是按照決策樹統計分類方法對體量龐大的數據進行挖掘,該方法中包括了對其他計算統計方法的應用,否則無法得到科學準確的分類結果。決策樹數據挖掘法的優點是可以處理體量龐大的數據,而且能夠直接利用統計方法對數據進行挖掘和分類,數據挖掘的目標性比較強,但是該技術對計算機技術的依賴性比較強,目前計算機技術仍然在不斷發展,未來該技術仍然較大進步和發展空間。

2.6 可視化技術

計算機數據挖掘技術極大地提高了可視化技術的應用效果,可視化技術可以通過圖表等更加直觀的方式將數據特征完全展現出來,給人帶來更加強烈的視覺感受。而計算機數據挖掘技術本身無法將數據特征展現出來,只有將該技術與可視化技術相結合,才能提高可視化技術和計算機數據挖掘技術的效率,進而充分展現二者的優勢,因此可視化技術在計算機數據挖掘技術開發中的使用比較常見。

2.7 數據聯機處理

計算機數據挖掘技術可以極大地提高數據信息處理效率,當數據挖掘過程中遇到體量龐大的數據時往往效率不如人意,此時可以通過數據聯機處理充分將計算機的數據處理能力利用起來,以達到提高整個數據挖掘技術數據效率的目的。正常情況下,只有計算機數據挖掘技術數據體量龐大時才會采用該種方法,該方法的使用對計算機的協同性具有較高要求,因此數據聯機處理并不會對數據處理效果造成負面影響。

2.8 決策樹與神經網絡

計算機數據挖掘技術開發可以將決策樹與神經網絡算法共合使用,決策樹是一種數據整合和分類的高效統計方法,神經網絡可以通過輸入層、隱藏層和輸出層得到較為科學準確的數據,決策樹與神經網絡下計算機數據挖掘技術可以通過分析數據屬性與數據值之間的映射關系,憑借決策樹的分類優勢實現數據的單一輸出。目前該技術在計算機數據挖掘技術開發中比較常見,研究人員可以通過決策樹與神經網絡對數據進行預測分析。

3 計算機數據挖掘技術的應用方向

3.1 統計分析技術

計算機數據挖掘技術在市場領域中可以使用常用傳統方法中的抽樣分析法和多元統計分析法,基于以上兩種計算機數據挖掘技術可以分別對用戶的搜索行為、連續訪問網頁行為、交易行為進行分析,然后根據數據統計結果即可分析出用戶的購物需求,最后根據環形數據挖掘法不斷為用戶推薦商品數據,直到用戶完成交易。在信息化時代下,企業經營管理面臨的風險比較大,如果企業不能與時俱進提高計算機數據挖掘技術效果,則在市場競爭中必然處于不利地位。

3.2 信息識別技術

電信企業可以基于環形數據挖掘法對客戶欺詐進行識別、對客戶流失進行預測、對客戶進行細分、輔助完成交叉捆綁銷售??蛻羝墼p識別需要先基于用戶屬性信息、企業服務內容、客戶消費數據等信息構建欺詐關聯模型,通過量化欺詐及時發現惡意欠費的客戶;客戶流失預測需要根據用戶的歷史行為數據構建忠誠度評估模型,判斷用戶是否會轉投其他電信運營商;客戶細分需要通過對用戶地位、使用率、使用場合、忠誠度、購買態度等信息進行挖掘,進而進行針對性營銷;交叉捆綁銷售可以對用戶的消費特征進行提取,如果用戶消費特征與其他套餐重合,則可以對該客戶推銷對應套餐。

3.3 聚類分析技術

計算機數據挖掘技術在金融領域可以采用常用算法中的回歸算法、分類算法、聚類分析、神經網絡方法對目標市場客戶進行分類與聚類分析,然后通過數據處理轉換以及人工智能數據挖掘得到該用戶的金融產品使用頻率信息,最后根據忠誠度模型判斷用戶是否會流失,若用戶存在流失可能則需要通過特征提取尋找相似的用戶進行替代。除此之外,金融領域還可與基于多維數據分析和數據挖掘設計技術構造金融數據庫,對負債和收入等數據倉庫、數據特征、數據立方體進行孤立點分析,推動金融數據倉庫的構造。

計算機數據挖掘技術在人事領域可以為人才匹配合適的崗位,首先各類招聘軟件企業可以基于環形數據挖掘法不斷提取各個企業崗位的特征和人才檔案關鍵詞,然后不斷使用聚類和分類算法對人才和崗位進行匹配,若始終無法匹配成功則對其他關鍵詞特征再次提煉,直到人才和崗位匹配成功,最后將人事信息儲存到數據庫。如果該網站發現該人事簡歷再次啟用,則重新提煉檔案關鍵詞,持續利用決策樹與神經網絡算法為其推薦更加優質的企業崗位信息。

計算機數據挖掘技術在開發領域可以基于抽樣分析法和多元統計分析法分析開發系統所需要的功能,然后確定開發系統的框架、算法、數據庫架構技術,若采用神經網絡架構則可以將開發系統分為輸入層、隱藏層和輸出層,最后基于網絡神經算法和決策樹算法構建開發系統數據庫,這樣根據提取的特征即可分別實現開發系統的各個功能。

3.4 信息檢測技術

計算機數據挖掘技術在檔案領域對數據信息處理效率具有較高要求,因此可以基于數據聯機處理計算機數據挖掘技術提高對檔案的處理能力。檔案數據體量非常龐大,而且檔案數據量基本只增不減,因此必須采用數據聯機處理此類協同性和處理效率都比較高的計算機數據挖掘技術。但是檔案領域對計算機數據挖掘技術的保密性也具有一定要求,因此檔案領域必須設置檢測模塊,利用檔案錄入計算機設備接口對檔案信息安全性進行審計。其中涉及到檔案特征的提取,如果檔案特征與檔案數據庫中的病毒數據庫信息一致則會發出對應警報。

3.5 病毒防御技術

計算機數據挖掘技術在安全領域可以用于網絡病毒防御,企業必須在利用計算機數據挖掘技術收集處理數據的同時,做好網絡病毒防御工作,防止企業自身關鍵數據泄露。技術人員可以基于軸線型數據挖掘法和環型數據挖掘法構建病毒預防流程,首先使用嗅探器、解碼器對網絡信息數據進行預處理,然后使用異常分析器對網絡信息數據是否安全進行判斷,如果受到攻擊則記錄未知攻擊日志,并使用特征提取器提取病毒特征,最后完善規則庫對具備該特征的病毒進行預防,若再次受到已知攻擊則發出報警信號。

3.6 數據預測模型

計算機數據挖掘技術在教育領域可以基于神經網絡算法、決策樹、回歸分析、聚類分析建立教育行業相關信息數據預測模型,對學生的學習成績變動情況進行統計。其中貝葉斯分類和裁判分析也可以應用其中,用于對學生特征的提取,有利于分析學生的心理狀態和消費情況,學生選課系統可以作為分析學生專業方向專業的依據,專業特征與學生行為特征一致時學生有很大可能選擇該專業課程。

計算機數據挖掘技術在科技生產領域可以基于神經網絡與決策樹算法提取科學技術的參數特征,然后基于各個精度參數構建對應數據庫,最后對生產出來的產品進行精度檢測后將數據傳輸到神經網絡算法的輸入層,經過與隱藏層中的數據參數進行比對,最后即可在輸出層輸出精度參數是否符合要求的結論。除此之外,還可以通過該回歸算法、分類算法、聚類分析等計算機數據挖掘技術分析精度參數數據不符合要求的原因,這樣即可使用算法替代人工決策。

綜上所述,計算機數據挖掘技術的重要性隨著社會的發展越來越高,各個行業、領域對計算機數據挖掘技術的依賴性越來越強。因此,各個企業必須加強計算機數據挖掘技術的研究和應用,盡量利用該技術提高企業經濟效益和市場競爭力,讓企業決策管理水平得到增強,進而促進企業可持續發展。

猜你喜歡
決策樹數據挖掘神經網絡
改進支持向量機在特征數據挖掘中的智能應用
基于遞歸模糊神經網絡的風電平滑控制策略
基于決策樹和神經網絡的高血壓病危險因素研究
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
神經網絡抑制無線通信干擾探究
基于神經網絡的中小學生情感分析
決策樹和隨機森林方法在管理決策中的應用
軟件工程領域中的異常數據挖掘算法
決策樹多元分類模型預測森林植被覆蓋
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合