?

一本面向中高級讀者的數據挖掘好書

2006-09-22 10:40左榮國
計算機教育 2006年9期
關鍵詞:數據倉庫數據挖掘層面

左榮國

近幾年來,隨著信息技術的飛速發展,計算機領域積累了大量的數據。從元數據的角度考慮,這些數據僅僅是數據,數據產生后,后續對元數據的再次利用卻很少。長此下去,這些數據慢慢就會變成沒有用的垃圾數據。人們越來越認識到這個問題的嚴重性,由此逐漸產生了知識發現技術,也就是數據挖掘的前身。知識發現源自于人工智能的機器學習領域,其實質是在一個已知狀態的數據集上,通過設定一定的學習算法,從數據集中獲取所謂的知識。而與此同時數據庫技術也已經發展到一定的階段,并得到了廣泛應用,各個企業都已經積累了無數的數據資源,迫切需要有一種技術能夠幫助他們從數據中發掘出其內在的規律。數據挖掘技術正好能滿足這一需求,它實質上就是知識發現技術在數據庫領域中的應用,其主要應用領域涵蓋了商務管理、生產管理、市場分析、工程設計和科學探索等。因此,可以說數據挖掘是一個從數據到知識的過程。

談到學習數據挖掘,《數據挖掘:概念與技術》就是一本全面而深入地介紹數據挖掘實用技術的經典教材。本書作者美籍華人韓家煒教授有著豐富的理論和實際經驗。在本書中,他從數據庫的角度針對數據挖掘是什么、數據挖掘能解決什么問題、數據挖掘的關鍵問題和數據挖掘涉及的相關技術等問題做了深入的分析,由淺入深地把讀者引入數據挖掘這個未知領域。

首先,數據挖掘是什么。書中指出,數據挖掘是指從大量數據中提取或挖掘知識的過程。用通俗的語言說,數據挖掘就像淘金者從石頭或沙子中尋找金子的過程。另外一個非常重要的,同時也在本書中進行了詳細說明的是,數據挖掘的對象(也就是大量數據)在什么地方?書中指出,數據挖掘主要針對關系型數據庫、數據倉庫、高級數據庫等。對于數據庫開發人員,這些都是已經比較熟悉的領域了。而本書中的數據挖掘主要針對的是數據庫系統。

其次,數據挖掘能解決什么問題。挖掘來的數據是用來解決企業中的問題的,否則挖掘就沒有任何意義了。書中指出,數據挖掘可以被用來進行市場分析和管理、風險分析和管理、缺陷分析和管理等。具體來講,比如對大學里的學生課程數據,可以用數據挖掘的方式來獲得學生姓名、地址、狀態和相關課程等信息及其相互關系。

再次,數據挖掘的關鍵問題。本書從數據挖掘方法和用戶交互、數據挖掘的性能以及不同數據庫類型的數據挖掘等多角度出發,把數據挖掘做了非常透徹的分解,并對分解后的問題逐一解決。

第四方面,數據挖掘涉及的技術。對于數據挖掘涉及的OLAP和數據倉庫、數據清理、數據集成和變換、數據簡化、數據挖掘查詢語言、數據庫支持的數據挖掘規則、數據挖掘分類和預測、數據聚合方法、對多媒體數據庫和萬維網的數據庫挖掘方法等技術,本書作者都從理論和實踐的角度作了深入的剖析,讓讀者不僅知其然,而且還知其所以然。

數據挖掘是可以由多個層面來提供支持的,包括數據庫層面、應用程序層面等。當前,包括Oracle、IBM、Sybase和Microsoft等在內的多家數據庫提供商都從數據庫層面提供了數據挖掘的支持。對于應用層面講,包括SAS、SPSS、COGNOS等軟件在內的應用程序都對數據挖掘提供了很好的支持。本書從理論和實際相結合的角度出發,在書中提供了大量的理論、模型、算法和實際的應用例子,包括多維數據模型、三層數據倉庫架構、數據立方體的實際查詢例子等。借助本書,讀者可以理論聯系實際,把數據挖掘的應用提高一個層次。

另外,書中提供了大量的例子、習題以及一些基本概念的比較。如數據庫與數據倉庫的區別、用于數據挖掘的OLAP與數據倉庫技術等。所以,即使您對數據庫比較陌生,也能根據本書內容的安排,循序漸進地領悟到數據挖掘的真諦。同時,您可以根據書中提供的習題,檢驗自己對書中內容的理解?!皩嵺`是檢驗真理的唯一標準”,書中提供的例子在實際開發應用中都會用到,讓您不會為了讀書而讀書。

總之,該書圖文并茂,理論聯系實際,非常適合從事數據挖掘研究和應用開發工作的相關人員參考書,也特別適合作為高年級本科生和研究生的專業課教材。

猜你喜歡
數據倉庫數據挖掘層面
基于數據倉庫的數據傾斜解決方案研究
數據挖掘技術在內河航道維護管理中的應用研究
數據挖掘綜述
軟件工程領域中的異常數據挖掘算法
數據倉庫系統設計與實現
基于R的醫學大數據挖掘系統研究
二孩,人生如果多一次選擇!
數據復用在存儲數據倉庫中的運用
數據倉庫技術在檔案管理領域的應用
橫看成嶺側成峰
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合