資訊通常「隱藏」在非顯而易見的資料中,分析人員需花費數週才能發現有用的資訊,而多數的資料並未經過分析。在未建立假設之下分析資料,進而發現假設的想法中,出現了「資料探勘(Data Mining)」的分析方法。資料探勘可以想成是為了從大量的資料發現假設或規則,所進行的一種資料分析過程。本書是學習資料探勘的入門圖解書,因為是定位在「入門」與「圖解」,所以盡力不出現數學的話題。因此,基本上是採取按照手法的內容去分析,即可得出此種結果之方式來說明,對於手法的數學背景幾乎不涉獵。
本書是在如下的方針來撰寫:
1.以例題方式作為基本。
2.解說資料探勘可以做什麼?如何閱讀結果?如何活用?不說明計算方法與理論上的背景。
3.可以理解分析方法的觀念。
4.例題不偏向行銷領域,也從製造、醫學、工程等領域中列舉。
本書是以例題方式解說資料探勘的想法與方法,由於資料探勘是以大量資料作為對象,故在說明例題時,將全部資料揭載是做不到的。可是,這又會讓讀者無法一面依循資料一面去理解。因此,例題中所列舉的資料量,對資料探勘而言是不適合的少量。然而,這是為了讓讀者理解「想法」所採取的不得已作法。因此,在本書例題中出現的資料量,並非是實際資料探勘中所採用的資料量,僅止於內容的說明與用法,想進一步了解相關內容,請參考五南圖書出版的《資料探勘與顧客分析》。