[TOC]
### 1.產生
數據爆炸但知識貧乏\=解決辦法\=>數據倉庫、OLAP、數據挖掘
### 2.概念
數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識,尋找其規律的技術,結合統計學、機器學習和人工智能技術的綜合的過程
數據\=>消息\=>知識\=>智慧

### 3.數據挖掘的一般過程

### 4.數據挖掘的基本目標
預測任務的目標是根據自變量屬性的值,預測因變量屬性的值,用來做預測的屬性稱為自變量(independent variable)或是特征(features),被預測的屬性值稱為因變量(dependent variable)或是標簽(label)
描述任務的目標是導出概括數據中潛在聯系的模式(關聯、趨勢、聚類、軌跡和異常),本質上,
描述性數據挖掘任務大都是探查性的,并且對導出的模式進行技術驗證和解釋結果。
### 5.數據挖掘的模型


### 6.工具
* Weka
* Orange
* sklearn
* ...