[TOC]
## 四、綜合題
**1.請描述K-Means算法的步驟,算法的缺點及改進。**
**2.請簡述KNN算法的步驟。**
**3.請列舉不少于四個分類算法,簡單介紹算法原理**
**4.下表給出了一組數據的相似矩陣**

**  1)使用單鏈接(MIN)方式進行層次聚類,請畫出對應的樹狀圖。**
**  2)使用全鏈接(MAX)方式進行層次聚類,請畫出對應的樹狀圖。**
**5.請對比分析boosting和bagging。**
**6.請簡述數據挖掘的整個過程。**
**7.請談談你對特征工程的理解。**
**8.請簡述什么是過擬合問題、產生的原因有哪些以及解決過擬合的辦法。**