[TOC]
## 二、多選題
**1. Pandas的數據結構包括以下哪些( )** AB
A. Series
B. Dataframe
C. dict
D. list
**2. K-Means算法的缺點主要包括( )** ABCD
A.初始點的選擇可能會影響最終的結果
B.不能解決非凸數據問題
C.容易受到噪聲點的影響
D. K值很難確定
**3.下列關于集成學習描述正確的是( )** ACD
A.集成學習本身并不是一個單獨的機器學習算法,而是通過構建并結合多個機器學習器來完成學習任務,以達到獲得比單個學習器更好的學習效果的一種機器學習方法。
B.集成學習的基學習器要求使用不同算法
C.集成學習的基學習器可以使用相同的算法生成
D.集成學習主要分為Bagging、Boosting和Stacking
**4.假設我們要解決一個二類分類問題,我們已經建立好了模型,輸出是0或1,初始時設閾值為0.5,超過0.5概率估計,就判別為1,否則就判別為0 ;如果我們現在用另一個大于0.5的閾值,那么現在關于模型說法,正確的是:( )** BC
A.模型分類的召回率會降低或不變
B.模型分類的召回率會升高
C.模型分類精確率(Precision)會升高或不變
D.模型分類精確率(Precision)會發生變化,但不能確定是升高還是降低
**5.以下sklearn中的模型,哪些是解決回歸分析的?( )** ABD
A. LinearRegression
B. SVR
C. LogisticRegression
D. Ridge
**6.如下圖所示,對同一數據集進行訓練,得到3個模型。對于這3個模型的評估,下列說法正確的
是?( )** ACD

A.第一個模型的訓練誤差最大
B.第三個模型性能最好,因為其訓練誤差最小
C.第二個模型最穩健,其在測試集上表現應該最好
D.第三個模型過擬合
**7.影響聚類算法結果的主要因素有( )** ACD
A.特征選取
B.已知類別的樣本質量
C.模式相似性測度
D.分類準則
**8.決 策 樹 算 法 很 容 易 出 現 過 擬 合 , 我 們 通 常 會 使 用 一 些 剪 枝 手 段 來 改 善 這 一 現 象。 對 于sklearn.tree.DecisionTreeClassifier模型,下面這些參數哪些能起到剪枝的作用( )** BCD
A. criterion
B. max\_depth
C. min\_samples\_split
D. min\_impurity\_split