# 4.2 測試選項
應用選定的分類器后得到的結果會根據 Test Option 一欄中的選擇來進行測試。共有四種測試模式:
1\. Using training set. 根據分類器在用來訓練的實例上的預測效果來評價它。
2\. Supplied test set. 從文件載入的一組實例,根據分類器在這組實例上的預測效 果來評價它。點擊 Set… 按鈕將打開一個對話框來選擇用來測試的文件。
3\. Cross-validation. 使用交叉驗證來評價分類器,所用的折數填在 Folds 文本框 中。
4\. Percentage split. 從數據集中按一定百分比取出部分數據放在一邊作測試用,根 據分類器這些實例上預測效果來評價它。取出的數據量由 % 一欄中的值決定。 注意:不管使用哪種測試方法,得到的模型總是從所有訓練數據中構建的。點擊 More
options 按鈕可以設置更多的測試選項:
1\. Output model. 輸出基于整個訓練集的分類模型,從而模型可以被查看,可視化 等。該選項默認詩選中的。
2\. Output per-class stats. 輸出每個 class 的準確度/反饋率(precision/recall) 和正確/錯誤(true/false)的統計量。該選項也是默認選中的
3\. Output evaluation measures. 輸出熵估計度量。該選項默認沒有選中。
4\. Output confusion matrix. 輸出分類器預測結果的混淆矩陣。該選項默認選中。
5\. Store predictions for visualization. 記錄分類器的預測結果使得它們能被可 視化表示。
6\. Output predictions. 輸出測試數據的預測結果。注意在交叉驗證時,實例的編 號不代表它在數據集中的位置。
7\. Cost-sensitive evaluation. 誤差將根據一個價值矩陣來估計。Set… 按鈕用來 指定價值矩陣。
8\. Random seed for xval / % Split. 指定一個隨即種子,當出于評價的目的需要 分割數據時,它用來隨機化數據。
> 4 WEKA 中的分類和回歸都放入了 classify 頁面中,相應的工具都叫做分類器(classifier)。參考4.3節。
- 1 啟動 WEKA
- 2 WEKA Explorer
- 2.1 標簽頁
- 2.2 狀態欄
- 2.3 Log 按鈕
- 2.4 WEKA 狀態圖標
- 3 預處理
- 3.1 載入數據
- 3.2 當前關系
- 3.3 處理屬性
- 3.4 使用篩選器
- 4 分類
- 4.1 選擇分類器
- 4.2 測試選項
- 4.3 Class 屬性
- 4.4 訓練分類器
- 4.5 分類器輸出文本
- 4.6 結果列表
- 5 聚類
- 5.1 選擇聚類器(Clusterer)
- 5.2 聚類模式
- 5.3 忽略屬性
- 5.4 學習聚類
- 6 關聯規則
- 6.1 設定
- 6.2 學習關聯規則
- 7 屬性選擇
- 7.1 搜索與評估
- 7.2 選項
- 7.3 執行選擇
- 8 可視化
- 8.1 散點圖矩陣
- 8.2 選擇單獨的二維散點圖
- 8.3 選擇實例
- 參考文獻