# 3.4 使用篩選器
在預處理階段,可以定義篩選器來以各種方式對數據進行變換。Filter 一欄用于對各
種篩選器進行必要的設置。Filter 一欄的左邊是一個 Choose 按鈕。點擊這個按鈕就可 選擇 WEKA 中的某個篩選器。選定一個篩選器后,它的名字和選項會顯示在 Choose 按 鈕旁邊的文本框中。用鼠標左鍵點擊這個框,將出現一個 GenericObjectEditor(通用對象 編輯器)對話框。用鼠標右鍵(或Alt+Shift+左鍵)點擊將出現一個菜單,你可從中選擇, 要么在 GenericObjectEditor 對話框中顯示相關屬性,要么將當前的設置字符復制到剪貼 板。

GenericObjectEditor 對話框
GenericObjectEditor 對話框可以用來配置一個篩選器。同樣的對話框也用于配置其他 對象,例如分類器(classifier)和 聚類器(clusterers)(見下文)。窗口中的字段反映了可 用的選項。點擊它們中間的一個便可改變 filter 的設置。例如,某項設置可能是一串文本 字符,這時將字符串輸入相應的文本框中即可。或者它可能會給出一個下拉框,列出可供 選擇的幾個狀態。也可能是其他一些操作,根據所需的信息而有所區別。如果把將鼠標指 針停留在某個字段上,會出現一個小提示來給出相應選項的信息。而有關該篩選器和它的 選項的更多信息可通過點擊 GenericObjectEditor 窗口頂部 About 面板中的 More 按 鈕來獲得。
除了 More 按鈕,某些對象也會在關于欄中顯示一些有關其功能的簡短描述。點擊 More 按鈕,會出現一個窗口來描述了不同的選項分別起什么作用。有的還另外一個 Capabilities 按鈕,它能列出該對象可處理的屬性和 class 屬性的類型。
GenericObjectEditor 對話框的底部有4個按鈕。前兩個 Open... 和 Save... 允許存儲 對該對象的配置,以備將來之用。Cancel 按鈕用于直接退出,任何已作出的改變都將被 忽略。當前選擇的對象和設置令人滿意后,點擊 OK 返回到主 Explorer 窗口。
應用篩選器
選擇并配置好一個篩選器后,就可通過點擊 Preprocess 面板的 Filter 攔右邊的 Apply 按鈕將之應用于數據集上。然后 Preprocess 面板將顯示轉換過的數據。可點擊 Undo 按鈕取消改變。你也可使用 Edit... 按鈕在一個數據集編輯器中手動修改你的數 據。最后,點擊 Preprocess 面板右上角的 Save... 按鈕將用同樣的格式保存當前的關系, 以備將來使用。
注意:一些篩選器會依據是否設置了 class 屬性來做出不同的動作。(點擊直方圖上 方那一欄時,會出現一個可供選擇的下拉列表。)特別的,`supervised filters`(監督 式篩選器)需要設置一個 class 屬性, 而某些`unsupervised attribute filters`(非監督 式屬性篩選器)將忽略 class 屬性。注意也可以將 Class 設成 None,這時沒有設置 class 屬性。
> 3 篩選器的英文原文是 filter,與數據庫術語中的篩選有關。但是 WEKA 中的 filter 不僅能提供篩選功能, 還涵蓋了其他各種數據變換。—譯注。
- 1 啟動 WEKA
- 2 WEKA Explorer
- 2.1 標簽頁
- 2.2 狀態欄
- 2.3 Log 按鈕
- 2.4 WEKA 狀態圖標
- 3 預處理
- 3.1 載入數據
- 3.2 當前關系
- 3.3 處理屬性
- 3.4 使用篩選器
- 4 分類
- 4.1 選擇分類器
- 4.2 測試選項
- 4.3 Class 屬性
- 4.4 訓練分類器
- 4.5 分類器輸出文本
- 4.6 結果列表
- 5 聚類
- 5.1 選擇聚類器(Clusterer)
- 5.2 聚類模式
- 5.3 忽略屬性
- 5.4 學習聚類
- 6 關聯規則
- 6.1 設定
- 6.2 學習關聯規則
- 7 屬性選擇
- 7.1 搜索與評估
- 7.2 選項
- 7.3 執行選擇
- 8 可視化
- 8.1 散點圖矩陣
- 8.2 選擇單獨的二維散點圖
- 8.3 選擇實例
- 參考文獻