# 3.3 處理屬性
在 Current relation 一欄下是 Attributes(屬性)欄。有四個按鈕,其下是當前關系中的屬性列表。該列表有3列:
1\. No.. 一個數字,用來標識數據文件中指定的各屬性的順序。
2\. 選擇框. 允許勾選關系中呈現的各屬性。
3\. Name. 數據文件中聲明的各屬性的名稱。
當點擊屬性列表中的不同行時,右邊 Selected attribute 一欄的內容隨之改變。這 一欄給出了列表中當前高亮顯示的屬性的一些描述:
1\. Name. 屬性的名稱,和屬性列表中給出的相同。
2\. Type. 屬性的類型,最常見的是分類型(Nominal)和數值型(Numeric)。
3\. Missing. 數據中該屬性缺失(或者未指定)的實例的數量(及百分比)。
4\. Distinct. 數據中該屬性包含的不同值的數目。
5\. Unique. 唯一地擁有某值的實例的數目(及百分比),這些實例每個的取值都和 別的不一樣。
在這些統計量的下面是一個列表,根據屬性的不同類型,它顯示了關于這個屬性中儲存 的值的更多信息。如果屬性是分類型的,列表將包含該屬性的每個可能值以及取那個值的 實例的數目。如果屬性是數值型的,列表將給出四個統計量來描述數據取值的分布—最小 值、最大值、平均值和標準差。在這些統計量的下方,有一個彩色的直方圖,根據直方圖 上方一欄所選擇的 class 屬性來著色。(在點擊時,該欄將顯示一個可供選擇的下拉列表。) 注意僅有分類型的 class 屬性才會讓直方圖出現彩色。最后,若點擊 Visualize All 按鈕, 將在一個單獨的窗口中顯示數據集中所有屬性的直方圖。
回到屬性列表,開始時所有的選擇框都是沒有被勾選的。可通過逐個點擊來勾選/取消。 以上的4個按鈕也可用于改變選擇:
1\. All. 所有選擇框都被勾選。
2\. None. 所有選擇框被取消(沒有勾選)。
3\. Invert. 已勾選的選擇框都被取消,反之亦然。
4\. Pattern. 讓用戶基于 Perl 5 正則表達式來選擇屬性。例如,用 *_id 選擇所有名 稱以 _id 結束的屬性。
選中了想要的屬性后,可通過點擊屬性列表下的 Remove 按鈕刪除他們。注意可通 過點擊位于 Preprocess 面板的右上角的 Edit 按鈕旁的 Undo 按鈕來取消操作。
- 1 啟動 WEKA
- 2 WEKA Explorer
- 2.1 標簽頁
- 2.2 狀態欄
- 2.3 Log 按鈕
- 2.4 WEKA 狀態圖標
- 3 預處理
- 3.1 載入數據
- 3.2 當前關系
- 3.3 處理屬性
- 3.4 使用篩選器
- 4 分類
- 4.1 選擇分類器
- 4.2 測試選項
- 4.3 Class 屬性
- 4.4 訓練分類器
- 4.5 分類器輸出文本
- 4.6 結果列表
- 5 聚類
- 5.1 選擇聚類器(Clusterer)
- 5.2 聚類模式
- 5.3 忽略屬性
- 5.4 學習聚類
- 6 關聯規則
- 6.1 設定
- 6.2 學習關聯規則
- 7 屬性選擇
- 7.1 搜索與評估
- 7.2 選項
- 7.3 執行選擇
- 8 可視化
- 8.1 散點圖矩陣
- 8.2 選擇單獨的二維散點圖
- 8.3 選擇實例
- 參考文獻