Compaction相關控制參數 · Hadoop2.x

hbase1.x版本和2.x版本不同，下面分別介紹兩種版本的相關控制參數。 **1. hbase 1.x版本的參數** <hr/> （1）Minor Compaction方式的相關控制參數 | 參數名 | 說明 | | --- | --- | | hbase.hregion.memstore.flush.size | 緩存閾值大小 | | hbase.hstore.compaction.max | 每次compact的HFile的最大數目，默認是10 | | hbase.hstore.compaction.kv.max | compact時批量讀取和寫入KeyValue數據的數量，默認是10 | （2）Major Compaction方式的相關控制參數 | 參數名 | 說明 | | --- | --- | | hbase.hregion.majorcompaction | 時間間隔 | **2. hbase 2.x版本的相關控制參數** <hr/> （1）Minor Compaction方式的相關控制參數 | 參數名 | 默認值 | 描述 | | --- | --- | --- | | hbase.hstore.compaction.max | 10 | 表示一次 minor compaction 中最多選取 10個 store file | | hbase.hstore.compaction.min | 3 | 表示至少需要三個滿足條件的 store file 時，minor compaction 才會啟動 | | hbase.hstore.compaction.min.size | | 表示文件大小小于該值的store file 一定會加入到minor compaction 的 store file 中 | | hbase.hstore.compaction.max.size | | 表示文件大小大于該值的StoreFile，一定會被 minor compaction 排除 | | hbase.hstore.compaction.ratio | 1.2 | 將 store file 按照文件年齡排序（older to younger），minor compaction 總是從older store file 開始選擇 | 將 StoreFile 按照文件年齡排序，minor compaction 總是從 older store file 開始選擇，計算公式： ```[math] 該文件的大小<(所有文件大小總和-該文件大小)*比例因子 ``` 即該文件的 size 小于它后面 hbase.hstore.compaction.max 個 store file size 之和乘以 ratio 的值，那么該 store file 將加入到 minor compaction 中。如果滿足 minor compaction 條件的文件數量大于 hbase.hstore.compaction.min，才會啟動minor compaction。 hbase.hstore.compaction.min.size 和 hbase.hstore.compaction.max.size 參數用于控制特殊大小的文件直接判斷是否加入 minor compaction。 如果該文件大小小于最小合并大小（minCompactSize），則連上面那個公式都不需要套用，直接進入待合并列表。最小合并大小的配置項 hbase.hstore.compaction.min.size 。如果沒設定該配置項，則使用hbase.hregion.memstore.flush.size。被挑選的文件必須能通過以上提到的篩選條件，并且組合內含有的文件數必須大于 hbase.hstore.compaction.min，小于hbase.hstore.compaction.max。因為文件太少了沒必要合并，還浪費資源；文件太多了太消耗資源，怕機器受不了。 上面的選擇方式，會形成多個滿足條件的 StoreFile 組合，然后再比較哪個文件組合包含的文件更多，就合并哪個組合。如果出現平局，就挑選那個文件尺寸總和更小的組合。 （2）Major Compaction方式的相關控制參數 | 參數名 | 默認值 | 描述 | | --- | --- | --- | | hbase.hregion.majorcompaction | 7天 | majorcompacttion 發生的周期，單位是毫秒 | 注意：雖然有以上機制控制 Major Compaction 的發生時機，但是由于 Major Compaction 時對系統的壓力是非常大的，所以建議關閉自動 Major Compaction（hbase.hregion.majorcompaction=0），采用手動觸發的方式，定期進行 Major Compaction。手動 Major Compaction 命令為： ```sql hbase(main):002:0> major_compact Examples: Compact all regions in a table: hbase> major_compact 't1' hbase> major_compact 'ns1:t1' Compact an entire region: hbase> major_compact 'r1' Compact a single column family within a region: hbase> major_compact 'r1', 'c1' Compact a single column family within a table: hbase> major_compact 't1', 'c1' ```