段合并 · Elasticsearch7.x

由于自動刷新流程每秒會創建一個新的段，這樣會導致短時間內的段數量暴增。而段數目太多會帶來較大的麻煩。每一個段都會消耗文件句柄、內存和 cpu 運行周期。更重要的是，每個搜索請求都必須輪流檢查每個段；所以段越多，搜索也就越慢。 <br/> Elasticsearch 通過在后臺進行段合并來解決這個問題。小的段被合并到大的段，然后這些大的段再被合并到更大的段。 <br/> 段合并的時候會將那些舊的已刪除文檔從文件系統中清除。被刪除的文檔（或被更新文檔的舊版本）不會被拷貝到新的大段中。 <br/> 啟動段合并不需要你做任何事，進行索引和搜索時會自動進行： 1. 當索引的時候，刷新（refresh）操作會創建新的段并將段打開以供搜索使用。 2. 合并進程選擇一小部分大小相似的段，并且在后臺將它們合并到更大的段中。這并不會中斷索引和搜索。 :-: ![](https://img.kancloud.cn/2d/f9/2df9550b1cc09f20220f10574031ea92_490x283.png) 3. 一旦合并結束，老的段被刪除。 * 新的段被刷新（flush）到了磁盤。寫入一個包含新段且排除舊的和較小的段的新提交點。 * 新的段被打開用來搜索。 * 老的段被刪除。 :-: ![](https://img.kancloud.cn/d7/86/d78631cfe3b9ae4a6fc8abeae96a6eb1_510x296.png) <br/> 合并大的段需要消耗大量的 I/O 和 CPU 資源，如果任其發展會影響搜索性能。Elasticsearch在默認情況下會對合并流程進行資源限制，所以搜索仍然有足夠的資源很好地執行。