索引文檔流程 · Elasticsearch7.x

:-: ![](https://img.kancloud.cn/28/ff/28fffdd07c545ca27f71a3dabdd1a98c_921x332.png) 1. 協調節點默認使用文檔 `_id` 參與計算（或者通過 `routing`），以便為路由提供合適的分片位置，計算公式如下： ``` shard = hash(document_id) % (num_of_primary_shards) num_of_primary_shards：主分片的數量 ``` 2. 當分片所在的節點接收到來自協調節點的請求后，會將請求寫入到 Memory Buffer，然后定時（默認是每隔 1 秒）寫入到 Filesystem Cache，這個從 Memory Buffer 到 Filesystem Cache 的過程就叫做 refresh。 3. 當然在某些情況下，存在 Momery Buffer 和 Filesystem Cache 的數據可能會丟失，ES 是通過 translog的機制來保證數據的可靠性的。其實現機制是接收到請求后，同時也會寫入到 translog 中，當 Filesystem cache 中的數據寫入到磁盤中時，才會清除掉，這個過程叫做 flush。在 flush 過程中，內存中的緩沖將被清除，內容被寫入一個新段，段的 fsync 將創建一個新的提交點，并將內容刷新到磁盤，舊的 translog 將被刪除并開始一個新的 translog。 flush 觸發的時機是定時觸發（默認 30 分鐘）或者 translog 變得太大（默認為 512M）時。