字段數據 · Elasticsearch權威指南（中文版）

## 數據字段本章的目的在于介紹關于ElasticSearch內部的一些運行情況。在這里我們先不介紹新的知識點，數據字段是我們要經常查閱的內容之一，但我們使用的時候不必太在意。當你對一個字段進行排序時，ElasticSearch 需要進入每個匹配到的文檔得到相關的值。倒排索引在用于搜索時是非常卓越的，但卻不是理想的排序結構。 * 當搜索的時候，我們需要用檢索詞去遍歷所有的文檔。 * 當排序的時候，我們需要遍歷文檔中所有的值，我們需要做反倒序排列操作。為了提高排序效率，ElasticSearch 會將所有字段的值加載到內存中，這就叫做"數據字段"。 >**重要**： >ElasticSearch將所有字段數據加載到內存中并不是匹配到的那部分數據。 >而是索引下所有文檔中的值，包括所有類型。將所有字段數據加載到內存中是因為從硬盤反向倒排索引是非常緩慢的。盡管你這次請求需要的是某些文檔中的部分數據，但你下個請求卻需要另外的數據，所以將所有字段數據一次性加載到內存中是十分必要的。 ElasticSearch中的字段數據常被應用到以下場景： * 對一個字段進行排序 * 對一個字段進行聚合 * 某些過濾，比如地理位置過濾 * 某些與字段相關的腳本計算毫無疑問，這會消耗掉很多內存，尤其是大量的字符串數據 -- string字段可能包含很多不同的值，比如郵件內容。值得慶幸的是，內存不足是可以通過橫向擴展解決的，我們可以增加更多的節點到集群。現在，你只需要知道字段數據是什么，和什么時候內存不足就可以了。稍后我們會講述字段數據到底消耗了多少內存，如何限制ElasticSearch可以使用的內存，以及如何預加載字段數據以提高用戶體驗。