Aggregations · my-elasticsearch-cn

# Aggregations ?聚合框架有助于根據搜索查詢提供聚合數據。它是基于簡單的構建塊也稱為整合，整合就是將復雜的數據摘要有序的放在一塊。 ? ? ? ?聚合可以被看做是從一組文件中獲取分析信息的一系列工作的統稱。聚合的實現過程就是定義這個文檔集的過程（例如，在搜索請求的基礎上，執行查詢/過濾，才能得到高水平的聚合結果）。 ? 現在有很多種集合，它們都有自己的目的和輸出。為了加強對聚合類型的理解，通常會把這些聚類行分為三類： ## Bucketing 在眾多聚合方法中，有一種叫做構建桶，它是與關鍵字和文檔標準相關聯。在執行聚合操作的過程中，文檔與所有的桶標準進行匹配，如果匹配成功之后，就將這個文件放入這個桶中。在聚合操作的最后，我們將會得到一個桶列表---每個桶中有屬于它的文檔。 ## [Metric](http://cwiki.apachecn.org/display/Elasticsearch/Metric+Aggregations) 在一組文檔中跟蹤和計算指標的聚合。 ## Matrix ?這類的聚合操作是以請求文件屬性中取出值為基礎，在多個屬性上進行操作產生一個矩陣結果。這類的絕活不支持腳本，但是桶聚合與和度量聚合支持，這是它們的區別。 ## Pipeline 將其他的聚類方法的輸出結果以及與其相連的度量進行聚合。接下來，有趣的部分到啦。由于每個桶高效的定以一個文檔集（所有的文檔都屬于這個桶），在桶的這一層上，文檔集可以在桶內部進行高效的聚合操作。這就是聚合的力量所在：聚合可以嵌套。 | 注意 | 桶集合可以子桶聚合（桶或者度量）。這個子桶聚合是在父聚合的基礎之上計算出來的。在內置的桶聚合的層數或者寬度沒有嚴格的限制（可以在一個聚合操作的下面插入一個兄弟聚合操作）。 | ## Structuring Aggregations ? ? ? ? ? 下面我們來看一下結構化聚合的主要組成部分： | `"aggregations"`?`: {` `"<aggregation_name>"`?`: {` `"<aggregation_type>"`?`: {` `<aggregation_body>` `}` `[,``"meta"`?`: {? [<meta_data_body>] } ]?` `[,``"aggregations"`?`: { [<sub_aggregation>]+ } ]?` `}` `[,``"<aggregation_name_2>"`?`: { ... } ]*` `}` | JSON中的聚合對象（可以使用關鍵字aggs代替）保存要計算的聚合。每一個聚合是和用戶自定的一個邏輯名稱相關聯（例如：如果這個聚合操作是計算平均價格，就要這個邏輯名字定義為avg_price）。在回復過程中，邏輯名稱將會成為這個聚合的唯一標識。每一個聚合都有一個具體的類型（在上面的代碼段中是，通常是指聚合題中的第一個關鍵字）。每種聚合根據聚合的性質（例如，特定字段上的avg聚合就是計算這個屬性的平均值）來定義自身的實體。在相同層次上定義集合，可以有選擇性的定義一系列聚合，它只在您自定義的聚合塊中有意義。在這種情況下，在桶聚合上定義子聚合就是在所有桶上進行的一次桶聚合。例如，如果你在range聚合下面定義了一組聚合，將為定義的范圍桶計算子聚合。 ## Values Source 一些聚合對從聚合文檔中提取的值進行處理。通常，以聚合的屬性為依據，從具體的文件中提取值。也可以定義一個腳本用來生成值。當field和script為聚合進行配置的時候，腳本被稱為value script.普通的攪拌使用來評價文檔（例如，這些腳本可以訪問文檔關聯的所有數據），而值腳本是用來評價值。在這個模式下，從配置和腳本中獲取的值是用來轉化這些值。 | 注意 | 當使用腳本的時候，可以定義lang和params進行設置。lang是定義使用什么腳本語言（假設ElasticSearch提供了正確的語言，默認情況下或作為插件）。params保證可以在腳本中定義動態的表達式作為參數，這使腳本能夠在調用之間保持靜態（這將確保在ElasticSearch中使用緩存的編譯腳本）。 | 腳本可以為每一個文檔產生一個或者多個值。當產生多個值的時候，可以使用script_values_sorted來設置生成的結果是否排序。本質上，ElasticSearch在排序方面性能非常好（例如，進行min聚合，知道要對值進行排序，ElasticSearch將跳過對所有值得迭代，并依賴列表中的第一個值作為最小值與同一文檔相關聯的所有其他值）。