單一查詢字符串 · Elasticsearch權威指南（中文版）

### 單一查詢字符串(Single Query String) bool查詢是多字段查詢的中流砥柱。在很多場合下它都能很好地工作，特別是當你能夠將不同的查詢字符串映射到不同的字段時。問題在于，現在的用戶期望能夠在一個地方輸入所有的搜索詞條，然后應用能夠知道如何為他們得到正確的結果。所以當我們把含有多個字段的搜索表單稱為高級搜索(Advanced Search)時，是有一些諷刺意味的。高級搜索雖然對用戶而言會顯得更"高級"，但是實際上它的實現方式更簡單。對于多詞，多字段查詢并沒有一種萬能(one-size-fits-all)的方法。要得到最佳的結果，你需要了解你的數據以及如何使用恰當的工具。 #### 了解你的數據當用戶的唯一輸入就是一個查詢字符串時，你會經常碰到以下三種情況： ##### 1.最佳字段(Best fields):: 當搜索代表某些概念的單詞時，例如"brown fox"，幾個單詞合在一起表達出來的意思比單獨的單詞更多。類似title和body的字段，盡管它們是相關聯的，但是也是互相競爭著的。文檔在相同的字段中應該有盡可能多的單詞(譯注：搜索的目標單詞)，文檔的分數應該來自擁有最佳匹配的字段。 ##### 2.多數字段(Most fields):: 一個用來調優相關度的常用技術是將相同的數據索引到多個字段中，每個字段擁有自己的分析鏈(Analysis Chain)。主要字段會含有單詞的詞干部分，同義詞和消除了變音符號的單詞。它用來盡可能多地匹配文檔。相同的文本可以被索引到其它的字段中來提供更加精確的匹配。一個字段或許會包含未被提取成詞干的單詞，另一個字段是包含了變音符號的單詞，第三個字段則使用shingle來提供關于[單詞鄰近度(Word Proximity)](http://blog.csdn.net/dm_vincent/article/details/41800351)的信息。以上這些額外的字段扮演者signal的角色，用來增加每個匹配的文檔的相關度分值。越多的字段被匹配則意味著文檔的相關度越高。 ##### 3.跨字段(Cross fields):: 對于一些實體，標識信息會在多個字段中出現，每個字段中只含有一部分信息： * Person: `first_name` 和 `last_name` * Book: `title`, `author`, 和 `description` * Address: `street`, `city`, `country`, 和 `postcode` 此時，我們希望在任意字段中找到盡可能多的單詞。我們需要在多個字段中進行查詢，就好像這些字段是一個字段那樣。以上這些都是多詞，多字段查詢，但是每種都需要使用不同的策略。我們會在本章剩下的部分解釋每種策略。