配置分析器 · Elasticsearch權威指南（中文版）

### 配置分析器第三個重要的索引設置是 `analysis` 部分，用來配置已存在的分析器或創建自定義分析器來定制化你的索引。在【分析器介紹】中，我們介紹了一些內置的分析器，用于將全文字符串轉換為適合搜索的倒排索引。 `standard` 分析器是用于全文字段的默認分析器，對于大部分西方語系來說是一個不錯的選擇。它考慮了以下幾點： * `standard` 分詞器，在詞層級上分割輸入的文本。 * `standard` 標記過濾器，被設計用來整理分詞器觸發的所有標記（但是目前什么都沒做）。 * `lowercase` 標記過濾器，將所有標記轉換為小寫。 * `stop` 標記過濾器，刪除所有可能會造成搜索歧義的停用詞，如 `a`，`the`，`and`，`is`。默認情況下，停用詞過濾器是被禁用的。如需啟用它，你可以通過創建一個基于 `standard` 分析器的自定義分析器，并且設置 `stopwords` 參數。可以提供一個停用詞列表，或者使用一個特定語言的預定停用詞列表。在下面的例子中，我們創建了一個新的分析器，叫做 `es_std`，并使用預定義的西班牙語停用詞： ``` PUT /spanish_docs { "settings": { "analysis": { "analyzer": { "es_std": { "type": "standard", "stopwords": "_spanish_" } } } } } ```  `es_std` 分析器不是全局的，它僅僅存在于我們定義的 `spanish_docs` 索引中。為了用 `analyze` API 來測試它，我們需要使用特定的索引名。 ``` GET /spanish_docs/_analyze?analyzer=es_std El veloz zorro marrón ```  下面簡化的結果中顯示停用詞 `El` 被正確的刪除了： ``` { "tokens" : [ { "token" : "veloz", "position" : 2 }, { "token" : "zorro", "position" : 3 }, { "token" : "marrón", "position" : 4 } ] } ```