<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                ThinkChat2.0新版上線,更智能更精彩,支持會話、畫圖、視頻、閱讀、搜索等,送10W Token,即刻開啟你的AI之旅 廣告
                # Similarity module(相似模塊) 原文鏈接 : [https://www.elastic.co/guide/en/elasticsearch/reference/5.3/index-modules-similarity.html](https://www.elastic.co/guide/en/elasticsearch/reference/5.3/index-modules-similarity.html) 譯文鏈接 : [Similarity module(相似模塊)](/pages/viewpage.action?pageId=10028541) 貢獻者 : @蘇濤,[ApacheCN](/display/~apachecn),[Apache中文網](/display/~apachechina) 相似性(得分/排名模型)定義了匹配文檔如何進行評分。相似性是針對字段的,意味著通過映射可以對每個字段定義不同的相似性模塊。 ### 配置相似性 大多數現有或自定義相似性具有可以通過索引設置進行配置的配置選項,如下所示,可以在創建索引或更新索引設置時提供索引選項。 ``` "similarity" : { "my_similarity" : { "type" : "DFR", "basic_model" : "g", "after_effect" : "l", "normalization" : "h2", "normalization.h2.c" : "3.0" } } ``` 這里我們配置DFRSimilarity,所以它可以在映射中被引用為my_similarity,如下例所示: ``` { "book" : { "properties" : { "title" : { "type" : "text", "similarity" : "my_similarity" } } } ``` ### 可用的相似性 #### BM25相似性(默認值) 基于TF / IDF的相似性,內置了tf標準化,并且對短字段(如名稱)效率更高。有關詳細信息,請參閱[Okapi_BM25](https://en.wikipedia.org/wiki/Okapi_BM25)。這種相似性有以下選項: | k1 | 控制非線性索引詞頻率標準(飽和度)。默認值為**1.2** | | b | 控制文檔長度標準化到tf值的程度。默認值為**0.75** | | discount_overlaps | 決定重疊詞元(詞元的位置增量為0)是否要被忽略。默認值為**true**,意味著重疊詞元不會被統計 | 類型名:BM25 #### Classic相似性 基于TF / IDF模型的classic相似性。這種相似性有以下選項: | discount_overlaps | 決定重疊詞元(詞元的位置增量為0)是否要被忽略。默認值為**true**,意味著重疊詞元不會被統計 | 類型名:classic #### DFR相似性 實現[divergence from randomness](http://lucene.apache.org/core/5_2_1/core/org/apache/lucene/search/similarities/DFRSimilarity.html)框架。這種相似性有以下選項: | basic_model | 可能的值有:`**be**,``**d**,`?`**g**,`?`**if**,`?`**in**,`?**`ine`**?和?**`p`** | | after_effect | 可能的值有:?**`no`**,**`b`**?和?**`l`** | | normalization | 可能的值有:?`**no**,``**h1**,`?`**h2**,`**`h3`**?和?**`z`** | 類型名:DFR #### DFI相似性 實現[divergence from independence](http://trec.nist.gov/pubs/trec21/papers/irra.web.nb.pdf)模塊,這種相似性有以下選項: | independence_measure | 可能的值?`standardized`,`**saturated**`,**`chisquared`** | 類型名:DFI #### IB相似模塊 [Information based model](http://lucene.apache.org/core/5_2_1/core/org/apache/lucene/search/similarities/IBSimilarity.html)?。該算法基于以下概念:任何符號分布序列中的信息內容主要由其基本元素的重復使用決定。對于書面文本,這個方式會對比不同作者的寫作風格。這種相似性有以下選項: | distribution | 可能的值:?**`ll`**?和?**`spl`** | | lambda | 可能的值:**`df`**?和?**`ttf`** | | normalization | 與DFR相似度相同。 | 類型名:IB #### LM Dirichlet相似模塊 [LM Dirichlet similarity](http://lucene.apache.org/core/5_2_1/core/org/apache/lucene/search/similarities/LMDirichletSimilarity.html)。這種相似性有以下選項: | mu | 默認值為**2000** | 類型名:LMDirichlet #### LM Jelinek Mercer相似模塊[](http://lucene.apache.org/core/5_2_1/core/org/apache/lucene/search/similarities/LMJelinekMercerSimilarity.html) [LM Jelinek Mercer similarity](http://lucene.apache.org/core/5_2_1/core/org/apache/lucene/search/similarities/LMJelinekMercerSimilarity.html)。該算法嘗試捕獲文本中的圖像并去除噪點。這種相似性有以下選項: | lambda | 最優值取決于采集和查詢。標題查詢的最佳值約為**0.1**,長查詢的最優值為**0.7**。默認為**0.1**。當值接近0時,匹配更多查詢索引詞的文檔會比匹配較少索引詞的文檔的排列位置更靠前。 | 類型名:LMJelinekMercer ### 默認和基礎相似性 默認情況下,Elasticsearch將使用任何配置為default的相似性模塊。然而,queryNorm()和coord()的相似度函數不是每個字段都會執行。因此,對于想要更改用于這兩種方法的實現的專家用戶,在不更改默認值的情況下,可以使用base名配置相似性。這種相似性將用于這兩種方法。 [創建索引](https://www.elastic.co/guide/en/elasticsearch/reference/5.3/indices-create-index.html)時,可以更改索引中所有字段的默認相似度: ``` PUT /my_index { "settings": { "index": { "similarity": { "default": { "type": "classic" } } } } } ``` 如果要在創建索引后更改默認的相似性,則必須[關閉](https://www.elastic.co/guide/en/elasticsearch/reference/5.3/indices-open-close.html)索引,然后發送以下請求并重新[打開](https://www.elastic.co/guide/en/elasticsearch/reference/5.3/indices-open-close.html): ``` PUT /my_index/_settings { "settings": { "index": { "similarity": { "default": { "type": "classic" } } } } } ```
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看