<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                ThinkChat2.0新版上線,更智能更精彩,支持會話、畫圖、視頻、閱讀、搜索等,送10W Token,即刻開啟你的AI之旅 廣告
                [TOC] # 簡介 先創建索引然后查詢索引的過程叫做全文檢索. # 索引和搜索流程圖 ![](https://img.kancloud.cn/50/eb/50eb7517b2a26c44fe837dea241f5fe9_781x247.png) 1. 綠色表示索引過程,對要搜索的原始內容進行索引構建一個索引庫,索引過程包括: 確定原始內容即要搜索的內容->采集文檔->創建文檔->分析文檔->索引文檔 2. 紅色表示搜索過程,從索引庫中搜索內容,搜索過程包括: 用戶通過搜索界面->創建查詢->執行搜索,從索引庫搜索->渲染搜索結果 ## 創建文檔對象 獲取原始內容的目的是為了索引,在索引前需要將原始內容創建成文檔(Document),文檔中包括一個一個的域(Field),域中存儲內容。 這里我們可以將磁盤上的一個文件當成一個document,Document中包括一些Field(file\_name文件名稱、file\_path文件路徑、file\_size文件大小、file\_content文件內容) ![](https://img.kancloud.cn/42/e6/42e6a73b65168af06ae6c462fca07ffe_701x436.png) 注意:每個Document可以有多個Field,不同的Document可以有不同的Field,同一個Document可以有相同的Field(域名和域值都相同) 每個文檔都有一個唯一的編號,就是文檔id。 ## 分析文檔 就是分詞的過程 1. 根據空格進行字符串拆分,得到一個單詞列表 2. 把單詞統一轉換成小寫 3. 去除標點符號 4. 去除停用詞(無意義的詞) 5. 每個單詞都封裝一個Term對象. Term對象包含兩個部分:關鍵詞所在的域,關鍵詞本身. 不同的域中拆分出來的相同的關鍵詞是不同的Term ![](https://img.kancloud.cn/06/18/0618b12772bbbd93dbb81a3aa5cb128b_649x392.png) ## 創建索引 基于關鍵詞列表創建一個索引.保存到索引庫中. 索引庫中: 索引,document對象,關鍵詞和文檔的對應關系 通過詞語找文檔,這種索引的結構叫倒排索引結構 ![](https://img.kancloud.cn/60/af/60af2d9fe0fb9ba7be61e3813cf19ef9_981x283.png) ## 創建查詢 用戶輸入查詢關鍵字執行搜索之前需要先構建一個查詢對象,查詢對象中可以指定查詢要搜索的Field文檔域、查詢關鍵字等,查詢對象會生成具體的查詢語法, 例如: 語法 “fileName:lucene”表示要搜索Field域的內容為“lucene”的文檔
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看