<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                ### 數據的分類 ### 結構化數據:指具有固定格式或有限?度的數據,如數據庫,元數據等。對于結構化數據,我們?般都是可以通過關系型數據庫(mysql,oracle等)的 table 的?式存儲和搜索,也可以建?索引。通過b-tree等數據結構快速搜索數據。 ### ?結構化數據:全?數據,指不定?或?固定格式的數據,如郵件,word?檔等。對于?結構化數據,也即對全?數據的搜索主要有兩種?法:順序掃描法,全?搜索法。 ### ### 順序掃描 按字?意思,我們可以了解它的?概搜索?式,就是按照順序掃描的?式查找特定的關鍵字。?如讓你在?篇籃球新聞中,找出"科?"這個名字在哪些段落出現過。那你肯定需要從頭到尾把?章閱讀?遍,然后標記出關鍵字在哪些地?出現過。這種?法毋庸置疑是最低效的,如果?章很?,有?萬字,等你閱讀完這篇新聞找到"科?"這個關鍵字,那得花多少時間。 ### ### 全?搜索 ### 對?結構化數據進?順序掃描很慢,我們是否可以進?優化?把我們的?結構化數據想辦法弄得有?定結構不就?了嗎?將?結構化數據中的?部分信息提取出來,重新組織,使其變得有?定結構,然后對這些有?定結構的數據進?搜索,從?達到搜索相對較快的?的。這種?式就構成了全?搜索的基本思路。這部分從?結構化數據中提取出的然后重新組織的信息,我們稱之索引。 ### 我們以NBA中國?站為例,假設我們都是籃球愛好者,并且我們是科密,那如何快速找到有關科?的新聞呢?全?搜索的?式就是,將所有新聞中所有的關鍵字進?提取,?如"科?","詹姆斯","總冠軍","MVP"等關鍵字,然后對這些關鍵字建?索引,通過索引我們就可以找到對應的該關鍵詞出現的新聞了。 ### ### 什么是全?搜索引擎 根據百度百科中的定義,全?搜索引擎是?前?泛應?的主流搜索引擎。它的?作原理是計算機索引程序通過掃描?章中的每?個詞,對每?個詞建??個索引,指明該詞在?章中出現的次數和位置,當?戶查詢時,檢索程序就根據事先建?的索引進?查找,并將查找的結果反饋給?戶的。 ### ### 搜索引擎 1. Lucene 2. Solr 3. Elastic search
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看