### 數據的分類
###
結構化數據:指具有固定格式或有限?度的數據,如數據庫,元數據等。對于結構化數據,我們?般都是可以通過關系型數據庫(mysql,oracle等)的 table 的?式存儲和搜索,也可以建?索引。通過b-tree等數據結構快速搜索數據。
###
?結構化數據:全?數據,指不定?或?固定格式的數據,如郵件,word?檔等。對于?結構化數據,也即對全?數據的搜索主要有兩種?法:順序掃描法,全?搜索法。
###
### 順序掃描
按字?意思,我們可以了解它的?概搜索?式,就是按照順序掃描的?式查找特定的關鍵字。?如讓你在?篇籃球新聞中,找出"科?"這個名字在哪些段落出現過。那你肯定需要從頭到尾把?章閱讀?遍,然后標記出關鍵字在哪些地?出現過。這種?法毋庸置疑是最低效的,如果?章很?,有?萬字,等你閱讀完這篇新聞找到"科?"這個關鍵字,那得花多少時間。
###
### 全?搜索
###
對?結構化數據進?順序掃描很慢,我們是否可以進?優化?把我們的?結構化數據想辦法弄得有?定結構不就?了嗎?將?結構化數據中的?部分信息提取出來,重新組織,使其變得有?定結構,然后對這些有?定結構的數據進?搜索,從?達到搜索相對較快的?的。這種?式就構成了全?搜索的基本思路。這部分從?結構化數據中提取出的然后重新組織的信息,我們稱之索引。
###
我們以NBA中國?站為例,假設我們都是籃球愛好者,并且我們是科密,那如何快速找到有關科?的新聞呢?全?搜索的?式就是,將所有新聞中所有的關鍵字進?提取,?如"科?","詹姆斯","總冠軍","MVP"等關鍵字,然后對這些關鍵字建?索引,通過索引我們就可以找到對應的該關鍵詞出現的新聞了。
###
### 什么是全?搜索引擎
根據百度百科中的定義,全?搜索引擎是?前?泛應?的主流搜索引擎。它的?作原理是計算機索引程序通過掃描?章中的每?個詞,對每?個詞建??個索引,指明該詞在?章中出現的次數和位置,當?戶查詢時,檢索程序就根據事先建?的索引進?查找,并將查找的結果反饋給?戶的。
###
### 搜索引擎
1. Lucene
2. Solr
3. Elastic search
- 基礎概念
- 為什么不使用mysql做全文搜索
- 常見的搜索引擎
- 快速安裝部署es
- 補充ES和kibana認證
- 補充kibana中文顯示
- ES的目錄以及核心概念介紹
- RESTful風格介紹
- 索引的各類操作
- 映射的各類操作
- 文檔的各類操作
- 搜索的使用
- 中文分詞器
- 常見字段類型
- kibana的安裝
- es批量導入數據
- es的term的多種查詢
- es的范圍查詢
- es的布爾查詢
- es的排序查詢
- es的指標聚合查詢
- es的桶聚合查詢
- es的別名操作
- es重建索引
- es的refresh操作
- es的高亮查詢
- es的查詢建議
- java實操es之集成
- 補充java操作es集成認證
- 補充java連接es集群
- java實操es之準備工作
- java實操es之各種騷操作(一期)
- java實戰之數據庫文件
- java實操es之各種騷操作(二期)
- java實操es之各種騷操作(三期)
- es分布式集群概念介紹
- es分布式集群的搭建
- es分布式集群kibana的配置
- es分布式集群分片管理
- es分布式集群節點健康管理
- es故障排查總結