# 入門
Elasticsearch 是一個實時的分布式搜索和分析引擎。它可以幫助你用前所未有的速度去處理大規模數據。
它可以用于全文搜索,結構化搜索以及分析,當然你也可以將這三者進行組合
-
維基百科使用 Elasticsearch 來進行全文搜索并高亮顯示關鍵詞,以及提供search-as-you-type、did-you-mean等搜索建議功能。
-
英國衛報使用 Elasticsearch 來處理訪客日志,以便能將公眾對不同文章的反應實時地反饋給各位編輯。
-
StackOverflow 將全文搜索與地理位置和相關信息進行結合,以提供more-like-this相關問題的展現。
-
GitHub 使用 Elasticsearch 來檢索超過1300億行代碼。
-
每天,Goldman Sachs 使用它來處理5TB數據的索引,還有很多投行使用它來分析股票市場的變動。
但是Elasticsearch并不只是面向大型企業的,它還幫助了很多類似 DataDog 以及 Klout 的創業公司進行了功能的擴展。Elasticsearch 可以運行在你的筆記本上,也可以部署到成千上萬的服務器上,處理PB級別的數據。
Elasticsearch 每一個獨立的部分都不是新創的。比如全文搜索早就已經被實現,統計系統和分布式數據庫也早已存在。但是革命之處在于能將這些獨立的功能結合成一個連貫、實時處理的整體。對于新用戶,它的門檻也很低,當然他也會因為你的強大而變得更強大。
你之所以拿起這本書,就是因為你眼前有很多的數據,但是你并不知道如何使用他們,接下來我們將開始探討有關處理數據的事情。
很不幸的是,目前的大部分數據庫在提取數據方面都是非常的薄弱的。雖然它們可以通過精準的時間戳或者確切的數值來進行內容的篩選,但是它們可以在全文搜索時做到同義詞或者相關性搜索嗎?他們可以匯總相同內容數據嗎?最重要的是,每對如此巨大的數據量,它們能做到實時處理嗎?
這便是 Elasticsearch 如此突出的理由:Elasticsearch 可以幫助你瀏覽并利用已經快要爛在數據庫里的那些極難查詢的數據。
> ### Elasticsearch 將會成為你一生的小伙伴。