##
數據輸入:文檔和索引
Elasticsearch是一個分布式文檔存儲。Elasticsearch不會將信息存儲為列數據的行,而是存儲已序列化為JSON文檔的復雜數據結構。當集群中有多個Elasticsearch節點時,存儲的文檔將分布在集群中,并且可以從任何節點立即訪問。
存儲文檔時,將在1秒鐘內幾乎實時地對其進行索引和完全搜索。Elasticsearch使用稱為倒排索引的數據結構,該結構支持非常快速的全文本搜索。反向索引列出了出現在任何文檔中的每個唯一單詞,并標識了每個單詞出現的所有文檔。
索引可以認為是文檔的優化集合,每個文檔都是字段的集合,這些字段是包含數據的鍵值對。默認情況下,Elasticsearch對每個字段中的所有數據建立索引,并且每個索引字段都具有專用的優化數據結構。例如,文本字段存儲在倒排索引中,數字字段和地理字段存儲在BKD樹中。使用按字段數據結構組合并返回搜索結果的能力使Elasticsearch如此之快。
Elasticsearch還具有無模式的能力,這意味著無需顯式指定如何處理文檔中可能出現的每個不同字段即可對文檔建立索引。啟用動態映射后,Elasticsearch自動檢測并向索引添加新字段。這種默認行為使索引和瀏覽數據變得容易-只需開始建立索引文檔,Elasticsearch就會檢測布爾值,浮點數和整數值,日期和字符串并將其映射到適當的Elasticsearch數據類型。
但是,最終,您比Elasticsearch更了解您的數據以及如何使用它們。您可以定義規則來控制動態映射,也可以顯式定義映射以完全控制字段的存儲和索引方式。
定義自己的映射使您能夠:
* 區分全文字符串字段和精確值字符串字段
* 執行特定于語言的文本分析
* 優化字段以進行部分匹配
* 使用自定義日期格式
* 使用無法自動檢測到的數據類型,例如`geo_point`和`geo_shape`
為不同的目的以不同的方式對同一字段建立索引通常很有用。例如,您可能希望將一個字符串字段索引為全文搜索的文本字段和索引關鍵字,以便對數據進行排序或匯總。或者,您可能選擇使用多個語言分析器來處理包含用戶輸入的字符串字段的內容。
在搜索時也會使用在索引期間應用于全文字段的分析鏈。當您查詢全文字段時,對查詢文本進行相同的分析,然后才能在索引中查找術語。
- Elasticsearch簡介
- 數據輸入:文檔和索引
- 信息輸出:搜索和分析
- 可擴展性和彈性
- Elasticsearch入門
- 啟動并運行Elasticsearch
- 索引文件
- 開始搜索
- 使用匯總分析結果
- 從這里開始
- 設置Elasticsearch
- 安裝Elasticsearch
- 從Linux或MacOS上的存檔安裝Elasticsearch
- 在Windows上安裝Elasticsearch
- 使用Debian軟件包安裝Elasticsearch
- 使用RPM安裝Elasticsearch
- 使用Windows MSI安裝程序安裝Elasticsearch
- 使用Docker安裝Elasticsearch
- 使用Homebrew在macOS上安裝Elasticsearch
- 配置Elasticsearch
- 設置JVM選項
- 安全設定
- 記錄配置
- 審核設置
- 跨集群復制設置
- 轉換設定
- 索引生命周期管理設置
- 許可設置
- 機器學習設置
- 監控設定
- 保護設置
- SQL訪問設置
- 觀察者設置
- 重要的Elasticsearch配置
- path.data 和 path.logs
- cluster.name
- node.name
- network.host
- 發現和集群形成設置
- 設置堆大小
- JVM堆轉儲路徑
- GC記錄
- 臨時目錄
- JVM致命錯誤日志
- 重要系統配置
- 配置系統設置
- 禁用交換
- 文件描述符
- 虛擬內存
- 線程數
- DNS緩存設置
- JNA臨時目錄未裝入 noexec
- 引導檢查
- 堆大小檢查
- 文件描述符檢查
- 內存鎖檢查
- 最大線程數檢查
- 最大文件大小檢查
- 虛擬內存最大大小檢查
- 最大地圖計數檢查
- 客戶端JVM檢查
- 使用串行收集器檢查
- 系統調用過濾器檢查
- OnError和OnOutOfMemoryError檢查
- 搶先檢查
- G1GC檢查
- 所有權限檢查
- 發現配置檢查
- 啟動Elasticsearch
- 停止Elasticsearch
- 將節點添加到集群
- 全集群重啟和滾動重啟
- 設置X-Pack
- 配置X-Pack Java客戶端
- 引導程序檢查X-Pack
- 升級Elasticsearch
- 滾動升級
- 完整集群重新啟動升級
- 升級前重新索引
- 重新索引到位
- 從遠程群集重新索引
- 集合
- 度量聚合
- 平均聚合
- 加權平均聚合
- 基數聚合
- 擴展統計匯總
- 地理邊界聚合
- 地心聚集
- 最大聚集
- 最小集合
- 百分位數匯總
- 百分數排名匯總
- 腳本式指標聚合
- 統計匯總
- 字符串統計匯總
- 總和
- 熱門合集
- 價值計數匯總
- 中位數絕對偏差匯總
- 桶聚合
- 鄰接矩陣匯總
- 自動間隔日期直方圖聚合
- 子集聚集
- 復合聚集
- 日期直方圖匯總
- 日期范圍匯總
- 多元化的采樣器聚合
- 篩選器匯總
- 篩選匯總
- 地理距離匯總
- GeoHash網格聚合
- GeoTile網格聚合
- 全局聚合
- 直方圖聚合
- IP范圍匯總
- 缺少聚合
- 嵌套聚合
- 父級匯總
- 范圍匯總
- rare terms 聚集
- 反向嵌套聚合
- 采樣器聚合
- 重要術語匯總
- 重要的文字匯整
- 術語匯總
- 鏟斗范圍字段的精妙之處
- 管道聚合
- 平均存儲桶聚合
- 導數聚合
- 最大存儲桶聚合
- 最小存儲桶聚合
- 總和桶聚合
- 統計數據桶匯總
- 擴展的統計數據桶聚合
- 百分位桶聚合
- 查詢DSL
- 查詢和過濾上下文
- 跨集群搜索
- 腳本編寫
- 如何使用腳本
- 映射
- 刪除映射類型
- 文字分析
- 文字分析總覽
- 模組
- 發現和集群形成
- 索引模塊
- 分析
- 攝取節點
- 管道定義
- 管理索引生命周期
- 索引總覽
- SQL訪問
- SQL總覽
- 監控集群
- 監控總覽
- 凍結指標
- 最佳實務
- 匯總或轉換數據
- 匯總歷史數據
- 設置集群以實現高可用性
- 備份集群
- 快照和還原
- 注冊資料庫
- 保護集群
- 安全概述
- 警報群集和索引事件
- Watcher入門
- 命令行工具
- 彈性搜索證書
- 如何
- 一般建議
- 專業術語
- REST API
- API約定
- 發布要點
- 7.6.0
- 重大變化
- 7.6
- 發行說明
- Elasticsearch版本7.6.2