## 指數的一些文檔
集群啟動并運行后,就可以為某些數據建立索引了。Elasticsearch有多種攝取選項,但最終它們都做同樣的事情:將JSON文檔放入Elasticsearch索引中。
您可以通過一個簡單的PUT請求直接執行此操作,該請求指定要添加文檔的索引,唯一的文檔ID以及`"field": "value"`請求正文中的一對或多對:
~~~
PUT /customer/_doc/1
{
"name": "John Doe"
}
~~~
如果該請求`customer`尚不存在,該請求將自動創建該索引,添加ID為的新文檔`1`,并存儲該`name`字段并為其建立索引。
由于這是一個新文檔,因此響應顯示該操作的結果是創建了該文檔的版本1:
~~~
{
"_index" : "customer",
"_type" : "_doc",
"_id" : "1",
"_version" : 1,
"result" : "created",
"_shards" : {
"total" : 2,
"successful" : 2,
"failed" : 0
},
"_seq_no" : 26,
"_primary_term" : 4
}
~~~
可以從群集中的任何節點立即使用新文檔。您可以使用指定其文檔ID的GET請求檢索它:
~~~
GET /customer/_doc/1
~~~
該響應表明找到了具有指定ID的文檔,并顯示了已索引的原始源字段。
~~~
{
"_index" : "customer",
"_type" : "_doc",
"_id" : "1",
"_version" : 1,
"_seq_no" : 26,
"_primary_term" : 4,
"found" : true,
"_source" : {
"name": "John Doe"
}
}
~~~
### 在索引文件批量
如果您有很多要編制索引的文檔,則可以使用[批量API](https://www.elastic.co/guide/en/elasticsearch/reference/7.6/docs-bulk.html)批量提交。使用批量處理批處理文檔操作比單獨提交請求要快得多,因為它可以最大程度地減少網絡往返次數。
最佳批處理大小取決于許多因素:文檔大小和復雜性,索引編制和搜索負載以及群集可用的資源。一個好的起點是批處理1,000至5,000個文檔,總有效負載在5MB至15MB之間。從那里,您可以嘗試找到最佳位置。
要將一些數據導入Elasticsearch,您可以開始搜索和分析:
1. 下載[`accounts.json`](https://github.com/elastic/elasticsearch/blob/master/docs/src/test/resources/accounts.json?raw=true)樣本數據集。此隨機生成的數據集中的文檔代表具有以下信息的用戶帳戶:
~~~
{
"account_number": 0,
"balance": 16623,
"firstname": "Bradshaw",
"lastname": "Mckenzie",
"age": 29,
"gender": "F",
"address": "244 Columbus Place",
"employer": "Euron",
"email": "bradshawmckenzie@euron.com",
"city": "Hobucken",
"state": "CO"
}
~~~
2. `bank`使用以下`_bulk`請求將帳戶數據索引到索引中:
~~~
curl -H "Content-Type: application/json" -XPOST "localhost:9200/bank/_bulk?pretty&refresh" --data-binary "@accounts.json"
curl "localhost:9200/_cat/indices?v"
~~~
響應表明成功索引了1,000個文檔。
~~~
health status index uuid pri rep docs.count docs.deleted store.size pri.store.size
yellow open bank l7sSYV2cQXmu6_4rJWVIww 5 1 1000 0 128.6kb 128.6kb
~~~
- Elasticsearch簡介
- 數據輸入:文檔和索引
- 信息輸出:搜索和分析
- 可擴展性和彈性
- Elasticsearch入門
- 啟動并運行Elasticsearch
- 索引文件
- 開始搜索
- 使用匯總分析結果
- 從這里開始
- 設置Elasticsearch
- 安裝Elasticsearch
- 從Linux或MacOS上的存檔安裝Elasticsearch
- 在Windows上安裝Elasticsearch
- 使用Debian軟件包安裝Elasticsearch
- 使用RPM安裝Elasticsearch
- 使用Windows MSI安裝程序安裝Elasticsearch
- 使用Docker安裝Elasticsearch
- 使用Homebrew在macOS上安裝Elasticsearch
- 配置Elasticsearch
- 設置JVM選項
- 安全設定
- 記錄配置
- 審核設置
- 跨集群復制設置
- 轉換設定
- 索引生命周期管理設置
- 許可設置
- 機器學習設置
- 監控設定
- 保護設置
- SQL訪問設置
- 觀察者設置
- 重要的Elasticsearch配置
- path.data 和 path.logs
- cluster.name
- node.name
- network.host
- 發現和集群形成設置
- 設置堆大小
- JVM堆轉儲路徑
- GC記錄
- 臨時目錄
- JVM致命錯誤日志
- 重要系統配置
- 配置系統設置
- 禁用交換
- 文件描述符
- 虛擬內存
- 線程數
- DNS緩存設置
- JNA臨時目錄未裝入 noexec
- 引導檢查
- 堆大小檢查
- 文件描述符檢查
- 內存鎖檢查
- 最大線程數檢查
- 最大文件大小檢查
- 虛擬內存最大大小檢查
- 最大地圖計數檢查
- 客戶端JVM檢查
- 使用串行收集器檢查
- 系統調用過濾器檢查
- OnError和OnOutOfMemoryError檢查
- 搶先檢查
- G1GC檢查
- 所有權限檢查
- 發現配置檢查
- 啟動Elasticsearch
- 停止Elasticsearch
- 將節點添加到集群
- 全集群重啟和滾動重啟
- 設置X-Pack
- 配置X-Pack Java客戶端
- 引導程序檢查X-Pack
- 升級Elasticsearch
- 滾動升級
- 完整集群重新啟動升級
- 升級前重新索引
- 重新索引到位
- 從遠程群集重新索引
- 集合
- 度量聚合
- 平均聚合
- 加權平均聚合
- 基數聚合
- 擴展統計匯總
- 地理邊界聚合
- 地心聚集
- 最大聚集
- 最小集合
- 百分位數匯總
- 百分數排名匯總
- 腳本式指標聚合
- 統計匯總
- 字符串統計匯總
- 總和
- 熱門合集
- 價值計數匯總
- 中位數絕對偏差匯總
- 桶聚合
- 鄰接矩陣匯總
- 自動間隔日期直方圖聚合
- 子集聚集
- 復合聚集
- 日期直方圖匯總
- 日期范圍匯總
- 多元化的采樣器聚合
- 篩選器匯總
- 篩選匯總
- 地理距離匯總
- GeoHash網格聚合
- GeoTile網格聚合
- 全局聚合
- 直方圖聚合
- IP范圍匯總
- 缺少聚合
- 嵌套聚合
- 父級匯總
- 范圍匯總
- rare terms 聚集
- 反向嵌套聚合
- 采樣器聚合
- 重要術語匯總
- 重要的文字匯整
- 術語匯總
- 鏟斗范圍字段的精妙之處
- 管道聚合
- 平均存儲桶聚合
- 導數聚合
- 最大存儲桶聚合
- 最小存儲桶聚合
- 總和桶聚合
- 統計數據桶匯總
- 擴展的統計數據桶聚合
- 百分位桶聚合
- 查詢DSL
- 查詢和過濾上下文
- 跨集群搜索
- 腳本編寫
- 如何使用腳本
- 映射
- 刪除映射類型
- 文字分析
- 文字分析總覽
- 模組
- 發現和集群形成
- 索引模塊
- 分析
- 攝取節點
- 管道定義
- 管理索引生命周期
- 索引總覽
- SQL訪問
- SQL總覽
- 監控集群
- 監控總覽
- 凍結指標
- 最佳實務
- 匯總或轉換數據
- 匯總歷史數據
- 設置集群以實現高可用性
- 備份集群
- 快照和還原
- 注冊資料庫
- 保護集群
- 安全概述
- 警報群集和索引事件
- Watcher入門
- 命令行工具
- 彈性搜索證書
- 如何
- 一般建議
- 專業術語
- REST API
- API約定
- 發布要點
- 7.6.0
- 重大變化
- 7.6
- 發行說明
- Elasticsearch版本7.6.2