## 背景
電商業務在過去的幾年中呈現出快速增長的趨勢,這導致了數據量的增加,同時也帶來了數據處理和搜索的挑戰。傳統的關系型數據庫在處理大量數據和高并發訪問時,可能會遇到性能瓶頸和查詢速度問題。因此,需要一種高性能、高可擴展性的搜索引擎來滿足電商業務的需求。
## 簡介
Elasticsearch 是一個基于 Lucene 構建的開源、分布式、RESTful 接口的全文搜索引擎,其每個字段均可被索引,且能夠橫向擴展至數以百計的服務器存儲以及處理 TB 級的數據,其可以在極短的時間內存儲、搜索和分析大量的數據。
作為一款基于RESTful API的分布式服務,Elasticsearch可以快速地、近乎于準實時地存儲、查詢和分析超大數據集,通常被用來作為構建復雜查詢特性和需求強大應用的基礎引擎或技術。
由于其強大的搜索能力、靈活的擴展性和豐富的功能特性,Elasticsearch在數據分析和搜索領域非常受歡迎。
## 基礎知識
### 概念
* 節點和集群:理解Elasticsearch中的節點(Node)和集群(Cluster)的概念,以及它們如何協同工作。
* 索引(Index):索引是Elasticsearch中的核心概念,與關系型數據庫中的數據庫相似,但有其特殊性。
* 類型(Type)和文檔(Document):在Elasticsearch 7.x之后,一個索引中只允許有一個類型,到Elasticsearch 8.x之后類型已經被移除,但了解其歷史概念對理解Elasticsearch的發展有幫助。
* 分片(Shard)和副本(Replica):理解分片和副本的概念對于掌握Elasticsearch的數據分布和容錯機制至關重要。
### 數據索引
* 文檔映射(Mapping):學習如何定義文檔的字段類型、分析器等屬性。
* 索引管理:包括創建索引、更新映射、刪除索引等操作。
### 搜索技術
* 查詢DSL:Elasticsearch提供了一種豐富的查詢DSL(Domain Specific Language),用于執行復雜的搜索操作。
* 聚合(Aggregations):聚合提供了從數據中提取洞察力的能力,類似于SQL中的GROUP BY操作。
### 性能優化
* 分片策略:學習如何根據數據量和查詢模式來合理分配分片。
* 緩存和刷新:理解Elasticsearch中的各種緩存機制以及如何通過合理配置提高搜索性能。
### 集群管理
* 監控和診斷:學習如何監控Elasticsearch集群的健康狀況和性能指標。
* 擴展和故障轉移:了解如何在不中斷服務的情況下擴展集群和處理節點故障。
## ElasticSearch與傳統搜索引擎
ElasticSearch與傳統搜索引擎的主要區別在于數據存儲和查詢方式。傳統搜索引擎通常采用基于文件系統的數據存儲,并使用自然語言處理技術進行查詢。而ElasticSearch則采用基于內存的數據存儲,并使用Lucene庫進行查詢。這使得ElasticSearch具有更高的查詢速度和可擴展性。
## 索引和查詢的基本原理
ElasticSearch的核心原理是基于Lucene庫的索引和查詢機制。索引是將文檔存儲在磁盤上的過程,查詢是從索引中搜索文檔的過程。
### 索引的基本原理
索引的過程包括以下步驟:
1. 文檔解析:將文檔中的字段和值解析成一個內部表示。
2. 分析:將文本字段通過分析器轉換為索引用的形式。
3. 存儲:將解析和分析后的內容存儲到磁盤上的索引文件中。
### 查詢的基本原理
查詢的過程包括以下步驟:
1. 解析:將查詢請求解析成一個查詢對象。
2. 搜索:根據查詢對象從索引中搜索匹配的文檔。
3. 排序:將搜索出的文檔按照排序規則進行排序。
4. 高亮:將查詢關鍵詞標注為高亮顯示。
### 具體操作步驟
1. 安裝和配置:安裝ElasticSearch并配置相關參數。
2. 創建索引:創建一個索引,用于存儲文檔。
3. 添加文檔:將文檔添加到索引中。
4. 查詢文檔:根據查詢條件搜索文檔。
5. 更新文檔:更新文檔的內容。
6. 刪除文檔:刪除文檔。
7. 查詢分析:查看查詢的分析結果。
## 最佳實踐
### 安裝和配置
這里的ElasticSearch搜索服務直接使用阿里云Elasticsearch。阿里云Elasticsearch是基于開源Elasticsearch構建的全托管Elasticsearch云服務,在100%兼容開源功能的同時,支持開箱即用。

**客戶端SDK安裝**
這里使用Elasticsearch PHP客戶端。
> 更多:https://www.elastic.co/guide/en/elasticsearch/client/php-api/current/index.html
```
composer require elasticsearch/elasticsearch
```
### 配置Elasticsearch
案例客戶端`ElasticSearchCLient`
```
<?php
/**
* @desc ElasticSearchCLient
* @author Tinywan(ShaoBo Wan)
*/
declare(strict_types=1);
namespace search;
use Elasticsearch\Client;
use Elasticsearch\ConnectionPool\SimpleConnectionPool;
class ElasticSearchCLient
{
/**
* @var Client|null
*/
protected static ?Client $instance = null;
private function __construct()
{
echo 'I am Constructed';
}
/**
* @desc: 實例
* @return Client|null
*/
public static function getInstance(): ?Client
{
if (is_null(self::$instance)) {
static::$instance = \Elasticsearch\ClientBuilder::create()
->setHosts([
[
'host' => '127.0.0.1',
'port' => '9200',
'scheme' => 'http',
'user' => 'elastic',
'pass' => 'elastic'
]
])
->setConnectionPool(SimpleConnectionPool::class)
->setRetries(10)
->build();
}
return static::$instance;
}
}
```
### 文檔模型
定義一個簡單的文檔模型
#### 創建一個文檔索引
```
/**
* @desc 創建一個索引
* @return Response
* @author Tinywan(ShaoBo Wan)
*/
public function createIndex(): Response
{
$client = ElasticSearchCLient::getInstance();
$indexParams = [
'index' => 'resty_product_test_index', // 索引名稱
];
$indexResponse = $client->indices()->create($indexParams);
return response_json('success',0,$indexResponse);
}
```
#### 添加文檔到ES
```
/**
* @desc 添加文檔到Elasticsearch
* @return Response
* @author Tinywan(ShaoBo Wan)
*/
public function addDocument(): Response
{
$client = ElasticSearchCLient::getInstance();
$data = [
'id' => 20245,
'title' => '開源技術小棧20245直播間',
'content' => '開源技術小棧-騰訊云開發者社區,開源技術小棧20245直播間',
];
$indexParams = [
'index' => 'resty_product_test_index', // 索引名稱
'id' => $data['id'], // 文檔ID
'body' => $data,
'client' => [
'timeout' => 10,
'connect_timeout' => 10
]
];
$indexResponse = $client->index($indexParams);
return response_json('success',0,$indexResponse);
}
```
響應結果
```json
{
"code": 0,
"msg": "success",
"data": {
"_index": "resty_product_test_index",
"_type": "_doc",
"_id": "20245",
"_version": 1,
"result": "created",
"_shards": {
"total": 2,
"successful": 2,
"failed": 0
},
"_seq_no": 4,
"_primary_term": 1
}
}
```
#### 搜索文檔
```
/**
* @desc 搜索文檔
* @return Response
* @author Tinywan(ShaoBo Wan)
*/
public function searchDocument(): Response
{
$client = ElasticSearchCLient::getInstance();
$query = '開源技術小棧';
$indexParams = [
'index' => 'resty_product_test_index',
'body' => [
'query' => [
'multi_match' => [
'query' => $query,
'fields' => ['title', 'content'],
]
]
]
];
$indexResponse = $client->search($indexParams);
return response_json('success',0,$indexResponse);
}
```
搜索結果
```
{
"took": 12,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"skipped": 0,
"failed": 0
},
"hits": {
"total": {
"value": 2,
"relation": "eq"
},
"max_score": 1.5399661,
"hits": [
{
"_index": "resty_product_test_index",
"_type": "_doc",
"_id": "2024",
"_score": 1.5399661,
"_source": {
"id": 2024,
"title": "開源技術小棧20240724直播間",
"content": "開源技術小棧-騰訊云開發者社區,開源技術小棧20240724直播間"
}
},
{
"_index": "resty_product_test_index",
"_type": "_doc",
"_id": "20245",
"_score": 1.5399661,
"_source": {
"id": 20245,
"title": "開源技術小棧20245直播間",
"content": "開源技術小棧-騰訊云開發者社區,開源技術小棧20245直播間"
}
}
]
}
}
```
- 設計模式系列
- 工廠方法模式
- 序言
- Windows程序注冊為服務的工具WinSW
- 基礎
- 安裝
- 開發規范
- 目錄結構
- 配置
- 快速入門
- 架構
- 請求流程
- 架構總覽
- URL訪問
- 容器和依賴注入
- 中間件
- 事件
- 代碼層結構
- 四個層次
- 路由
- 控制器
- 請求
- 響應
- 數據庫
- MySQL實時同步數據到ES解決方案
- 阿里云DTS數據MySQL同步至Elasticsearch實戰
- PHP中的MySQL連接池
- PHP異步非阻塞MySQL客戶端連接池
- 模型
- 視圖
- 注解
- @SpringBootApplication(exclude={DataSourceAutoConfiguration.calss})
- @EnableFeignClients(basePackages = "com.wotu.feign")
- @EnableAspectJAutoProxy
- @EnableDiscoveryClient
- 錯誤和日志
- 異常處理
- 日志處理
- 調試
- 驗證
- 驗證器
- 驗證規則
- 擴展庫
- 附錄
- Spring框架知識體系詳解
- Maven
- Maven和Composer
- 構建Maven項目
- 實操課程
- 01.初識SpringBoot
- 第1章 Java Web發展史與學習Java的方法
- 第2章 環境與常見問題踩坑
- 第3章 springboot的路由與控制器
- 02.Java編程思想深度理論知識
- 第1章 Java編程思想總體
- 第2章 英雄聯盟的小案例理解Java中最為抽象的概念
- 第3章 徹底理解IOC、DI與DIP
- 03.Spring與SpringBoot理論篇
- 第1章 Spring與SpringBoot導學
- 第2章 Spring IOC的核心機制:實例化與注入
- 第3章 SpringBoot基本配置原理
- 04.SprinBoot的條件注解與配置
- 第1章 conditonal 條件注解
- 第2章 SpringBoot自動裝配解析
- 05.Java異常深度剖析
- 第1章 Java異常分類剖析與自定義異常
- 第2章 自動配置Url前綴
- 06.參數校驗機制與LomBok工具集的使用
- 第1章 LomBok工具集的使用
- 第2章 參數校驗機制以及自定義校驗
- 07.項目分層設計與JPA技術
- 第1章 項目分層原則與層與層的松耦合原則
- 第2章 數據庫設計、實體關系與查詢方案探討
- 第3章 JPA的關聯關系與規則查詢
- 08.ORM的概念與思維
- 第1章 ORM的概念與思維
- 第2章 Banner等相關業務
- 第3章 再談數據庫設計技巧與VO層對象的技巧
- 09.JPA的多種查詢規則
- 第1章 DozerBeanMapper的使用
- 第2章 詳解SKU的規格設計
- 第3章 通用泛型Converter
- 10.令牌與權限
- 第1章 通用泛型類與java泛型的思考
- 常見問題
- 微服務
- demo
- PHP中Self、Static和parent的區別
- Swoole-Cli
- 為什么要使用現代化PHP框架?
- 公眾號
- 一鍵部署微信公眾號Markdown編輯器(支持適配和主題設計)
- Autodesigner 2.0發布
- Luya 一個現代化PHP開發框架
- PHPZip - 創建、讀取和管理 ZIP 文件的簡單庫
- 吊打Golang的PHP界天花板webman壓測對比
- 簡潔而強大的 YAML 解析庫
- 推薦一個革命性的PHP測試框架:Kahlan
- ServBay下一代Web開發環境
- 基于Websocket和Canvas實現多人協作實時共享白板
- Apipost預執行腳本如何調用外部PHP語言
- 認證和授權的安全令牌 Bearer Token
- Laradock PHP 的 Docker 完整本地開發環境
- 高效接口防抖策略,確保數據安全,避免重復提交的終極解決方案!
- TIOBE 6月榜單:PHP穩步前行,編程語言生態的微妙變化
- Aho-Corasick字符串匹配算法的實現
- Redis鍵空間通知 Keyspace Notification 事件訂閱
- ServBay如何啟用并運行Webman項目
- 使用mpdf實現導出pdf文件功能
- Medoo 輕量級PHP數據庫框架
- 在PHP中編寫和運行單元測試
- 9 PHP運行時基準性能測試
- QR碼生成器在PHP中的源代碼
- 使用Gogs極易搭建的自助Git服務
- Gitea
- webman如何記錄SQL到日志?
- Sentry PHP: 實時監測并處理PHP應用程序中的錯誤
- Swoole v6 Alpha 版本已發布
- Proxypin
- Rust實現的Redis內存數據庫發布
- PHP 8.4.0 Alpha 1 測試版本發布
- 121
- Golang + Vue 開發的開源輕量 Linux 服務器運維管理面板
- 內網穿透 FRP VS Tailscale
- 新一代開源代碼托管平臺Gitea
- 微服務系列
- Nacos云原生配置中心介紹與使用
- 輕量級的開源高性能事件庫libevent
- 國密算法
- 國密算法(商用密碼)
- GmSSL 支持國密SM2/SM3/SM4/SM9/SSL 密碼工具箱
- GmSSL PHP 使用
- 數據庫
- SQLite數據庫的Web管理工具
- 阿里巴巴MySQL數據庫強制規范
- PHP
- PHP安全測試秘密武器 PHPGGC
- 使用declare(strict_types=1)來獲得更健壯的PHP代碼
- PHP中的魔術常量
- OSS 直傳阿里騰訊示例
- PHP源碼編譯安裝APCu擴展實現數據緩存
- BI性能DuckDB數據管理系統
- 為什么別人可以是架構師!而我卻不是?
- 密碼還在用 MD5 加鹽?不如試試 password_hash
- Elasticsearch 在電商領域的應用與實踐
- Cron 定時任務入門
- 如何動態設置定時任務!而不是寫死在Linux Crontab
- Elasticsearch的四種查詢方式,你知道多少?
- Meilisearch vs Elasticsearch
- OpenSearch vs Elasticsearch
- Emlog 輕量級開源博客及建站系統
- 現代化PHP原生協程引擎 PRipple
- 使用Zephir編寫C擴展將PHP源代碼編譯加密
- 如何將PHP源代碼編譯加密,同時保證代碼能正常的運行
- 為什么選擇Zephir給PHP編寫動態擴展庫?
- 使用 PHP + XlsWriter實現百萬級數據導入導出
- Rust編寫PHP擴展
- 阿里云盤開放平臺對接進行文件同步
- 如何構建自己的PHP靜態可執行文件
- IM后端架構
- RESTful設計方法和規范
- PHP編譯器BPC 7.3 發布,成功編譯ThinkPHP8
- 高性能的配置管理擴展 Yaconf
- PHP實現雪花算法庫 Snowflake
- PHP官方現代化核心加密庫Sodium
- pie
- 現代化、精簡、非阻塞PHP標準庫PSL
- PHP泛型和集合
- 手把手教你正確使用 Composer包管理
- JWT雙令牌認證實現無感Token自動續期
- 最先進PHP大模型深度學習庫TransformersPHP
- PHP如何啟用 FFI 擴展
- PHP超集語言PXP
- 低延遲雙向實時事件通信 Socket.IO
- PHP OOP中的繼承和多態
- 強大的現代PHP高級調試工具Kint
- PHP基金會
- 基于webman+vue3高質量中后臺框架SaiAdmin
- 開源免費的定時任務管理系統:Gocron
- 簡單強大OCR工具EasyOCR在PHP中使用
- PHP代碼抽象語法樹工具PHP AST Viewer
- MySQL數據庫管理工具PHPMyAdmin
- Rust編寫的一款高性能多人代碼編輯器Zed
- 超高性能PHP框架Workerman v5.0.0-beta.8 發布
- 高并發系列
- 入門介紹及安裝
- Lua腳本開發 Hello World
- 執行流程與階段詳解
- Nginx Lua API 接口開發
- Lua模塊開發
- OpenResty 高性能的正式原因
- 記一次查找 lua-resty-mysql 庫 insert_id 的 bug
- 包管理工具OPM和LuaRocks使用
- 異步非阻塞HTTP客戶端庫 lua-resty-http
- Nginx 內置綁定變量
- Redis協程網絡庫 lua-resty-redis
- 動態HTML渲染庫 lua-testy-template
- 單獨的
- StackBlitz在線開發環境
- AI
- 基礎概念
- 12312
- 基礎鏡像的坑
- 利用phpy實現 PHP 編寫 Vision Transformer (ViT) 模型
- 語義化版本 2.0.0