隨著公司業務數據量日益增長,數據處理場景日趨復雜,急需一種具有高可用性和高性能的數據庫來支持業務發展,ClickHouse是俄羅斯的搜索公司Yandex開源的MPP架構的分析引擎,號稱比事務數據庫快100-1000倍,最大的特色是高性能的向量化執行引擎,而且功能豐富、可靠性高。
  在過去的一年中,杭研DBA團隊已經支撐網易集團內部多個事業部上線使用,集群規模共計十幾套,CPU近3000核,每日近千億數據入庫,千億級別表查詢可在秒級完成,大大提升了業務原有OLAP架構的效能,覆蓋的業務場景包括:用戶行為日志分析,進行PV、UV、留存、轉化漏斗和操作,包括游戲反外掛數據統計分析;用戶畫像,人群圈定和問卷投放;AB實驗數據的實時計算與分析;機器和業務日志的分析、監控、查詢等。
- 導讀
- 概述
- 第一章 安裝部署
- 1.1. docker安裝clickhouse
- 第二章 使用實踐與規范
- 2.1. ClickHouse應用場景
- 2.2. 表引擎選擇
- 2.2.1. MergeTree表引擎
- 2.2.2. ReplicatedMergeTree表引擎
- 2.2.3. ReplacingMergeTree表引擎
- 2.2.4. SummingMergeTree表引擎
- 2.2.5. Aggregatingmergetree表引擎
- 2.3. 開發規范
- 2.4. 集群架構
- 2.4.1. 常用架構
- 2.4.2. zookeeper的關鍵作用
- 2.4.3. chproxy
- 2.5. 客戶端工具選擇
- 2.6. 可用性說明
- 2.7. 集群配置參數調優
- 第三章 數據類型&語法以及常用函數
- 3.1. 基礎數據類型
- 3.2. SQL函數
- 3.3. DDL與DML基本語法
- 3.4. UPDATE 和 DELETE操作
- 3.4.1. 數據UPDATE和DELETE操作示例
- 3.4.2. 數據的實時更新操作(Real-time UPDATE)
- 第四章 clickhouse實戰篇
- 4.1. JDBC操作clickhouse
- 4.2. clickhouse集成mybatis