Web系統的緩存機制的建立和優化 · 億級Web系統搭建——單機到分布式集群

## Web系統的緩存機制的建立和優化剛剛我們講完了Web系統的外部網絡環境，現在我們開始關注我們Web系統自身的性能問題。我們的Web站點隨著訪問量的上升，會遇到很多的挑戰，解決這些問題不僅僅是擴容機器這么簡單，建立和使用合適的緩存機制才是根本。最開始，我們的Web系統架構可能是這樣的，每個環節，都可能只有1臺機器。? [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f9052ea2e9d.jpg)?](https://box.kancloud.cn/2015-09-16_55f9052ea2e9d.jpg) 我們從最根本的數據存儲開始看哈。 **一、 MySQL數據庫內部緩存使用** MySQL的緩存機制，就從先從MySQL內部開始，下面的內容將以最常見的InnoDB存儲引擎為主。 1\. 建立恰當的索引最簡單的是建立索引，索引在表數據比較大的時候，起到快速檢索數據的作用，但是成本也是有的。首先，占用了一定的磁盤空間，其中組合索引最突出，使用需要謹慎，它產生的索引甚至會比源數據更大。其次，建立索引之后的數據insert/update/delete等操作，因為需要更新原來的索引，耗時會增加。當然，實際上我們的系統從總體來說，是以select查詢操作居多，因此，索引的使用仍然對系統性能有大幅提升的作用。 2\. 數據庫連接線程池緩存如果，每一個數據庫操作請求都需要創建和銷毀連接的話，對數據庫來說，無疑也是一種巨大的開銷。為了減少這類型的開銷，可以在MySQL中配置thread_cache_size來表示保留多少線程用于復用。線程不夠的時候，再創建，空閑過多的時候，則銷毀。? [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f9052ed5e91.jpg)?](https://box.kancloud.cn/2015-09-16_55f9052ed5e91.jpg) 其實，還有更為激進一點的做法，使用pconnect（數據庫長連接），線程一旦創建在很長時間內都保持著。但是，在訪問量比較大，機器比較多的情況下，這種用法很可能會導致“數據庫連接數耗盡”，因為建立連接并不回收，最終達到數據庫的max_connections（最大連接數）。因此，長連接的用法通常需要在CGI和MySQL之間實現一個“連接池”服務，控制CGI機器“盲目”創建連接數。? [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f905301bc8c.jpg)?](https://box.kancloud.cn/2015-09-16_55f905301bc8c.jpg) 建立數據庫連接池服務，有很多實現的方式，PHP的話，我推薦使用swoole（PHP的一個網絡通訊拓展）來實現。 3\. Innodb緩存設置（innodb_buffer_pool_size） innodb_buffer_pool_size這是個用來保存索引和數據的內存緩存區，如果機器是MySQL獨占的機器，一般推薦為機器物理內存的80%。在取表數據的場景中，它可以減少磁盤IO。一般來說，這個值設置越大，cache命中率會越高。 4\. 分庫/分表/分區。 MySQL數據庫表一般承受數據量在百萬級別，再往上增長，各項性能將會出現大幅度下降，因此，當我們預見數據量會超過這個量級的時候，建議進行分庫/分表/分區等操作。最好的做法，是服務在搭建之初就設計為分庫分表的存儲模式，從根本上杜絕中后期的風險。不過，會犧牲一些便利性，例如列表式的查詢，同時，也增加了維護的復雜度。不過，到了數據量千萬級別或者以上的時候，我們會發現，它們都是值得的。? **二、 MySQL數據庫多臺服務搭建** 1臺MySQL機器，實際上是高風險的單點，因為如果它掛了，我們Web服務就不可用了。而且，隨著Web系統訪問量繼續增加，終于有一天，我們發現1臺MySQL服務器無法支撐下去，我們開始需要使用更多的MySQL機器。當引入多臺MySQL機器的時候，很多新的問題又將產生。 1\. 建立MySQL主從，從庫作為備份這種做法純粹為了解決“單點故障”的問題，在主庫出故障的時候，切換到從庫。不過，這種做法實際上有點浪費資源，因為從庫實際上被閑著了。 [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f905304a6e8.jpg)?](https://box.kancloud.cn/2015-09-16_55f905304a6e8.jpg) 2\. MySQL讀寫分離，主庫寫，從庫讀。兩臺數據庫做讀寫分離，主庫負責寫入類的操作，從庫負責讀的操作。并且，如果主庫發生故障，仍然不影響讀的操作，同時也可以將全部讀寫都臨時切換到從庫中（需要注意流量，可能會因為流量過大，把從庫也拖垮）。? [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f90535e50f0.jpg)?](https://box.kancloud.cn/2015-09-16_55f90535e50f0.jpg) 3\. 主主互備。兩臺MySQL之間互為彼此的從庫，同時又是主庫。這種方案，既做到了訪問量的壓力分流，同時也解決了“單點故障”問題。任何一臺故障，都還有另外一套可供使用的服務。? [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f9053628990.jpg)?](https://box.kancloud.cn/2015-09-16_55f9053628990.jpg) 不過，這種方案，只能用在兩臺機器的場景。如果業務拓展還是很快的話，可以選擇將業務分離，建立多個主主互備。 **三、 MySQL數據庫機器之間的數據同步** 每當我們解決一個問題，新的問題必然誕生在舊的解決方案上。當我們有多臺MySQL，在業務高峰期，很可能出現兩個庫之間的數據有延遲的場景。并且，網絡和機器負載等，也會影響數據同步的延遲。我們曾經遇到過，在日訪問量接近1億的特殊場景下，出現，從庫數據需要很多天才能同步追上主庫的數據。這種場景下，從庫基本失去效用了。于是，解決同步問題，就是我們下一步需要關注的點。 1\. MySQL自帶多線程同步 MySQL5.6開始支持主庫和從庫數據同步，走多線程。但是，限制也是比較明顯的，只能以庫為單位。MySQL數據同步是通過binlog日志，主庫寫入到binlog日志的操作，是具有順序的，尤其當SQL操作中含有對于表結構的修改等操作，對于后續的SQL語句操作是有影響的。因此，從庫同步數據，必須走單進程。 2\. 自己實現解析binlog，多線程寫入。以數據庫的表為單位，解析binlog多張表同時做數據同步。這樣做的話，的確能夠加快數據同步的效率，但是，如果表和表之間存在結構關系或者數據依賴的話，則同樣存在寫入順序的問題。這種方式，可用于一些比較穩定并且相對獨立的數據表。? [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f905365c887.jpg)?](https://box.kancloud.cn/2015-09-16_55f905365c887.jpg) 國內一線互聯網公司，大部分都是通過這種方式，來加快數據同步效率。還有更為激進的做法，是直接解析binlog，忽略以表為單位，直接寫入。但是這種做法，實現復雜，使用范圍就更受到限制，只能用于一些場景特殊的數據庫中（沒有表結構變更，表和表之間沒有數據依賴等特殊表）。? **四、在Web服務器和數據庫之間建立緩存** 實際上，解決大訪問量的問題，不能僅僅著眼于數據庫層面。根據“二八定律”，80%的請求只關注在20%的熱點數據上。因此，我們應該建立Web服務器和數據庫之間的緩存機制。這種機制，可以用磁盤作為緩存，也可以用內存緩存的方式。通過它們，將大部分的熱點數據查詢，阻擋在數據庫之前。? [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f9053680e02.jpg)?](https://box.kancloud.cn/2015-09-16_55f9053680e02.jpg) 1\. 頁面靜態化用戶訪問網站的某個頁面，頁面上的大部分內容在很長一段時間內，可能都是沒有變化的。例如一篇新聞報道，一旦發布幾乎是不會修改內容的。這樣的話，通過CGI生成的靜態html頁面緩存到Web服務器的磁盤本地。除了第一次，是通過動態CGI查詢數據庫獲取之外，之后都直接將本地磁盤文件返回給用戶。 [![](https://box.kancloud.cn/2015-09-16_55f90536b4939.jpg%3F_%3D58836)?](http://cms.csdnimg.cn/article/201411/06/545b7a9e619d3.jpg) 在Web系統規模比較小的時候，這種做法看似完美。但是，一旦Web系統規模變大，例如當我有100臺的Web服務器的時候。那樣這些磁盤文件，將會有100份，這個是資源浪費，也不好維護。這個時候有人會想，可以集中一臺服務器存起來，呵呵，不如看看下面一種緩存方式吧，它就是這樣做的。 2\. 單臺內存緩存通過頁面靜態化的例子中，我們可以知道將“緩存”搭建在Web機器本機是不好維護的，會帶來更多問題（實際上，通過PHP的apc拓展，可通過Key/value操作Web服務器的本機內存）。因此，我們選擇搭建的內存緩存服務，也必須是一個獨立的服務。內存緩存的選擇，主要有redis/memcache。從性能上說，兩者差別不大，從功能豐富程度上說，Redis更勝一籌。? [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f9053704a0a.jpg)?](https://box.kancloud.cn/2015-09-16_55f9053704a0a.jpg) 3\. 內存緩存集群當我們搭建單臺內存緩存完畢，我們又會面臨單點故障的問題，因此，我們必須將它變成一個集群。簡單的做法，是給他增加一個slave作為備份機器。但是，如果請求量真的很多，我們發現cache命中率不高，需要更多的機器內存呢？因此，我們更建議將它配置成一個集群。例如，類似redis cluster。 Redis cluster集群內的Redis互為多組主從，同時每個節點都可以接受請求，在拓展集群的時候比較方便。客戶端可以向任意一個節點發送請求，如果是它的“負責”的內容，則直接返回內容。否則，查找實際負責Redis節點，然后將地址告知客戶端，客戶端重新請求。? [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f9053747cd9.jpg)?](https://box.kancloud.cn/2015-09-16_55f9053747cd9.jpg) 對于使用緩存服務的客戶端來說，這一切是透明的。 [![](https://box.kancloud.cn/2015-09-16_55f9053781604.jpg%3F_%3D37813)?](http://cms.csdnimg.cn/article/201411/06/545b7b41c26cc.jpg) 內存緩存服務在切換的時候，是有一定風險的。從A集群切換到B集群的過程中，必須保證B集群提前做好“預熱”（B集群的內存中的熱點數據，應該盡量與A集群相同，否則，切換的一瞬間大量請求內容，在B集群的內存緩存中查找不到，流量直接沖擊后端的數據庫服務，很可能導致數據庫宕機）。 4\. 減少數據庫“寫” 上面的機制，都實現減少數據庫的“讀”的操作，但是，寫的操作也是一個大的壓力。寫的操作，雖然無法減少，但是可以通過合并請求，來起到減輕壓力的效果。這個時候，我們就需要在內存緩存集群和數據庫集群之間，建立一個修改同步機制。先將修改請求生效在cache中，讓外界查詢顯示正常，然后將這些sql修改放入到一個隊列中存儲起來，隊列滿或者每隔一段時間，合并為一個請求到數據庫中更新數據庫。? [![](https://box.kancloud.cn/2015-09-16_55f9053838dca.jpg%3F_%3D41932)?](http://cms.csdnimg.cn/article/201411/06/545b7b7e0ada4.jpg) 除了上述通過改變系統架構的方式提升寫的性能外，MySQL本身也可以通過配置參數innodb_flush_log_at_trx_commit來調整寫入磁盤的策略。如果機器成本允許，從硬件層面解決問題，可以選擇老一點的RAID（Redundant Arrays of independent Disks，磁盤列陣）或者比較新的SSD（Solid State Drives，固態硬盤）。 5\. NoSQL存儲不管數據庫的讀還是寫，當流量再進一步上漲，終會達到“人力有窮時”的場景。繼續加機器的成本比較高，并且不一定可以真正解決問題的時候。這個時候，部分核心數據，就可以考慮使用NoSQL的數據庫。NoSQL存儲，大部分都是采用key-value的方式，這里比較推薦使用上面介紹過Redis，Redis本身是一個內存cache，同時也可以當做一個存儲來使用，讓它直接將數據落地到磁盤。這樣的話，我們就將數據庫中某些被頻繁讀寫的數據，分離出來，放在我們新搭建的Redis存儲集群中，又進一步減輕原來MySQL數據庫的壓力，同時因為Redis本身是個內存級別的Cache，讀寫的性能都會大幅度提升。? [![](https://box.kancloud.cn/2015-09-16_55f9053867cdf.jpg%3F_%3D46765)?](http://cms.csdnimg.cn/article/201411/06/545b7bb88af37.jpg) 國內一線互聯網公司，架構上采用的解決方案很多是類似于上述方案，不過，使用的cache服務卻不一定是Redis，他們會有更豐富的其他選擇，甚至根據自身業務特點開發出自己的NoSQL服務。 6\. 空節點查詢問題當我們搭建完前面所說的全部服務，認為Web系統已經很強的時候。我們還是那句話，新的問題還是會來的。空節點查詢，是指那些數據庫中根本不存在的數據請求。例如，我請求查詢一個不存在人員信息，系統會從各級緩存逐級查找，最后查到到數據庫本身，然后才得出查找不到的結論，返回給前端。因為各級cache對它無效，這個請求是非常消耗系統資源的，而如果大量的空節點查詢，是可以沖擊到系統服務的。 [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f90538a1155.jpg)?](https://box.kancloud.cn/2015-09-16_55f90538a1155.jpg) 在我曾經的工作經歷中，曾深受其害。因此，為了維護Web系統的穩定性，設計適當的空節點過濾機制，非常有必要。我們當時采用的方式，就是設計一張簡單的記錄映射表。將存在的記錄存儲起來，放入到一臺內存cache中，這樣的話，如果還有空節點查詢，則在緩存這一層就被阻擋了。? [![億級Web系統搭建——單機到分布式集群 - hansionxu - 技術的天空](https://box.kancloud.cn/2015-09-16_55f90538df7d5.jpg)?](https://box.kancloud.cn/2015-09-16_55f90538df7d5.jpg)