使用 Heartbeat 構建高可用服務 · Puppet 2.7 Cookbook 中文版

### 使用 Heartbeat 構建高可用服務 > Even in the future, nothing works! > > — Spaceballs 一切遲早都會發生故障。高可用服務就是指當一個主機或網絡線路失效時仍舊能夠提供服務。高可用性的主要技術就是冗余，另外，這個問題的解決就是以投放更多硬件設備而著稱的。雖然最終肯定會有單獨的一臺服務器失效，但是兩臺服務器同時失效的概率是不太高的，這對大多數的應用程序提供了一個良好的冗余水平。最簡單的方法之一是建立一對冗余服務器，它們共享一個 IP 地址，并使用心跳檢測。 **心跳**（**Heartbeat**）是一個守護進程，它同時運行在兩臺機器上并且定期彼此交換信息（heartbeats）。其中的一臺是主服務器，通常它擁有資源：在本例中是一個 IP 地址。如果輔助服務器無法從主服務器檢測到心跳信號，它就接管地址以確保服務的連續性。在下面的處方中，我們將使用 Puppet 的配置設置兩臺機器，并解釋如何使用它提供一個高可用服務。 #### 操作步驟 1. 創建如下的 heartbeat 模塊： ``` # mkdir /etc/puppet/modules/heartbeat # mkdir /etc/puppet/modules/heartbeat/manifests # mkdir /etc/puppet/modules/heartbeat/files ``` 2. 使用如下內容創建 /etc/puppet/modules/heartbeat/manifests/init.pp 文件： ``` class heartbeat { package { "heartbeat": ensure => installed, } service { "heartbeat": ensure => running, require => Package["heartbeat"], } exec { "reload-heartbeat": command => "/usr/sbin/service heartbeat reload", refreshonly => true, } file { "/etc/ha.d/authkeys": source => "puppet:///modules/heartbeat/authkeys", mode => "600", require => Package["heartbeat"], notify => Exec["reload-heartbeat"], } file { "/etc/ha.d/haresources": source => "puppet:///modules/heartbeat/haresources", notify => Exec["reload-heartbeat"], require => Package["heartbeat"], } file { "/etc/ha.d/ha.cf": source => "puppet:///modules/heartbeat/ha.cf", notify => Exec["reload-heartbeat"], require => Package["heartbeat"], } } ``` 3. 使用如下內容創建 /etc/puppet/modules/heartbeat/files/haresources 文件。將 cookbook 替換成你的主服務器的主機名。這可以通過在主服務器上運行 uname -n 命令獲得。將 10.0.2.100 替換成你要在兩臺主機上共享的 IP 地址（這應該是當前網絡上還未使用的地址）。最后列出的接口是分配給心跳檢測的（本例中是 eth0:1）。 ``` cookbook IPaddr::10.0.2.100/24/eth0:1 ``` 4. 使用如下內容創建 /etc/puppet/modules/heartbeat/files/authkeys 文件（使用你自己選擇的口令替換 topsecretpassword）： ``` auth 1 1 sha1 topsecretpassword ``` 5. 使用如下內容創建 /etc/puppet/modules/heartbeat/files/ha.cf 文件。替換下面的兩個 IP 地址為你自己的兩臺機器上 eth0 接口對應的 IP 地址。同樣需替換 cookbook 和 cookbook2 為你自己的兩臺機器的主機名（可以通過運行 uname -n 命令獲得）。 ``` autojoin none ucast eth0 10.0.2.15 ucast eth0 10.0.2.16 keepalive 1 deadtime 10 warntime 5 udpport 694 auto_failback on node cookbook node cookbook2 use_logd yes ``` 6. 在兩臺冗余服務器上都運行 Puppet： ``` # puppet agent --test info: Retrieving plugin info: Caching catalog for cookbook.bitfieldconsulting.com info: Applying configuration version '1311440876' notice: /Stage[main]/Heartbeat/Package[heartbeat]/ensure: created notice: /Stage[main]/Heartbeat/File[/etc/ha.d/authkeys]/ensure: defined content as '{md5}e908c869aabe519aa69acc9e51da3399' info: /Stage[main]/Heartbeat/File[/etc/ha.d/authkeys]: Scheduling refresh of Exec[reload-heartbeat] notice: /Stage[main]/Heartbeat/File[/etc/ha.d/ha.cf]/ensure: defined content as '{md5}a8d3fdd62a1172cdff150fc1d86d8a6b' info: /Stage[main]/Heartbeat/File[/etc/ha.d/ha.cf]: Scheduling refresh of Exec[reload-heartbeat] notice: /Stage[main]/Heartbeat/File[/etc/ha.d/haresources]/ensure: defined content as '{md5}0f25aefe7f6c4c8e81b3bb6c86a42d60' info: /Stage[main]/Heartbeat/File[/etc/ha.d/haresources]: Scheduling refresh of Exec[reload-heartbeat] notice: /Stage[main]/Heartbeat/Exec[reload-heartbeat]: Triggered 'refresh' from 3 events notice: Finished catalog run in 27.01 seconds ``` 7. 在主服務器節點上，檢查它的資源： ``` # cl_status rscstatus -m This node is holding all resources. ``` 8. 在輔助服務器節點上，你應該可以看到如下信息： ``` # cl_status rscstatus -m This node is holding none resources. ``` 9. 在主節點上禁用 Heartbeat 服務： ``` # service heartbeat stop ``` 10. 輔助節點現在應該接管了資源： ``` # cl_status rscstatus -m This node is holding all resources. ``` #### 工作原理兩臺服務器上都運行了心跳守護進程，彼此監聽心跳信號。如果主服務器檢測到輔助服務器已宕機，什么也不會發生。而相反地，如果輔助服務器檢測到主服務器已宕機，它就接管 IP 地址。當主服務器恢復運行后，輔助服務器將再次放棄此地址，重新由主服務器接管 IP 地址（如果 auto_failback 設置成了 on）。在某些情況下，例如：如果你在主數據庫服務器和從數據庫服務器之間共享 IP 地址，你可能不希望這種行為發生，在這種情況下應該將 auto_failback 設置成了 off。 #### 更多用法現在你有一個共享的 IP 地址（真是名不副實，因為這個地址不是“共享”的，而是在兩個服務器之間切換），你可以用這個地址來提供高可用性的服務。例如，如果服務器是被托管的 web 站點，你應該為 web 站點設置 DNS 記錄指向這個共享的 IP 地址。當主服務器宕機時，輔助服務器將接管 IP 地址并繼續響應基于此地址的 HTTP 請求。 > ![提示](https://box.kancloud.cn/2016-05-12_5733eec6d55e1.png) > 如果你正在使用 SSL 站點，你需要配置基于共享 IP 地址的 SSL 虛擬主機，否則將不能響應基于這個 IP 的 HTTPs 請求。另外，如果這個 web 站點使用了 sessions，主服務器上的任何 sessions 在故障轉移后將會丟失，除非 sessions 存儲在一個分離的共享數據庫中。共享 IP 地址也是實現雙路冗余負載均衡器的一種好方式（參考 [使用 HAProxy 為多個 web 服務器實現負載均衡](#ch08sec04) 一節）。你也可以使用這種方式為 Puppetmaster 主機提供冗余服務。在 Puppet Labs 站點給出了一個合適的模式： [http://projects.puppetlabs.com/projects/1/wiki/High_Availability_Patterns](http://projects.puppetlabs.com/projects/1/wiki/High_Availability_Patterns) 。