### 使用 Heartbeat 構建高可用服務
> Even in the future, nothing works!
>
> — Spaceballs
一切遲早都會發生故障。高可用服務就是指當一個主機或網絡線路失效時仍舊能夠提供服務。 高可用性的主要技術就是冗余,另外,這個問題的解決就是以投放更多硬件設備而著稱的。
雖然最終肯定會有單獨的一臺服務器失效,但是兩臺服務器同時失效的概率是不太高的, 這對大多數的應用程序提供了一個良好的冗余水平。
最簡單的方法之一是建立一對冗余服務器,它們共享一個 IP 地址,并使用心跳檢測。 **心跳**(**Heartbeat**)是一個守護進程,它同時運行在兩臺機器上并且定期彼此交換信息(heartbeats)。 其中的一臺是主服務器,通常它擁有資源:在本例中是一個 IP 地址。 如果輔助服務器無法從主服務器檢測到心跳信號,它就接管地址以確保服務的連續性。
在下面的處方中,我們將使用 Puppet 的配置設置兩臺機器,并解釋如何使用它提供一個高可用服務。
#### 操作步驟
1. 創建如下的 heartbeat 模塊:
```
# mkdir /etc/puppet/modules/heartbeat
# mkdir /etc/puppet/modules/heartbeat/manifests
# mkdir /etc/puppet/modules/heartbeat/files
```
2. 使用如下內容創建 /etc/puppet/modules/heartbeat/manifests/init.pp 文件:
```
class heartbeat {
package { "heartbeat":
ensure => installed,
}
service { "heartbeat":
ensure => running,
require => Package["heartbeat"],
}
exec { "reload-heartbeat":
command => "/usr/sbin/service heartbeat reload",
refreshonly => true,
}
file { "/etc/ha.d/authkeys":
source => "puppet:///modules/heartbeat/authkeys",
mode => "600",
require => Package["heartbeat"],
notify => Exec["reload-heartbeat"],
}
file { "/etc/ha.d/haresources":
source => "puppet:///modules/heartbeat/haresources",
notify => Exec["reload-heartbeat"],
require => Package["heartbeat"],
}
file { "/etc/ha.d/ha.cf":
source => "puppet:///modules/heartbeat/ha.cf",
notify => Exec["reload-heartbeat"],
require => Package["heartbeat"],
}
}
```
3. 使用如下內容創建 /etc/puppet/modules/heartbeat/files/haresources 文件。 將 cookbook 替換成你的主服務器的主機名。這可以通過在主服務器上運行 uname -n 命令獲得。 將 10.0.2.100 替換成你要在兩臺主機上共享的 IP 地址(這應該是當前網絡上還未使用的地址)。 最后列出的接口是分配給心跳檢測的(本例中是 eth0:1)。
```
cookbook IPaddr::10.0.2.100/24/eth0:1
```
4. 使用如下內容創建 /etc/puppet/modules/heartbeat/files/authkeys 文件 (使用你自己選擇的口令替換 topsecretpassword):
```
auth 1
1 sha1 topsecretpassword
```
5. 使用如下內容創建 /etc/puppet/modules/heartbeat/files/ha.cf 文件。 替換下面的兩個 IP 地址為你自己的兩臺機器上 eth0 接口對應的 IP 地址。 同樣需替換 cookbook 和 cookbook2 為你自己的兩臺機器的主機名(可以通過運行 uname -n 命令獲得)。
```
autojoin none
ucast eth0 10.0.2.15
ucast eth0 10.0.2.16
keepalive 1
deadtime 10
warntime 5
udpport 694
auto_failback on
node cookbook
node cookbook2
use_logd yes
```
6. 在兩臺冗余服務器上都運行 Puppet:
```
# puppet agent --test
info: Retrieving plugin
info: Caching catalog for cookbook.bitfieldconsulting.com
info: Applying configuration version '1311440876'
notice: /Stage[main]/Heartbeat/Package[heartbeat]/ensure: created
notice: /Stage[main]/Heartbeat/File[/etc/ha.d/authkeys]/ensure:
defined content as '{md5}e908c869aabe519aa69acc9e51da3399'
info: /Stage[main]/Heartbeat/File[/etc/ha.d/authkeys]: Scheduling
refresh of Exec[reload-heartbeat]
notice: /Stage[main]/Heartbeat/File[/etc/ha.d/ha.cf]/ensure:
defined content as '{md5}a8d3fdd62a1172cdff150fc1d86d8a6b'
info: /Stage[main]/Heartbeat/File[/etc/ha.d/ha.cf]: Scheduling
refresh of Exec[reload-heartbeat]
notice: /Stage[main]/Heartbeat/File[/etc/ha.d/haresources]/ensure:
defined content as '{md5}0f25aefe7f6c4c8e81b3bb6c86a42d60'
info: /Stage[main]/Heartbeat/File[/etc/ha.d/haresources]:
Scheduling refresh of Exec[reload-heartbeat]
notice: /Stage[main]/Heartbeat/Exec[reload-heartbeat]: Triggered
'refresh' from 3 events
notice: Finished catalog run in 27.01 seconds
```
7. 在主服務器節點上,檢查它的資源:
```
# cl_status rscstatus -m
This node is holding all resources.
```
8. 在輔助服務器節點上,你應該可以看到如下信息:
```
# cl_status rscstatus -m
This node is holding none resources.
```
9. 在主節點上禁用 Heartbeat 服務:
```
# service heartbeat stop
```
10. 輔助節點現在應該接管了資源:
```
# cl_status rscstatus -m
This node is holding all resources.
```
#### 工作原理
兩臺服務器上都運行了心跳守護進程,彼此監聽心跳信號。 如果主服務器檢測到輔助服務器已宕機,什么也不會發生。 而相反地,如果輔助服務器檢測到主服務器已宕機,它就接管 IP 地址。 當主服務器恢復運行后,輔助服務器將再次放棄此地址,重新由主服務器接管 IP 地址 (如果 auto_failback 設置成了 on)。 在某些情況下,例如:如果你在主數據庫服務器和從數據庫服務器之間共享 IP 地址, 你可能不希望這種行為發生,在這種情況下應該將 auto_failback 設置成了 off。
#### 更多用法
現在你有一個共享的 IP 地址(真是名不副實,因為這個地址不是“共享”的,而是在兩個服務器之間切換), 你可以用這個地址來提供高可用性的服務。例如,如果服務器是被托管的 web 站點, 你應該為 web 站點設置 DNS 記錄指向這個共享的 IP 地址。 當主服務器宕機時,輔助服務器將接管 IP 地址并繼續響應基于此地址的 HTTP 請求。
> 
> 如果你正在使用 SSL 站點,你需要配置基于共享 IP 地址的 SSL 虛擬主機, 否則將不能響應基于這個 IP 的 HTTPs 請求。
另外,如果這個 web 站點使用了 sessions,主服務器上的任何 sessions 在故障轉移后將會丟失, 除非 sessions 存儲在一個分離的共享數據庫中。
共享 IP 地址也是實現雙路冗余負載均衡器的一種好方式 (參考 [使用 HAProxy 為多個 web 服務器實現負載均衡](#ch08sec04) 一節)。 你也可以使用這種方式為 Puppetmaster 主機提供冗余服務。 在 Puppet Labs 站點給出了一個合適的模式: [http://projects.puppetlabs.com/projects/1/wiki/High_Availability_Patterns](http://projects.puppetlabs.com/projects/1/wiki/High_Availability_Patterns) 。
- Puppet 2.7 Cookbook 中文版
- 中文翻譯版
- 譯者序
- 項目緣起
- 翻譯方法
- 社區鏈接
- 社區建議
- 貢獻者
- 原書版權頁
- 關于作者
- 前言
- 本書內容
- 閱讀前提
- 適用讀者
- 格式約定
- 讀者反饋
- 客戶支持
- 下載案例代碼
- 勘誤表
- Puppet 基礎設施
- 使用版本控制
- 使用提交鉤子
- 使用 Rake 部署變更
- 配置 Puppet 的文件服務器
- 從 cron 運行 Puppet
- 使用自動簽名
- 預簽名證書
- 從 Puppet 的 filebucket 檢索文件
- 使用 Passenger 擴展 Puppet 的部署規模
- 創建去中心化的分布式 Puppet 架構
- 監控、報告和排錯
- 生成報告
- 通過 Email 發送包含特定標簽的日志信息
- 創建圖形化報告
- 自動生成 HTML 文檔
- 繪制依賴關系圖
- 測試你的 Puppet 配置清單
- 執行模擬運行
- 檢測編譯錯誤
- 理解 Puppet 的錯誤信息
- 顯示命令的輸出結果
- 輸出調試信息
- 檢查配置設置
- 使用標簽
- 使用運行階段
- 使用不同的環境
- Puppet 語言及其寫作風格
- 使用 Puppet 社區規范
- 使用模塊
- 使用標準的命名規范
- 使用嵌入式 Ruby 代碼
- 使用純 Ruby 代碼書寫配置清單
- 遍歷多個項目
- 書寫強大的條件語句
- 在 if 語句中使用正則表達式
- 使用選擇器和 case 語句
- 檢測字符串中是否包含指定的值
- 使用正則表達式替換
- 書寫更優質的配置清單
- 使用資源的數組
- 使用 define 資源
- 指定資源的依賴關系
- 使用節點繼承
- 使用類的繼承和重載
- 給類傳遞參數
- 書寫可重用的跨平臺配置清單
- 獲得系統的環境信息
- 導入動態信息
- 從 CSV 文件導入數據
- 給 Shell 命令傳遞參數
- 使用文件和軟件包
- 為配置文件添加配置行
- 使用 Augeas 自動修改配置文件
- 使用配置片段構建配置文件
- 使用 ERB 模板
- 在模板中遍歷數組
- 從第三方倉庫安裝軟件包
- 配置 APT 軟件倉庫
- 配置 GEM 倉庫
- 從源碼包自動構建軟件
- 比較軟件包的版本
- 用戶和虛擬資源
- 使用虛擬資源
- 使用虛擬資源管理用戶
- 管理用戶基于密鑰的 SSH 訪問
- 管理用戶的自定義文件
- 有效地分發 cron 任務
- 當文件更新時運行命令
- 使用主機資源
- 為文件資源指定多個源
- 使用文件資源遞歸地分發整個目錄樹
- 清理過期的舊文件
- 使用日程表資源
- 資源的審計
- 臨時禁用資源
- 管理時區
- 應用程序
- 管理 Apache 服務
- 創建 Apache 虛擬主機
- 創建 Nginx 虛擬主機
- 創建 MySQL 數據庫及用戶
- 管理 Drupal 站點
- 管理 Rails 應用程序
- 服務器和云基礎設施
- 部署 Nagios 監控服務器
- 使用 Heartbeat 構建高可用服務
- 管理 NFS 服務和文件共享
- 使用 HAProxy 為多個 web 服務器實現負載均衡
- 使用 iptables 管理防火墻
- 管理 Amazon 的 EC2 實例
- 使用 Vagrant 管理虛擬機
- 外部工具和 Puppet 生態環境
- 創建 Facter 的自定義 fact
- 在運行 Puppet 之前和之后執行命令
- 從 Shell 會話生成 Puppet 配置清單
- 從運行的系統上生成 Puppet 配置清單
- 使用 Puppet Dashboard
- 使用 Foreman
- 使用 MCollective
- 使用公共模塊
- 使用外部節點分類器
- 創建自定義的資源類型
- 創建自定義的提供者