# 一、監控的理解
## 1. 監控對象
(1)監控對象的理解:我們要監控誰?假設我們要監控CPU,那么CPU我們就必須知道他是怎么工作,必須了解它的工作原理。
(2)監控對象的指標:我們監控CPU的那些參數?例如我們可以監控CPU的使用率、CPU負載 、CPU個數。
(3)確定性能基準線:怎么才算故障?CPU負載多少才算高?我們要制定一個標準來評判故障,這個標準要根據服務器跑的不同業務來制定。
## 2. 監控范圍
### (1)硬件監控
通常情況下對硬件的監控我們一般會使用IPMI工具加之人工的機房巡檢。不同的服務器也有各自的遠程控制卡
例如:
DELL服務器:iDRAC
HP服務器:ILO
IBM服務器:IMM
linux就可以使用IPMI BMC控制器
ipmitool工具的使用需要硬件支持,操作系統通常為Linux
在Linux下安裝:
yum -y install OpenIPMI ipmitool
使用IPMI有兩種方式:
- 本地調用
- 遠程調用 ip地址
路由器和交換機通常使用SNMP監控,Linux也支持SNMP監控,開啟SNMP監控通常需要安裝如下幾個rpm包
yum -y install net-snmp net-snmp-utils
### (2)操作系統監控
對與操作系統我們通常會監控CPU、內存、IO 進程(網絡、磁盤)
監控的基準:
- 確定服務類型:IO密集型、數據庫、cpu密集型、web mail
- 確定性能基準線:運行隊列數、cpu使用率、上下文切換
最常用的監控命令:`top`、`vmstat`、`mpstat`
top命令的兩個參數
P:cpu使用率排序
M:內存使用率排序
CPU三個重要的概念:
- 上下文切換:cpu調度器實施的進程切換過程,上下文切換
- 運行隊列(負載)
- 使用率
查看內存使用率的命令:`free` `vmtstat`
對于內存我們要知曉頁的大小(通常情況是4KB),關心內存如何尋址和所剩空間
硬盤我們常用 `iotop`(了解`dd`命令)、`iostat`來測試其性能,當然對于硬盤我們首要關心的是它的順序IO和隨機IO
查看網絡的性能通常使用`iftop`命令,測試網絡IO推薦使用IBM的測試工具:nmon(二進制文件)
### (3)應用服務監控
這里舉例監控nginx
安裝nginx:
yum -y install gcc glibc gcc--c++ pcre-devel openssl-devel #安裝必要rpm包
cd /usr/local/src
wget http://nginx.org/download/nginx-1.15.2.tar.gz
tar zxvf nginx-1.15.2.tar.gz
# configure shell腳本,執行它生成makefile
useradd -s /sbin/nologin -M www #創建nginx用戶
./configure --prefix=/usr/local/nginx-1.15.2 \
--user=www --group=www \
--with-http_ssl_module \
--with-http_stub_status_module
make && make install
ln -s /usr/local/nginx-1.15.2 /usr/local/nginx #創建軟連接
修改配置文件:
vim /usr/local/nginx/conf/nginx.conf
在配置文件添加
```
location /nginx-status {
stub_status on;
access_log off;
allow all;
}
```

啟動nginx:
/usr/local/nginx/sbin/nginx -t #檢查配置文件
/usr/local/nginx/sbin/nginx #啟動nginx
監控的效果:
```
[root@host-10-197-22-14 ~]# curl -s http://10.197.22.14:8080/nginx-status
Active connections: 1
server accepts handled requests
1152438 1152438 1152488
Reading: 0 Writing: 1 Waiting: 0
```
### (4)業務監控
我所處崗位暫不涉及監控業務的內容,所以這里就簡單扯一下。
監控業務我的理解是我們要知道那個時間端我們網站什么的訪問量最大、用戶在線最大、請求最頻繁,那個時間端最空閑。在業務繁忙的時間端我們要如何確保業務正常這是我們運維要思考的問題。
如何做好監控?要做那些監控?這里我按照我工作中所遇到的場景進行簡單的介紹!
- 獻給我的朋友們
- 一、個人對學習的看法
- 二、運維技能圖譜
- 三、運維常用技能
- 3.1 Vim(最好用的編輯器)
- 3.2 Nginx & Tengine(Web服務)
- 1. Nginx介紹和部署
- 2. Nginx配置解析
- 3. Nginx常用模塊
- 4. Nginx 的session 一致性問題
- 3.3 Tomcat(Web中間件)
- 3.4 Keepalived(負載均衡高可用)
- 3.5 Memcache(分布式緩存)
- 3.6 Zookeeper(分布式協調系統)
- 3.7 KVM(開源虛擬化)
- 1. 虛擬化介紹
- 2. KVM基礎
- 3. 設置VNC和時間同步
- 4. kvm虛擬機快照備份
- 5. kvm虛擬機在線擴展磁盤
- 6. kvm虛擬機靜態遷移
- 7. kvm虛擬機動態遷移
- 8. kvm虛擬機存儲池配置
- 9. cpu添加虛擬化功能
- 3.8 GitLab(版本控制)
- 3.8.1 GitLab安裝與漢化
- 3.9 Jenkins(運維自動化)
- 3.10 WAF(Web防火墻)
- 3.10.1初探WAF
- 四、常用數據庫
- 4.1 MySQL(關系型數據庫)
- 1. MySQL源碼安裝
- 4.2 Mongodb(適用與大數據分析的數據庫)
- 4.3 Redis(非關系數據庫)
- 五、自動化運維工具
- 5.1 Cobbler(系統自動化部署)
- 5.2 Ansible(自動化部署)
- 5.3 Puppet(自動化部署)
- 5.4 SaltStack(自動化運維)
- 六、存儲
- 6.1 GFS(文件型存儲)
- 6.2 Ceph(后端存儲)
- 七、運維監控工具
- 7.1 對監控的理解
- 7.2 Zabbix(運維監控)
- 7.2.1 Zabbix簡介
- 7.2.2 Zabbix服務部署
- 1. Zabbix服務端部署
- 2. Zabbix客服端部署
- 3. 配置前端展示
- 4. zabbix告警配置
- 7.2.3 Zabbix監控服務
- 1. 監控網絡設備
- 2. 自定義Nginx監控
- 7.3 云鏡(安全監控)
- 7.4 ELK(日志收集展示)
- 八、運維云平臺
- 8.1 OpenStack(開源云操作系統)
- 8.1.1 OpenStack簡介
- 8.1.2 實驗架構設計
- 8.1.3 集群環境準備
- 8.1.4 controller節點部署
- 1. 安裝Mariadb Galera Cluster集群
- 2. 安裝RabbitMQ Cluster集群
- 3. 安裝Pacemaker
- 4. 安裝HAProxy
- 5. 安裝配置Keystone
- 6. 安裝配置glance
- 1. 制作鏡像模板
- 7. 安裝配置nova
- 8. 安裝配置neutron
- 1. 配置虛擬機網絡
- 9. 安裝Dashboard
- 10. 安裝配置cinder
- 8.1.5 compute節點部署
- 1. 安裝相關軟件包
- 2. 安裝Neutron
- 3. 配置cinder
- 4. 創建第一個虛擬機
- 8.1.6 OpenStack報錯處理
- 1. cinder僵尸卷刪除
- 8.1.7 快速孵化虛擬機方案
- 8.1.8 Kolla容器化部署OpenStack
- 1. 單點部署
- 2. 多節點部署
- 8.2 Tstack(騰訊云平臺)
- 8.3 K8s(微服務容器化)
- 九、運維編程技能
- 9.1 Shell(運維必會語言)
- 9.2 Python(萬能的膠水語言)
- 十、Devops運維
- 10.1 理念
- 10.2 Devops實戰