# 如何定位問題
一個正常的火焰圖,應該呈現出如[官網](http://openresty.org/download/user-flamegraph.svg)給出的樣例(官網的火焰圖是抓C級別函數):
從上圖可以看出,正常業務下的火焰圖形狀類似的“山脈”,“山脈”的“海拔”表示worker中業務函數的調用深度,“山脈”的“長度”表示worker中業務函數占用cpu的比例。
下面將用一個實際應用中遇到問題抽象出來的示例(CPU占用過高)來說明如何通過火焰圖定位問題。
問題表現,nginx worker運行一段時間后出現CPU占用100%的情況,reload后一段時間后復現,當出現CPU占用率高情況的時候是某個worker 占用率高。
問題分析,單worker cpu高的情況一定是某個input中包含的信息不能被lua函數以正確地方式處理導致的,因此上火焰圖找出具體的函數,抓取的過程需要抓取C級別的函數和lua級別的函數,抓取相同的時間,兩張圖一起分析才能得到準確的結果。
抓取步驟:
1. [安裝SystemTap](#);
1.
獲取CPU異常的worker的進程ID;
> ps -ef | grep nginx
1.
使用[ngx-sample-lua-bt](https://github.com/openresty/nginx-systemtap-toolkit)抓取棧信息,并用fix-lua-bt工具處理;
> ./ngx-sample-lua-bt -p 9768 --luajit20 -t 5 > tmp.bt
./fix-lua-bt tmp.bt > a.bt
1.
使用[stackcollapse-stap.pl和](https://github.com/brendangregg/FlameGraph);
> ./stackcollapse-stap.pl a.bt > a.cbt
./flamegraph.pl a.cbt > a.svg
1. a.svg即是火焰圖,拖入瀏覽器即可:

1. 從上圖可以清楚的看到get_serial_id這個函數占用了絕大部分的CPU比例,問題的排查可以從這里入手,找到其調用棧中異常的函數。
ps:一般來說一個正常的火焰圖看起來像一座座連綿起伏的“山峰”,而一個異常的火焰圖看起來像一座“平頂山”。
- 序
- Lua簡介
- Lua環境搭建
- 基礎數據類型
- 表達式
- 控制結構
- if/else
- while
- repeat
- 控制結構for的使用
- break,return
- Lua函數
- 函數的定義
- 函數的參數
- 函數的返回值
- 函數回調
- 模塊
- String庫
- Table庫
- 日期時間函數
- 數學庫函數
- 文件操作
- 元表
- 面向對象編程
- FFI
- LuaRestyRedisLibrary
- select+set_keepalive組合操作引起的數據讀寫錯誤
- redis接口的二次封裝(簡化建連、拆連等細節)
- redis接口的二次封裝(發布訂閱)
- pipeline壓縮請求數量
- script壓縮復雜請求
- LuaCjsonLibrary
- json解析的異常捕獲
- 稀疏數組
- 空table編碼為array還是object
- 跨平臺的庫選擇
- PostgresNginxModule
- 調用方式簡介
- 不支持事務
- 超時
- 健康監測
- SQL注入
- LuaNginxModule
- 執行階段概念
- 正確的記錄日志
- 熱裝載代碼
- 阻塞操作
- 緩存
- sleep
- 定時任務
- 禁止某些終端訪問
- 請求返回后繼續執行
- 調試
- 調用其他C函數動態庫
- 我的lua代碼需要調優么
- 變量的共享范圍
- 動態限速
- shared.dict 非隊列性質
- 如何添加自己的lua api
- 正確使用長鏈接
- 如何引用第三方resty庫
- 使用動態DNS來完成HTTP請求
- 緩存失效風暴
- Lua
- 下標從1開始
- 局部變量
- 判斷數組大小
- 非空判斷
- 正則表達式
- 不用標準庫
- 虛變量
- 函數在調用代碼前定義
- 抵制使用module()函數來定義Lua模塊
- 點號與冒號操作符的區別
- 測試
- 單元測試
- API測試
- 性能測試
- 持續集成
- 灰度發布
- web服務
- API的設計
- 數據合法性檢測
- 協議無痛升級
- 代碼規范
- 連接池
- c10k編程
- TIME_WAIT問題
- 與Docker使用的網絡瓶頸
- 火焰圖
- 什么時候使用
- 顯示的是什么
- 如何安裝火焰圖生成工具
- 如何定位問題