## 13.10.1 時間和內存消耗
可以用這個便捷腳本?*xtime*?來測量:
~~~
#!/bin/sh
/usr/bin/time -f ‘%Uu %Ss %er %MkB %C’ “$@”
~~~
在 Unix 命令行中像這樣使用?`xtime goprogexec`,這里的 progexec 是一個 Go 可執行程序,這句命令行輸出類似:56.63u 0.26s 56.92r 1642640kB progexec,分別對應用戶時間,系統時間,實際時間和最大內存占用。
## [](https://github.com/Unknwon/the-way-to-go_ZH_CN/blob/master/eBook/13.10.md#13102-用-go-test-調試)13.10.2 用 go test 調試
如果代碼使用了 Go 中 testing 包的基準測試功能,我們可以用 gotest 標準的?`-cpuprofile`?和?`-memprofile`?標志向指定文件寫入 CPU 或 內存使用情況報告。
使用方式:`go test -x -v -cpuprofile=prof.out -file x_test.go`
編譯執行 x_test.go 中的測試,并向 prof.out 文件中寫入 cpu 性能分析信息。
## [](https://github.com/Unknwon/the-way-to-go_ZH_CN/blob/master/eBook/13.10.md#13103-用-pprof-調試)13.10.3 用 pprof 調試
你可以在單機程序 progexec 中引入 runtime/pprof 包;這個包以 pprof 可視化工具需要的格式寫入運行時報告數據。對于 CPU 性能分析來說你需要添加一些代碼:
~~~
var cpuprofile = flag.String(“cpuprofile”, “”, “write cpu profile to file”)
func main() {
flag.Parse()
if *cpuprofile != “” {
f, err := os.Create(*cpuprofile)
if err != nil {
log.Fatal(err)
}
pprof.StartCPUProfile(f)
defer pprof.StopCPUProfile()
}
...
~~~
代碼定義了一個名為 cpuprofile 的 flag,調用 Go flag 庫來解析命令行 flag,如果命令行設置了 cpuprofile flag,則開始 CPU 性能分析并把結果重定向到那個文件。(os.Create 用拿到的名字創建了用來寫入分析數據的文件)。這個分析程序最后需要在程序退出之前調用 StopCPUProfile 來刷新掛起的寫操作到文件中;我們用 defer 來保證這一切會在 main 返回時觸發。
現在用這個 flag 運行程序:`progexec -cpuprofile=progexec.prof`
然后可以像這樣用 gopprof 工具:`gopprof progexec progexec.prof`
gopprof 程序是 Google pprofC++ 分析器的一個輕微變種;關于此工具更多的信息,參見[http://code.google.com/p/google-perftools/](http://code.google.com/p/google-perftools/)。
如果開啟了 CPU 性能分析,Go 程序會以大約每秒 100 次的頻率阻塞,并記錄當前執行的 goroutine 棧上的程序計數器樣本。
此工具一些有趣的命令:
1)`topN`
用來展示分析結果中最開頭的 N 份樣本,例如:`top5`?它會展示在程序運行期間調用最頻繁的 5 個函數,輸出如下:
~~~
Total: 3099 samples
626 20.2% 20.2% 626 20.2% scanblock
309 10.0% 30.2% 2839 91.6% main.FindLoops
...
~~~
第 5 列表示函數的調用頻度。
2)`web`?或?`web 函數名`
該命令生成一份 SVG 格式的分析數據圖表,并在網絡瀏覽器中打開它(還有一個 gv 命令可以生成 PostScript 格式的數據,并在 GhostView 中打開,這個命令需要安裝 graphviz)。函數被表示成不同的矩形(被調用越多,矩形越大),箭頭指示函數調用鏈。
3)`list 函數名`?或?`weblist 函數名`
展示對應函數名的代碼行列表,第 2 列表示當前行執行消耗的時間,這樣就很好地指出了運行過程中消耗最大的代碼。
如果發現函數?`runtime.mallocgc`(分配內存并執行周期性的垃圾回收)調用頻繁,那么是應該進行內存分析的時候了。找出垃圾回收頻繁執行的原因,和內存大量分配的根源。
為了做到這一點必須在合適的地方添加下面的代碼:
~~~
var memprofile = flag.String(“memprofile”, “”, “write memory profile to this file”)
...
CallToFunctionWhichAllocatesLotsOfMemory()
if *memprofile != “” {
f, err := os.Create(*memprofile)
if err != nil {
log.Fatal(err)
}
pprof.WriteHeapProfile(f)
f.Close()
return
}
~~~
用 -memprofile flag 運行這個程序:`progexec -memprofile=progexec.mprof`
然后你可以像這樣再次使用 gopprof 工具:`gopprof progexec progexec.mprof`
`top5`,`list 函數名`?等命令同樣適用,只不過現在是以 Mb 為單位測量內存分配情況,這是 top 命令輸出的例子:
~~~
Total: 118.3 MB
66.1 55.8% 55.8% 103.7 87.7% main.FindLoops
30.5 25.8% 81.6% 30.5 25.8% main.*LSG·NewLoop
...
~~~
從第 1 列可以看出,最上面的函數占用了最多的內存。
同樣有一個報告內存分配計數的有趣工具:
~~~
gopprof --inuse_objects progexec progexec.mprof
~~~
對于 web 應用來說,有標準的 HTTP 接口可以分析數據。在 HTTP 服務中添加
~~~
import _ “http/pprof”
~~~
會為 /debug/pprof/ 下的一些 URL 安裝處理器。然后你可以用一個唯一的參數——你服務中的分析數據的 URL 來執行 gopprof 命令——它會下載并執行在線分析。
~~~
gopprof http://localhost:6060/debug/pprof/profile # 30-second CPU profile
gopprof http://localhost:6060/debug/pprof/heap # heap profile
~~~
在 Go-blog(引用 15)中有一篇很好的文章用具體的例子進行了分析:分析 Go 程序(2011年6月)。
- 前言
- 第一部分:學習 Go 語言
- 第1章:Go 語言的起源,發展與普及
- 1.1 起源與發展
- 1.2 語言的主要特性與發展的環境和影響因素
- 第2章:安裝與運行環境
- 2.1 平臺與架構
- 2.2 Go 環境變量
- 2.3 在 Linux 上安裝 Go
- 2.4 在 Mac OS X 上安裝 Go
- 2.5 在 Windows 上安裝 Go
- 2.6 安裝目錄清單
- 2.7 Go 運行時(runtime)
- 2.8 Go 解釋器
- 第3章:編輯器、集成開發環境與其它工具
- 3.1 Go 開發環境的基本要求
- 3.2 編輯器和集成開發環境
- 3.3 調試器
- 3.4 構建并運行 Go 程序
- 3.5 格式化代碼
- 3.6 生成代碼文檔
- 3.7 其它工具
- 3.8 Go 性能說明
- 3.9 與其它語言進行交互
- 第二部分:語言的核心結構與技術
- 第4章:基本結構和基本數據類型
- 4.1 文件名、關鍵字與標識符
- 4.2 Go 程序的基本結構和要素
- 4.3 常量
- 4.4 變量
- 4.5 基本類型和運算符
- 4.6 字符串
- 4.7 strings 和 strconv 包
- 4.8 時間和日期
- 4.9 指針
- 第5章:控制結構
- 5.1 if-else 結構
- 5.2 測試多返回值函數的錯誤
- 5.3 switch 結構
- 5.4 for 結構
- 5.5 Break 與 continue
- 5.6 標簽與 goto
- 第6章:函數(function)
- 6.1 介紹
- 6.2 函數參數與返回值
- 6.3 傳遞變長參數
- 6.4 defer 和追蹤
- 6.5 內置函數
- 6.6 遞歸函數
- 6.7 將函數作為參數
- 6.8 閉包
- 6.9 應用閉包:將函數作為返回值
- 6.10 使用閉包調試
- 6.11 計算函數執行時間
- 6.12 通過內存緩存來提升性能
- 第7章:數組與切片
- 7.1 聲明和初始化
- 7.2 切片
- 7.3 For-range 結構
- 7.4 切片重組(reslice)
- 7.5 切片的復制與追加
- 7.6 字符串、數組和切片的應用
- 第8章:Map
- 8.1 聲明、初始化和 make
- 8.2 測試鍵值對是否存在及刪除元素
- 8.3 for-range 的配套用法
- 8.4 map 類型的切片
- 8.5 map 的排序
- 8.6 將 map 的鍵值對調
- 第9章:包(package)
- 9.1 標準庫概述
- 9.2 regexp 包
- 9.3 鎖和 sync 包
- 9.4 精密計算和 big 包
- 9.5 自定義包和可見性
- 9.6 為自定義包使用 godoc
- 9.7 使用 go install 安裝自定義包
- 9.8 自定義包的目錄結構、go install 和 go test
- 9.9 通過 Git 打包和安裝
- 9.10 Go 的外部包和項目
- 9.11 在 Go 程序中使用外部庫
- 第10章:結構(struct)與方法(method)
- 10.1 結構體定義
- 10.2 使用工廠方法創建結構體實例
- 10.3 使用自定義包中的結構體
- 10.4 帶標簽的結構體
- 10.5 匿名字段和內嵌結構體
- 10.6 方法
- 10.8 垃圾回收和 SetFinalizer
- 第11章:接口(interface)與反射(reflection)
- 11.1 接口是什么
- 11.2 接口嵌套接口
- 11.3 類型斷言:如何檢測和轉換接口變量的類型
- 11.4 類型判斷:type-switch
- 11.5 測試一個值是否實現了某個接口
- 11.6 使用方法集與接口
- 11.7 第一個例子:使用 Sorter 接口排序
- 11.8 第二個例子:讀和寫
- 11.9 空接口
- 11.10 反射包
- 第三部分:Go 高級編程
- 第12章 讀寫數據
- 12.1 讀取用戶的輸入
- 12.2 文件讀寫
- 12.3 文件拷貝
- 12.4 從命令行讀取參數
- 12.5 用buffer讀取文件
- 12.6 用切片讀寫文件
- 12.7 用 defer 關閉文件
- 12.8 使用接口的實際例子:fmt.Fprintf
- 12.9 Json 數據格式
- 12.10 XML 數據格式
- 12.11 用 Gob 傳輸數據
- 12.12 Go 中的密碼學
- 第13章 錯誤處理與測試
- 13.1 錯誤處理
- 13.2 運行時異常和 panic
- 13.3 從 panic 中恢復(Recover)
- 13.4 自定義包中的錯誤處理和 panicking
- 13.5 一種用閉包處理錯誤的模式
- 13.6 啟動外部命令和程序
- 13.7 Go 中的單元測試和基準測試
- 13.8 測試的具體例子
- 13.9 用(測試數據)表驅動測試
- 13.10 性能調試:分析并優化 Go 程序
- 第14章:協程(goroutine)與通道(channel)
- 14.1 并發、并行和協程
- 14.2 使用通道進行協程間通信
- 14.3 協程同步:關閉通道-對阻塞的通道進行測試
- 14.4 使用 select 切換協程
- 14.5 通道,超時和計時器(Ticker)
- 14.6 協程和恢復(recover)
- 第15章:網絡、模版與網頁應用
- 15.1 tcp服務器
- 15.2 一個簡單的web服務器
- 15.3 訪問并讀取頁面數據
- 15.4 寫一個簡單的網頁應用
- 第四部分:實際應用
- 第16章:常見的陷阱與錯誤
- 16.1 誤用短聲明導致變量覆蓋
- 16.2 誤用字符串
- 16.3 發生錯誤時使用defer關閉一個文件
- 16.5 不需要將一個指向切片的指針傳遞給函數
- 16.6 使用指針指向接口類型
- 16.7 使用值類型時誤用指針
- 16.8 誤用協程和通道
- 16.9 閉包和協程的使用
- 16.10 糟糕的錯誤處理
- 第17章:模式
- 17.1 關于逗號ok模式
- 第18章:出于性能考慮的實用代碼片段
- 18.1 字符串
- 18.2 數組和切片
- 18.3 映射
- 18.4 結構體
- 18.5 接口
- 18.6 函數
- 18.7 文件
- 18.8 協程(goroutine)與通道(channel)
- 18.9 網絡和網頁應用
- 18.10 其他
- 18.11 出于性能考慮的最佳實踐和建議
- 附錄