附錄A OQL分析JVM內存（免費) · Java性能優化實戰

# 使用OQL分析虛擬機內存本章作為書第一章的補充，較為詳細說明了如何進行內存分析以解決因為內存使用過多導致的性能降低以及內存溢出現象。有些非內存故障問題，頁可以通過OQL來分析對象在內存中使用情況，查看對象運行時刻的屬性值。 ## 獲取內存鏡像文件當應用系統性能不佳的時候，我們在第一章介通過 jvisualvm的抽樣器定位性能瓶頸外，系統性能不佳還可能是虛擬機頻繁的全局垃圾回收導致。導入本節附帶工程OQL后，可以直接運行OutMemoryCase1方法，該方法會不斷的向Map里添加User實例，直到內存用滿為止 ~~~java public class OutMemoryCase1 { static Map<Long,User> map = new HashMap<>(); static long idBase = 0; static Config config = new Config(); static public void test() { config.setMax(1000); config.setSleep(100); for(int i=0;i<config.getMax();i++){ User user = new User(); user.setId((long)idBase); user.setName("user"+idBase); user.setDepartId((long)idBase); map.put(user.getId(),user); idBase++; } } public static void main(String[] ags) throws InterruptedException { while(true){ test(); Thread.sleep(config.getSleep()); System.out.println(config.getMessage()+idBase); } } } ~~~ test方法會循環運行1萬次，像類變量map添加User實例，main方法則不斷循環運行test，每循環一次，會打印idBase變量。 User對象是一個POJO，包含了id，departId，和name屬性，定義如下 ~~~java public class User { private Long id ; private Long departId ; private String name; //忽略getter和setter } ~~~ Config對象如下定義，包含了循環，休眠等配置信息 ~~~java public class Config { private int max =100; private int sleep = 10; private String message = ">"; //忽略getter和setter } ~~~ 運行OutMemoryCase1方法后，我們可以使用jdk命令jps 獲取進程編號 ~~~ >jps -ml 914 com.ibeetl.code.OutMemoryCase1 957 sun.tools.jps.Jps -ml ~~~ 然后我們使用jdk的jstat命令觀察內存使用情況 ~~~ jstat -gcutil -h 20 914 2000 0 ~~~ - -gcutil 表示輸出內存使用匯總信息。 - -h 表示沒輸出20行，再打印一次表頭 - 914是我們需要監控的虛擬機進程ID，使用需要用實際進程id代替 - 2000表示每2000毫秒輸出一行信息 - 最后一個參數 0 表示一直輸出，如果填寫其他數字n，則最多輸出n行 ![jstat](https://img.kancloud.cn/f7/bc/f7bc7cd3bd3fd659bd07d5f97d1485a4_1892x576.png) 上圖顯示了虛擬機各個代的使用情況,描述了堆內存的各個占比和垃圾回收次數以及占用時間 * S0,第一個幸存區使用比率 * S1，第二個幸存區的使用率 * E，伊甸園區的使用比率 * O 老年代 * M 方法區，元空間使用率 * CCS,壓縮使用比率 * YGC 年輕代垃圾回收次數 * YGCT 年紀帶垃圾回收占用時間 * FGC 全局垃圾回收次數，這對性能影響至關重要 * FGCT 全局垃圾回收的消耗時間 * GCT 總得垃圾回收時間關于虛擬機的內部結構和垃圾回收機制，超出了本書的范疇，這里做一些簡要描述，我們只需要關注一些異常情況。 Java虛擬機中，對象的生命周期有長有短，大部分對象的生命周期很短，只有少部分的對象才會在內存中存留較長時間，因此可以依據對象生命周期的長短將它們放在不同的區域。在采用分代收集算法的Java虛擬機堆中，一般分為三個區域，用來分別儲存這三類對象：新生代 - 剛創建的對象，在代碼運行時一般都會持續不斷地創建新的對象，這些新創建的對象有很多是局部變量，很快就會變成垃圾對象。這些對象被放在一塊稱為新生代的內存區域。新生代的特點是垃圾對象多，存活對象少。在新生代區域中，按照8:1:1的比例分為了Eden、SurvivorA、SurvivorB三個區域。其中Eden意為伊甸園，形容有很多新生對象在里面創建；Survivor區則為幸存者，即經歷GC后仍然存活下來的對象。 Eden區對外提供堆內存。當Eden區快要滿了，則進行Minor GC(新生代GC)，把存活對象放入SurvivorA區，清空Eden區； Eden區被清空后，繼續對外提供堆內存；當Eden區再次被填滿，此時對Eden區和SurvivorA區同時進行Minor GC(新生代GC)，把存活對象放入SurvivorB區，此時同時清空Eden區和SurvivorA區； Eden區繼續對外提供堆內存，并重復上述過程，即在 Eden 區填滿后，把Eden區和某個Survivor區的存活對象放到另一個Survivor區；當某個Survivor區被填滿，且仍有對象未被復制完畢時，或者某些對象在反復Survive 15次左右時，則把這部分剩余對象放到老年代區域；當老年區也被填滿時，進行Major GC（老年代GC），對老年代區域進行垃圾回收。老年代 - 一些對象很早被創建了，經歷了多次GC也沒有被回收，而是一直存活下來。這些對象被放在一塊稱為老年代的區域。老年代的特點是存活對象多，垃圾對象少。永久代 - 一些伴隨虛擬機生命周期永久存在的對象，比如一些靜態對象，常量等。這些對象被放在一塊稱為永久代的區域。永久代的特點是這些對象一般不需要垃圾回收，會在虛擬機運行過程中一直存活。（在Java1.7之前，方法區中存儲的是永久代對象，Java1.7方法區的永久代對象移到了堆中，而在Java1.8永久代已經從堆中移除了，這塊內存給了元空間。從jstat的輸出可以看到，老年代已經使用了99.9%，FGC一直在不停的增長，說明內存幾乎已經占滿，正常情況應該很難觀察到一次FGC發生。從控制臺的打印輸出來看 ~~~ ....... 9320000 9330000 9340000 ~~~ 系統輸出已經停滯在9340000值（在此是作者本人機器上運行結果，實際結果不一定是這個值），這代表此時系統執行已經非常緩慢了，這就是因為虛擬機頻繁的全局垃圾回收導致的。如果你不了解oql工程，沒有看過代碼OutMemoryCase1 如何診斷此時系統是哪一處代碼出問題了呢，思路實獲取內存的dump文件，然后通過OQL，一種類似SQL的分析語句分析內存dump文件，定位問題代碼。有多種方式獲取到內存dump文件：通過jmap?命令主動獲取到 ~~~ jmap -dump:format=b,file=filename.hprof pid ~~~ 實際系統會有2G到8G內存，此命令會導致虛擬機暫停1-3秒時間，并生成指定filename的dump文件還有一種是被動獲取方式，當虛擬機出現內存溢出的時候，會主動dump內存文件。添加虛擬機啟動參數 ~~~ -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/tmp/heapdump.hprof ~~~ 會有如下輸出 ~~~ >9454000 >9455000 java.lang.OutOfMemoryError: Java heap space Dumping heap to heapdump.hprof ... ~~~ 通過打開jvisualvm也可以獲取到堆dump文件，在左側進程列表里找到該進程，右鍵，點擊選項“堆 dump”，保存內存鏡像文件無論那種方式，我們都會獲取到內存dump文件，我們下一節，將使用jvisualvm分析，主要使用OQL功能分析內存使用情況，定位系統問題 ## OQL 查詢語言打開jvisualvm工具，選擇菜單File，點擊裝入，選擇我們保存過的dump文件，這時候jvisualvm面板會打開內存鏡像文件。打開較大的內存鏡像文件需要較長的時間，需要耐心等候 ![memory-summary](https://img.kancloud.cn/d0/b9/d0b90737c55d7d896cf7b57a13053742_1926x1212.png) 有一個“類按鈕”可以進入類實例使用匯總頁面，一個OQL控制臺會進入OQL功能，我們點擊OQL直接進入OQL控制臺 ![memory-oql](https://img.kancloud.cn/65/8c/658cbafc2d09d54dd0bf425e3eb0b73c_2106x1236.png) 如面板所示，左下角的查詢編輯器可以輸入OQL語句，從內存中查詢，我們輸入 ~~~ select x from java.util.HashMap x where x.size>1000 ~~~ 這個OQL語句查詢出所有HashMap實例，且其屬性size大于1000的，查詢結果顯示在面板上方。可以點擊每個實例進入詳情面板，如下圖 ![memory-oql-detail](https://img.kancloud.cn/8a/d3/8ad3865dda33613d0dff8de34a55b6e5_1784x1206.png) 右上面板是字段面板，包含了選中實例的的所有屬性，可以看到，size屬性為2百萬，是個非常大的數，這代表此時HashMap包含了2百萬個對象，如果熟悉HashMap代碼，我們知道table屬性保存了所有的元素，我們可以點擊table屬性,向下鉆取，可以看到存放的正是User對象。右下面板是引用面板，根節點為this，表示了我們查詢出來的這個HashMap實例，該面板節點每個子節點表示了所屬關系，我們可以看到這個HashMap實例的名字是map，屬于OutMemoryCase1類。截至到目前為止，我們已經使用一條OQL語句找到了內存的溢出的原因，且定位到代碼位置為OutMemoryCase1。我們下面學習更多的OQL語法，這有助于幫助我們分析內存 OQL語法類似SQL和Javascript結合體，javascript用于表達式和方法調用，格式如下 ~~~ select <JavaScript expression to select> [ from [instanceof] <class name> <identifier> [ where <JavaScript boolean expression to filter> ] ] ~~~ * class name是java類的完全限定名，如：java.lang.String, java.util.ArrayList, [C是char數組, [Ljava.io.File是java.io.File[]，依此類推，insatnceof 關鍵字用上，表示將查詢其子類 * from和where子句都是可選的 * 可以使用identifier.fieldName語法訪問Java字段，并且可以使用array [index]語法形式訪問數組元素。 * OQL使用的是JS表達式，因此使用&&和||，不要使用and or 比如查找超長的字符串，這里的10000是一個任意指定的值，如下OQL語句查找字符串長度超過1萬的。 ~~~java select s from java.lang.String s where s.value.length >= 10000 ~~~ 這里s表示String,查看java.lang.String有個名字為value的char[] 類型的數組，因此filter是s.value.length >= 10000 針對OutMemoryCase1，比如我們要查找user對象中departId為15的User對象，并輸出其name屬性 ~~~java select u.name from com.ibeetl.code.User u where u.departId.value==15 ~~~ 需要注意的事，User對象的departId類型Long，并非原始類型，因此需要使用Long對象的value屬性來比較。另外在OQL里任意實例的都有屬性id，是在OQL分配的對象唯一標識，因此，如下OQL語句在jvisualvm執行得不到期望的結果 ~~~ //錯誤的OQL語句,id屬性是內存分配的唯一id，并非用戶的id屬性 select u.name from com.ibeetl.code.User u where u.id.value==15 ~~~ 如下查詢包含key為"abc"的Map,value為"edf"，注意需要使用toString才能比較字符串 ```sql select m from java.util.Map$Entry m where m.key.toString()='abc'&&m.value.toString()='edf' ``` 通過size函數獲取實例本身占用的空間，rsize函數獲取實例占用的shallow空間，實際使用空間 ~~~ select sizeof(x) from java.util.HashMap x where x.size>1000 select rsizeof(x) from java.util.HashMap x where x.size>1000 ~~~ rsizeof 會計算對象下每一個對象占用空間，因此執行該語句需要較長時間，sizeof僅僅計算此對象屬性占用空間。查詢出來的對象可以通過objectid函數得到一個16進制編號，可以記住這個唯一編號，在用函數heap.findObject直接定位到該實例 ~~~sql select objectid(x) from com.ibeetl.code.Config //查詢返回"31150212072",可以記住下次再分析的時候直接查詢該Config對象 select heap.findObject(31150212072) ~~~ OQL提供了一系列的heap方法,用于查找實例,由于附錄并非專門講解OQL，因此列出重要的方法并還是以OutMemoryCase1為例子，說明如何使用 * heap.forEachClass - 為每個Java類調用一個回調函數 ~~~ heap.forEachClass(callback); ~~~ * heap.forEachObject - 為每個Java對象調用回調函數 ~~~ heap.forEachObject(callback, clazz, includeSubtypes); ~~~ 如果clazz未指定，則是默認的java.lang.Object，includeSubtypes表示查找子類，如果未指定，默認是true,callback是一個類似JS的回掉函數. * heap.findClass - 查找給定名稱的Java類 * heap.findObject 根據對象標識查詢對象 * heap.objects 返回Java對象的枚舉 ~~~ heap.objects(clazz, [includeSubtypes], [filter]) ~~~ 比如，我們需要查找某個User對象，其name屬性的值是“user1“結尾,我們可以使用js正則表達式查詢 ~~~ heap.objects("com.ibeetl.code.User", false, "/user1$/.test(it.name)") //或者 heap.objects ("com.ibeetl.code.User",false,"it.name.toString()=='user1'") ~~~ * heap.livepaths 返回給定對象存活的路徑數組。此方法接受可選的第二個參數，它是一個布爾標志。此標志指示是否包含弱引用的路徑。默認情況下，不包括具有弱引用的路徑。 ~~~ select heap.livepaths(config) from com.ibeetl.code.Config config ~~~ 會有如下輸出，我們可以看到Config對象被OutMemoryCase1引用 ~~~ com.ibeetl.code.Config#1->com.ibeetl.code.OutMemoryCase1->sun.launcher.LauncherHelper ~~~ OQL提供了一些對集合操作的方法，允許查詢出來的結果集，進行過濾和加工，一些常用的函數如下 * filter filter函數返回一個數組/枚舉，其中包含滿足給定布爾表達式的輸入數組/枚舉的元素。布爾表達式代碼可以引用以下內置變量。it - >目前訪問過的元,index - >當前元素的索,array - >正在迭代的數組/枚舉,result - > result array / enumeration 如查詢User對象，name屬性為“user1” ~~~ select filter(heap.objects ("com.ibeetl.code.User"), "it.name.toString()=='user1'") ~~~ 或者使用回調函數 ~~~javascript select filter(heap.objects ("com.ibeetl.code.User"), function(it){ if(it.name.toString()=='user1'){ return true; }else{ return false; } }) ~~~ * map 通過評估每個元素上的給定代碼來轉換給定的數組/枚舉。評估的代碼可以引用以下內置變量。it - >目前訪問過的元,index - >當前元素的索,array - >正在迭代的數組/枚舉,result - > result array / enumeration map函數返回通過在輸入數組/枚舉的每個元素上重復調用代碼而創建的值的數組/枚舉。 ~~~javascript select map(heap.objects('com.ibeetl.code.User'), function (it) { var res = objectid(it); res+=">"+toHtml(it); return res ; }) ~~~ 此例子通過heap.objects查詢所有的User實例，返回數組，并傳入map方法，map將每個User實例轉化為一個字符串，包含了User實例的唯一編號，toHtml方法是OQL自帶的一個方法，接受一個對象實例，輸出帶有類名和順序號的字符串。運行語句，有如下輸出 ~~~ 31138521288>com.ibeetl.code.User#1 31138521456>com.ibeetl.code.User#2 31138521624>com.ibeetl.code.User#3 ........ ~~~ * max函數,返回給定數組/枚舉的最大元素。接受表達式以比較數組的元素。默認情況下使用數字比較。比較表達式可以使用以下內置變量：lhs - >左側元素進行比較,rhs - >右側元素進行比較如查詢容量最大的Map，這有可能是內存溢出發生的地方。 ~~~ select max(map(heap.objects('java.util.HashMap'), 'it.size')) // 或者 select max(heap.objects('java.util.HashMap'), 'lhs.size> rhs.size') ~~~ * min函數，同max，返回給定數組/枚舉的最小元素 * sort函數，給出數組/枚舉的排序。（可選）接受代碼表達式以比較數組的元素。默認情況下使用數字比較。比較表達式可以使用以下內置變量：lhs 代表左側元素，rhs - >代表右側元素 ~~~ select sort(heap.objects('[C'), 'sizeof(lhs) - sizeof(rhs)') ~~~ 查詢所有字符串數組，并按照大小升序排序。附錄A介紹了JDK自帶的OQL，許多商業的內存分析器提供了更多的內置的分析功能以及OQL功能擴展，如果有條件，建議使用這些商業內存分析器和參考他們的OQL使用文檔介紹。在我的內存故障解決里，基本上使用自帶的OQL就能找到問題所在了，需要耐心的分析和查找問題。