本章我們沒有對SystemServer做更進一步的分析,不過做為拓展內容,這里想介紹一下Watchdog。Watch Dog的中文意思是“看門狗”。我依稀記得,其最初存在的意義是因為早期嵌入式設備上的程序經常“跑飛”(比如說電磁干擾等),所以專門有個硬件看門狗,每隔一段時間,看門狗就去檢查一下某個參數是不是被設置了,如果發現該參數沒有被設置,則判斷為系統出錯,然后就會強制重啟。
軟件層面上Android對SystemServer對參數是否被設置也很謹慎,專門為它增加了一條看門狗,可它看的是哪個門呢?對了,就是看幾個重要Service的門,一旦發現Service出了問題,就會殺掉system_server,這樣就使zygote隨其一起自殺,最后導致重啟Java世界。
我們先把SystemServe使用Watchdog的調用流程總結一下,然后以這個為切入點來分析Watchdog。SS和Watchdog的交互流程可以總結為以下三個步驟:
- Watchdog. getInstance().init()
- Watchdog.getInstance().start()
- Watchdog. getInstance().addMonitor()
這三個步驟都非常簡單。先看第一步:
1. 創建和初始化Watchdog
getInstance用于創建Watchdog,一起來看看,代碼如下所示:
**Watchdog.java**
~~~
public static Watchdog getInstance() {
if(sWatchdog == null) {
sWatchdog= new Watchdog(); //使用了單例模式。
}
returnsWatchdog;
}
public class Watchdog extends Thread
//Watchdog從線程類派生,所以它會在單獨的一個線程中執行
private Watchdog() {
super("watchdog");
//構造一個Handler,Handler的詳細分析見第5章,讀者可以簡單地把它看做是消息處理的地方。
//它在handleMessage函數中處理消息
mHandler = new HeartbeatHandler();
//GlobalPssCollected和內存信息有關。
mGlobalPssCollected= new GlobalPssCollected();
}
~~~
這條看門狗誕生后,再來看看init函數,代碼如下所示:
**Watchdog.java**
~~~
public void init(Context context, BatteryServicebattery,
PowerManagerService power, AlarmManagerService alarm,
ActivityManagerService activity) {
mResolver = context.getContentResolver();
mBattery = battery;
mPower = power;
mAlarm = alarm;
mActivity = activity;
......
mBootTime = System.currentTimeMillis();//得到當前時間
......
}
~~~
至此,看門狗誕生的知識就介紹完了,下面我們就讓它動起來。
2. 看門狗跑起來
SystemServer調用Watchdog的start函數,這將導致Watchdog的run在另外一個線程中被執行。代碼如下所示:
**Watchdog.java**
~~~
public void run() {
booleanwaitedHalf = false;
while(true) {//外層while循環
mCompleted= false; //false表明各個服務的檢查還沒完成。
/*
mHandler的消息處理是在另外一個線程上,這里將給那個線程的消息隊列發條消息
請求Watchdog檢查Service是否工作正常。
*/
mHandler.sendEmptyMessage(MONITOR);
synchronized (this) {
long timeout = TIME_TO_WAIT;
long start = SystemClock.uptimeMillis();
//注意這個小while循環的條件,mForceKillSystem為true也會導致退出循環
while (timeout > 0 && !mForceKillSystem) {
try {
wait(timeout); //等待檢查的結果
} catch(InterruptedException e) {
}
timeout = TIME_TO_WAIT -(SystemClock.uptimeMillis() - start);
}
//mCompleted為true,表示service一切正常
if (mCompleted &&!mForceKillSystem) {
waitedHalf = false;
continue;
}
//如果mCompleted不為true,看門狗會比較盡責,再檢查一次
if (!waitedHalf) {
......
waitedHalf = true;
continue;//再檢查一次
}
}
//已經檢查過兩次了,還是有問題,這回是真有問題了。所以SS需要把自己干掉。
if (!Debug.isDebuggerConnected()) {
Process.killProcess(Process.myPid());
System.exit(10); //干掉自己
}
......
waitedHalf = false;
}
}
~~~
OK,這個run函數還是比較簡單的,就是:
· 隔一段時間給另外一個線程發送一條MONITOR消息,那個線程將檢查各個Service的健康情況。而看門狗會等待檢查結果,如果第二次還沒有返回結果,那么它會殺掉SS。
好吧,來看看檢查線程究竟是怎么檢查Service的。
3. 列隊檢查
這么多Service,哪些是看門狗比較關注的呢?一共有三個Service是需要交給Watchdog檢查的:
- ActivityManagerService
- PowerManagerService
- WindowManagerService
要想支持看門狗的檢查,就需要這些Service實現monitor接口,然后Watchdog就會調用它們的monitor函數進行檢查了。檢查的地方是在HeartbeatHandler類的handleMessage中,代碼如下所示:
**Watchdog.java::HeartbeatHandler**
~~~
final class HeartbeatHandler extends Handler {
@Override
public void handleMessage(Message msg) {
switch (msg.what) {
......
case MONITOR: {
......
long now =SystemClock.uptimeMillis();
final int size =mMonitors.size();
//檢查各個服務,并設置當前檢查的對象為mCurrentMonitor
for (int i = 0 ; i <size ; i++) {
mCurrentMonitor =mMonitors.get(i);
mCurrentMonitor.monitor();//檢查這個對象
}
//如果沒問題,則設置mCompleted為真。
synchronized (Watchdog.this){
mCompleted = true;
mCurrentMonitor = null;
}
} break;
}
}
}
~~~
那么,Service的健康是怎么判斷的呢?我們以PowerManagerService為例,先看看它是怎么把自己交給看門狗檢查的。
**PowerManagerService.java**
~~~
PowerManagerService()
{
......
//在構造函數中把自己加入Watchdog的檢查隊列
Watchdog.getInstance().addMonitor(this);
}
~~~
而Watchdog調用各個monitor函數到底檢查了些什么呢?再看看它實現的monitor函數吧。
**PowerManagerService.java**
~~~
public void monitor() {
//monitor原來檢查的就是這些Service是不是發生死鎖了!
synchronized (mLocks) { }
}
~~~
原來,Watchdog最怕系統服務死鎖了,對于這種情況也只能采取殺系統的辦法了。
>[info]**說明**:這種情況,我只碰到過一次,原因是有一個函數占著鎖,但長時間沒有返回。沒返回的原因是這個函數需要和硬件交互,而硬件又沒有及時返回。
關于Watchdog,我們就介紹到這里。另外,它還能檢查內存的使用情況,這一部分內容讀者可以自行研究。
- 前言
- 第1章 閱讀前的準備工作
- 1.1 系統架構
- 1.1.1 Android系統架構
- 1.1.2 本書的架構
- 1.2 搭建開發環境
- 1.2.1 下載源碼
- 1.2.2 編譯源碼
- 1.3 工具介紹
- 1.3.1 Source Insight介紹
- 1.3.2 Busybox的使用
- 1.4 本章小結
- 第2章 深入理解JNI
- 2.1 JNI概述
- 2.2 學習JNI的實例:MediaScanner
- 2.3 Java層的MediaScanner分析
- 2.3.1 加載JNI庫
- 2.3.2 Java的native函數和總結
- 2.4 JNI層MediaScanner的分析
- 2.4.1 注冊JNI函數
- 2.4.2 數據類型轉換
- 2.4.3 JNIEnv介紹
- 2.4.4 通過JNIEnv操作jobject
- 2.4.5 jstring介紹
- 2.4.6 JNI類型簽名介紹
- 2.4.7 垃圾回收
- 2.4.8 JNI中的異常處理
- 2.5 本章小結
- 第3章 深入理解init
- 3.1 概述
- 3.2 init分析
- 3.2.1 解析配置文件
- 3.2.2 解析service
- 3.2.3 init控制service
- 3.2.4 屬性服務
- 3.3 本章小結
- 第4章 深入理解zygote
- 4.1 概述
- 4.2 zygote分析
- 4.2.1 AppRuntime分析
- 4.2.2 Welcome to Java World
- 4.2.3 關于zygote的總結
- 4.3 SystemServer分析
- 4.3.1 SystemServer的誕生
- 4.3.2 SystemServer的重要使命
- 4.3.3 關于 SystemServer的總結
- 4.4 zygote的分裂
- 4.4.1 ActivityManagerService發送請求
- 4.4.2 有求必應之響應請求
- 4.4.3 關于zygote分裂的總結
- 4.5 拓展思考
- 4.5.1 虛擬機heapsize的限制
- 4.5.2 開機速度優化
- 4.5.3 Watchdog分析
- 4.6 本章小結
- 第5章 深入理解常見類
- 5.1 概述
- 5.2 以“三板斧”揭秘RefBase、sp和wp
- 5.2.1 第一板斧--初識影子對象
- 5.2.2 第二板斧--由弱生強
- 5.2.3 第三板斧--破解生死魔咒
- 5.2.4 輕量級的引用計數控制類LightRefBase
- 5.2.5 題外話-三板斧的來歷
- 5.3 Thread類及常用同步類分析
- 5.3.1 一個變量引發的思考
- 5.3.2 常用同步類
- 5.4 Looper和Handler類分析
- 5.4.1 Looper類分析
- 5.4.2 Handler分析
- 5.4.3 Looper和Handler的同步關系
- 5.4.4 HandlerThread介紹
- 5.5 本章小結
- 第6章 深入理解Binder
- 6.1 概述
- 6.2 庖丁解MediaServer
- 6.2.1 MediaServer的入口函數
- 6.2.2 獨一無二的ProcessState
- 6.2.3 時空穿越魔術-defaultServiceManager
- 6.2.4 注冊MediaPlayerService
- 6.2.5 秋風掃落葉-StartThread Pool和join Thread Pool分析
- 6.2.6 你徹底明白了嗎
- 6.3 服務總管ServiceManager
- 6.3.1 ServiceManager的原理
- 6.3.2 服務的注冊
- 6.3.3 ServiceManager存在的意義
- 6.4 MediaPlayerService和它的Client
- 6.4.1 查詢ServiceManager
- 6.4.2 子承父業
- 6.5 拓展思考
- 6.5.1 Binder和線程的關系
- 6.5.2 有人情味的訃告
- 6.5.3 匿名Service
- 6.6 學以致用
- 6.6.1 純Native的Service
- 6.6.2 扶得起的“阿斗”(aidl)
- 6.7 本章小結
- 第7章 深入理解Audio系統
- 7.1 概述
- 7.2 AudioTrack的破解
- 7.2.1 用例介紹
- 7.2.2 AudioTrack(Java空間)分析
- 7.2.3 AudioTrack(Native空間)分析
- 7.2.4 關于AudioTrack的總結
- 7.3 AudioFlinger的破解
- 7.3.1 AudioFlinger的誕生
- 7.3.2 通過流程分析AudioFlinger
- 7.3.3 audio_track_cblk_t分析
- 7.3.4 關于AudioFlinger的總結
- 7.4 AudioPolicyService的破解
- 7.4.1 AudioPolicyService的創建
- 7.4.2 重回AudioTrack
- 7.4.3 聲音路由切換實例分析
- 7.4.4 關于AudioPolicy的總結
- 7.5 拓展思考
- 7.5.1 DuplicatingThread破解
- 7.5.2 題外話
- 7.6 本章小結
- 第8章 深入理解Surface系統
- 8.1 概述
- 8.2 一個Activity的顯示
- 8.2.1 Activity的創建
- 8.2.2 Activity的UI繪制
- 8.2.3 關于Activity的總結
- 8.3 初識Surface
- 8.3.1 和Surface有關的流程總結
- 8.3.2 Surface之乾坤大挪移
- 8.3.3 乾坤大挪移的JNI層分析
- 8.3.4 Surface和畫圖
- 8.3.5 初識Surface小結
- 8.4 深入分析Surface
- 8.4.1 與Surface相關的基礎知識介紹
- 8.4.2 SurfaceComposerClient分析
- 8.4.3 SurfaceControl分析
- 8.4.4 writeToParcel和Surface對象的創建
- 8.4.5 lockCanvas和unlockCanvasAndPost分析
- 8.4.6 GraphicBuffer介紹
- 8.4.7 深入分析Surface的總結
- 8.5 SurfaceFlinger分析
- 8.5.1 SurfaceFlinger的誕生
- 8.5.2 SF工作線程分析
- 8.5.3 Transaction分析
- 8.5.4 關于SurfaceFlinger的總結
- 8.6 拓展思考
- 8.6.1 Surface系統的CB對象分析
- 8.6.2 ViewRoot的你問我答
- 8.6.3 LayerBuffer分析
- 8.7 本章小結
- 第9章 深入理解Vold和Rild
- 9.1 概述
- 9.2 Vold的原理與機制分析
- 9.2.1 Netlink和Uevent介紹
- 9.2.2 初識Vold
- 9.2.3 NetlinkManager模塊分析
- 9.2.4 VolumeManager模塊分析
- 9.2.5 CommandListener模塊分析
- 9.2.6 Vold實例分析
- 9.2.7 關于Vold的總結
- 9.3 Rild的原理與機制分析
- 9.3.1 初識Rild
- 9.3.2 RIL_startEventLoop分析
- 9.3.3 RIL_Init分析
- 9.3.4 RIL_register分析
- 9.3.5 關于Rild main函數的總結
- 9.3.6 Rild實例分析
- 9.3.7 關于Rild的總結
- 9.4 拓展思考
- 9.4.1 嵌入式系統的存儲知識介紹
- 9.4.2 Rild和Phone的改進探討
- 9.5 本章小結
- 第10章 深入理解MediaScanner
- 10.1 概述
- 10.2 android.process.media分析
- 10.2.1 MSR模塊分析
- 10.2.2 MSS模塊分析
- 10.2.3 android.process.media媒體掃描工作的流程總結
- 10.3 MediaScanner分析
- 10.3.1 Java層分析
- 10.3.2 JNI層分析
- 10.3.3 PVMediaScanner分析
- 10.3.4 關于MediaScanner的總結
- 10.4 拓展思考
- 10.4.1 MediaScannerConnection介紹
- 10.4.2 我問你答
- 10.5 本章小結