## 1.3 FPM
### 1.3.1 概述
FPM(FastCGI Process Manager)是PHP FastCGI運行模式的一個進程管理器,從它的定義可以看出,FPM的核心功能是進程管理,那么它用來管理什么進程呢?這個問題就需要從FastCGI說起了。
FastCGI是Web服務器(如:Nginx、Apache)和處理程序之間的一種通信協議,它是與Http類似的一種應用層通信協議,注意:它只是一種協議!
前面曾一再強調,PHP只是一個腳本解析器,你可以把它理解為一個普通的函數,輸入是PHP腳本。輸出是執行結果,假如我們想用PHP代替shell,在命令行中執行一個文件,那么就可以寫一個程序來嵌入PHP解析器,這就是cli模式,這種模式下PHP就是普通的一個命令工具。接著我們又想:能不能讓PHP處理http請求呢?這時就涉及到了網絡處理,PHP需要接收請求、解析協議,然后處理完成返回請求。在網絡應用場景下,PHP并沒有像Golang那樣實現http網絡庫,而是實現了FastCGI協議,然后與web服務器配合實現了http的處理,web服務器來處理http請求,然后將解析的結果再通過FastCGI協議轉發給處理程序,處理程序處理完成后將結果返回給web服務器,web服務器再返回給用戶,如下圖所示。

PHP實現了FastCGI協議的解析,但是并沒有具體實現網絡處理,一般的處理模型:多進程、多線程,多進程模型通常是主進程只負責管理子進程,而基本的網絡事件由各個子進程處理,nginx、fpm就是這種模式;另一種多線程模型與多進程類似,只是它是線程粒度,通常會由主線程監聽、接收請求,然后交由子線程處理,memcached就是這種模式,有的也是采用多進程那種模式:主線程只負責管理子線程不處理網絡事件,各個子線程監聽、接收、處理請求,memcached使用udp協議時采用的是這種模式。
### 1.3.2 基本實現
概括來說,fpm的實現就是創建一個master進程,在master進程中創建并監聽socket,然后fork出多個子進程,這些子進程各自accept請求,子進程的處理非常簡單,它在啟動后阻塞在accept上,有請求到達后開始讀取請求數據,讀取完成后開始處理然后再返回,在這期間是不會接收其它請求的,也就是說fpm的子進程同時只能響應一個請求,只有把這個請求處理完成后才會accept下一個請求,這一點與nginx的事件驅動有很大的區別,nginx的子進程通過epoll管理套接字,如果一個請求數據還未發送完成則會處理下一個請求,即一個進程會同時連接多個請求,它是非阻塞的模型,只處理活躍的套接字。
fpm的master進程與worker進程之間不會直接進行通信,master通過共享內存獲取worker進程的信息,比如worker進程當前狀態、已處理請求數等,當master進程要殺掉一個worker進程時則通過發送信號的方式通知worker進程。
fpm可以同時監聽多個端口,每個端口對應一個worker pool,而每個pool下對應多個worker進程,類似nginx中server概念。

在php-fpm.conf中通過`[pool name]`聲明一個worker pool:
```
[web1]
listen = 127.0.0.1:9000
...
[web2]
listen = 127.0.0.1:9001
...
```
啟動fpm后查看進程:ps -aux|grep fpm
```c
root 27155 0.0 0.1 144704 2720 ? Ss 15:16 0:00 php-fpm: master process (/usr/local/php7/etc/php-fpm.conf)
nobody 27156 0.0 0.1 144676 2416 ? S 15:16 0:00 php-fpm: pool web1
nobody 27157 0.0 0.1 144676 2416 ? S 15:16 0:00 php-fpm: pool web1
nobody 27159 0.0 0.1 144680 2376 ? S 15:16 0:00 php-fpm: pool web2
nobody 27160 0.0 0.1 144680 2376 ? S 15:16 0:00 php-fpm: pool web2
```
具體實現上worker pool通過`fpm_worker_pool_s`這個結構表示,多個worker pool組成一個單鏈表:
```c
struct fpm_worker_pool_s {
struct fpm_worker_pool_s *next; //指向下一個worker pool
struct fpm_worker_pool_config_s *config; //conf配置:pm、max_children、start_servers...
int listening_socket; //監聽的套接字
...
//以下這個值用于master定時檢查、記錄worker數
struct fpm_child_s *children; //當前pool的worker鏈表
int running_children; //當前pool的worker運行總數
int idle_spawn_rate;
int warn_max_children;
struct fpm_scoreboard_s *scoreboard; //記錄worker的運行信息,比如空閑、忙碌worker數
...
}
```
### 1.3.3 FPM的初始化
接下來看下fpm的啟動流程,從`main()`函數開始:
```c
//sapi/fpm/fpm/fpm_main.c
int main(int argc, char *argv[])
{
...
//注冊SAPI:將全局變量sapi_module設置為cgi_sapi_module
sapi_startup(&cgi_sapi_module);
...
//執行php_module_starup()
if (cgi_sapi_module.startup(&cgi_sapi_module) == FAILURE) {
return FPM_EXIT_SOFTWARE;
}
...
//初始化
if(0 > fpm_init(...)){
...
}
...
fpm_is_running = 1;
fcgi_fd = fpm_run(&max_requests);//后面都是worker進程的操作,master進程不會走到下面
parent = 0;
...
}
```
`fpm_init()`主要有以下幾個關鍵操作:
__(1)fpm_conf_init_main():__
解析php-fpm.conf配置文件,分配worker pool內存結構并保存到全局變量中:fpm_worker_all_pools,各worker pool配置解析到`fpm_worker_pool_s->config`中。
__(2)fpm_scoreboard_init_main():__ 分配用于記錄worker進程運行信息的共享內存,按照worker pool的最大worker進程數分配,每個worker pool分配一個`fpm_scoreboard_s`結構,pool下對應的每個worker進程分配一個`fpm_scoreboard_proc_s`結構,各結構的對應關系如下圖。

__(3)fpm_signals_init_main():__
```c
static int sp[2];
int fpm_signals_init_main()
{
struct sigaction act;
//創建一個全雙工管道
if (0 > socketpair(AF_UNIX, SOCK_STREAM, 0, sp)) {
return -1;
}
//注冊信號處理handler
act.sa_handler = sig_handler;
sigfillset(&act.sa_mask);
if (0 > sigaction(SIGTERM, &act, 0) ||
0 > sigaction(SIGINT, &act, 0) ||
0 > sigaction(SIGUSR1, &act, 0) ||
0 > sigaction(SIGUSR2, &act, 0) ||
0 > sigaction(SIGCHLD, &act, 0) ||
0 > sigaction(SIGQUIT, &act, 0)) {
return -1;
}
return 0;
}
```
這里會通過`socketpair()`創建一個管道,這個管道并不是用于master與worker進程通信的,它只在master進程中使用,具體用途在稍后介紹event事件處理時再作說明。另外設置master的信號處理handler,當master收到SIGTERM、SIGINT、SIGUSR1、SIGUSR2、SIGCHLD、SIGQUIT這些信號時將調用`sig_handler()`處理:
```c
static void sig_handler(int signo)
{
static const char sig_chars[NSIG + 1] = {
[SIGTERM] = 'T',
[SIGINT] = 'I',
[SIGUSR1] = '1',
[SIGUSR2] = '2',
[SIGQUIT] = 'Q',
[SIGCHLD] = 'C'
};
char s;
...
s = sig_chars[signo];
//將信號通知寫入管道sp[1]端
write(sp[1], &s, sizeof(s));
...
}
```
__(4)fpm_sockets_init_main()__
創建每個worker pool的socket套接字。
__(5)fpm_event_init_main():__
啟動master的事件管理,fpm實現了一個事件管理器用于管理IO、定時事件,其中IO事件通過kqueue、epoll、poll、select等管理,定時事件就是定時器,一定時間后觸發某個事件。
在`fpm_init()`初始化完成后接下來就是最關鍵的`fpm_run()`操作了,此環節將fork子進程,啟動進程管理器,另外master進程將不會再返回,只有各worker進程會返回,也就是說`fpm_run()`之后的操作均是worker進程的。
```c
int fpm_run(int *max_requests)
{
struct fpm_worker_pool_s *wp;
for (wp = fpm_worker_all_pools; wp; wp = wp->next) {
//調用fpm_children_make() fork子進程
is_parent = fpm_children_create_initial(wp);
if (!is_parent) {
goto run_child;
}
}
//master進程將進入event循環,不再往下走
fpm_event_loop(0);
run_child: //只有worker進程會到這里
*max_requests = fpm_globals.max_requests;
return fpm_globals.listening_socket; //返回監聽的套接字
}
```
在fork后worker進程返回了監聽的套接字繼續main()后面的處理,而master將永遠阻塞在`fpm_event_loop()`,接下來分別介紹master、worker進程的后續操作。
### 1.3.4 請求處理
`fpm_run()`執行后將fork出worker進程,worker進程返回`main()`中繼續向下執行,后面的流程就是worker進程不斷accept請求,然后執行PHP腳本并返回。整體流程如下:
* __(1)等待請求:__ worker進程阻塞在fcgi_accept_request()等待請求;
* __(2)解析請求:__ fastcgi請求到達后被worker接收,然后開始接收并解析請求數據,直到request數據完全到達;
* __(3)請求初始化:__ 執行php_request_startup(),此階段會調用每個擴展的:PHP_RINIT_FUNCTION();
* __(4)編譯、執行:__ 由php_execute_script()完成PHP腳本的編譯、執行;
* __(5)關閉請求:__ 請求完成后執行php_request_shutdown(),此階段會調用每個擴展的:PHP_RSHUTDOWN_FUNCTION(),然后進入步驟(1)等待下一個請求。
```c
int main(int argc, char *argv[])
{
...
fcgi_fd = fpm_run(&max_requests);
parent = 0;
//初始化fastcgi請求
request = fpm_init_request(fcgi_fd);
//worker進程將阻塞在這,等待請求
while (EXPECTED(fcgi_accept_request(request) >= 0)) {
SG(server_context) = (void *) request;
init_request_info();
//請求開始
if (UNEXPECTED(php_request_startup() == FAILURE)) {
...
}
...
fpm_request_executing();
//編譯、執行PHP腳本
php_execute_script(&file_handle);
...
//請求結束
php_request_shutdown((void *) 0);
...
}
...
//worker進程退出
php_module_shutdown();
...
}
```
worker進程一次請求的處理被劃分為5個階段:
* __FPM_REQUEST_ACCEPTING:__ 等待請求階段
* __FPM_REQUEST_READING_HEADERS:__ 讀取fastcgi請求header階段
* __FPM_REQUEST_INFO:__ 獲取請求信息階段,此階段是將請求的method、query stirng、request uri等信息保存到各worker進程的fpm_scoreboard_proc_s結構中,此操作需要加鎖,因為master進程也會操作此結構
* __FPM_REQUEST_EXECUTING:__ 執行請求階段
* __FPM_REQUEST_END:__ 沒有使用
* __FPM_REQUEST_FINISHED:__ 請求處理完成
worker處理到各個階段時將會把當前階段更新到`fpm_scoreboard_proc_s->request_stage`,master進程正是通過這個標識判斷worker進程是否空閑的。
### 1.3.5 進程管理
這一節我們來看下master是如何管理worker進程的,首先介紹下三種不同的進程管理方式:
* __static:__ 這種方式比較簡單,在啟動時master按照`pm.max_children`配置fork出相應數量的worker進程,即worker進程數是固定不變的
* __dynamic:__ 動態進程管理,首先在fpm啟動時按照`pm.start_servers`初始化一定數量的worker,運行期間如果master發現空閑worker數低于`pm.min_spare_servers`配置數(表示請求比較多,worker處理不過來了)則會fork worker進程,但總的worker數不能超過`pm.max_children`,如果master發現空閑worker數超過了`pm.max_spare_servers`(表示閑著的worker太多了)則會殺掉一些worker,避免占用過多資源,master通過這4個值來控制worker數
* __ondemand:__ 這種方式一般很少用,在啟動時不分配worker進程,等到有請求了后再通知master進程fork worker進程,總的worker數不超過`pm.max_children`,處理完成后worker進程不會立即退出,當空閑時間超過`pm.process_idle_timeout`后再退出
前面介紹到在`fpm_run()`master進程將進入`fpm_event_loop()`:
```c
void fpm_event_loop(int err)
{
//創建一個io read的監聽事件,這里監聽的就是在fpm_init()階段中通過socketpair()創建管道sp[0]
//當sp[0]可讀時將回調fpm_got_signal()
fpm_event_set(&signal_fd_event, fpm_signals_get_fd(), FPM_EV_READ, &fpm_got_signal, NULL);
fpm_event_add(&signal_fd_event, 0);
//如果在php-fpm.conf配置了request_terminate_timeout則啟動心跳檢查
if (fpm_globals.heartbeat > 0) {
fpm_pctl_heartbeat(NULL, 0, NULL);
}
//定時觸發進程管理
fpm_pctl_perform_idle_server_maintenance_heartbeat(NULL, 0, NULL);
//進入事件循環,master進程將阻塞在此
while (1) {
...
//等待IO事件
ret = module->wait(fpm_event_queue_fd, timeout);
...
//檢查定時器事件
...
}
}
```
這就是master整體的處理,其進程管理主要依賴注冊的幾個事件,接下來我們詳細分析下這幾個事件的功能。
__(1)sp[1]管道可讀事件:__
在`fpm_init()`階段master曾創建了一個全雙工的管道:sp,然后在這里創建了一個sp[0]可讀的事件,當sp[0]可讀時將交由`fpm_got_signal()`處理,向sp[1]寫數據時sp[0]才會可讀,那么什么時機會向sp[1]寫數據呢?前面已經提到了:當master收到注冊的那幾種信號時會寫入sp[1]端,這個時候將觸發sp[0]可讀事件。

這個事件是master用于處理信號的,我們根據master注冊的信號逐個看下不同用途:
* __SIGINT/SIGTERM/SIGQUIT:__ 退出fpm,在master收到退出信號后將向所有的worker進程發送退出信號,然后master退出
* __SIGUSR1:__ 重新加載日志文件,生產環境中通常會對日志進行切割,切割后會生成一個新的日志文件,如果fpm不重新加載將無法繼續寫入日志,這個時候就需要向master發送一個USR1的信號
* __SIGUSR2:__ 重啟fpm,首先master也是會向所有的worker進程發送退出信號,然后master會調用execvp()重新啟動fpm,最后舊的master退出
* __SIGCHLD:__ 這個信號是子進程退出時操作系統發送給父進程的,子進程退出時,內核將子進程置為僵尸狀態,這個進程稱為僵尸進程,它只保留最小的一些內核數據結構,以便父進程查詢子進程的退出狀態,只有當父進程調用wait或者waitpid函數查詢子進程退出狀態后子進程才告終止,fpm中當worker進程因為異常原因(比如coredump了)退出而非master主動殺掉時master將受到此信號,這個時候父進程將調用waitpid()查下子進程的退出,然后檢查下是不是需要重新fork新的worker
具體處理邏輯在`fpm_got_signal()`函數中,這里不再羅列。
__(2)fpm_pctl_perform_idle_server_maintenance_heartbeat():__
這是進程管理實現的主要事件,master啟動了一個定時器,每隔1s觸發一次,主要用于dynamic、ondemand模式下的worker管理,master會定時檢查各worker pool的worker進程數,通過此定時器實現worker數量的控制,處理邏輯如下:
```c
static void fpm_pctl_perform_idle_server_maintenance(struct timeval *now)
{
for (wp = fpm_worker_all_pools; wp; wp = wp->next) {
struct fpm_child_s *last_idle_child = NULL; //空閑時間最久的worker
int idle = 0; //空閑worker數
int active = 0; //忙碌worker數
for (child = wp->children; child; child = child->next) {
//根據worker進程的fpm_scoreboard_proc_s->request_stage判斷
if (fpm_request_is_idle(child)) {
//找空閑時間最久的worker
...
idle++;
}else{
active++;
}
}
...
//ondemand模式
if (wp->config->pm == PM_STYLE_ONDEMAND) {
if (!last_idle_child) continue;
fpm_request_last_activity(last_idle_child, &last);
fpm_clock_get(&now);
if (last.tv_sec < now.tv_sec - wp->config->pm_process_idle_timeout) {
//如果空閑時間最長的worker空閑時間超過了process_idle_timeout則殺掉該worker
last_idle_child->idle_kill = 1;
fpm_pctl_kill(last_idle_child->pid, FPM_PCTL_QUIT);
}
continue;
}
//dynamic
if (wp->config->pm != PM_STYLE_DYNAMIC) continue;
if (idle > wp->config->pm_max_spare_servers && last_idle_child) {
//空閑worker太多了,殺掉
last_idle_child->idle_kill = 1;
fpm_pctl_kill(last_idle_child->pid, FPM_PCTL_QUIT);
wp->idle_spawn_rate = 1;
continue;
}
if (idle < wp->config->pm_min_spare_servers) {
//空閑worker太少了,如果總worker數未達到max數則fork
...
}
}
}
```
__(3)fpm_pctl_heartbeat():__
這個事件是用于限制worker處理單個請求最大耗時的,php-fpm.conf中有一個`request_terminate_timeout`的配置項,如果worker處理一個請求的總時長超過了這個值那么master將會向此worker進程發送`kill -TERM`信號殺掉worker進程,此配置單位為秒,默認值為0表示關閉此機制,另外fpm打印的slow log也是在這里完成的。
```c
static void fpm_pctl_check_request_timeout(struct timeval *now)
{
struct fpm_worker_pool_s *wp;
for (wp = fpm_worker_all_pools; wp; wp = wp->next) {
int terminate_timeout = wp->config->request_terminate_timeout;
int slowlog_timeout = wp->config->request_slowlog_timeout;
struct fpm_child_s *child;
if (terminate_timeout || slowlog_timeout) {
for (child = wp->children; child; child = child->next) {
//檢查當前當前worker處理的請求是否超時
fpm_request_check_timed_out(child, now, terminate_timeout, slowlog_timeout);
}
}
}
}
```
除了上面這幾個事件外還有一個沒有提到,那就是ondemand模式下master監聽的新請求到達的事件,因為ondemand模式下fpm啟動時是不會預創建worker的,有請求時才會生成子進程,所以請求到達時需要通知master進程,這個事件是在`fpm_children_create_initial()`時注冊的,事件處理函數為`fpm_pctl_on_socket_accept()`,具體邏輯這里不再展開,比較容易理解。
到目前為止我們已經把fpm的核心實現介紹完了,事實上fpm的實現還是比較簡單的。
- 目錄
- 第1章 PHP基本架構
- 1.1 PHP簡介
- 1.2 PHP7的改進
- 1.3 FPM
- 1.4 PHP執行的幾個階段
- 第2章 變量
- 2.1 變量的內部實現
- 2.2 數組
- 2.3 靜態變量
- 2.4 全局變量
- 2.5 常量
- 3.1 PHP代碼的編譯
- 3.1.1 詞法解析、語法解析
- 3.1.2 抽象語法樹編譯流程
- 第3章 Zend虛擬機
- 3.2.1 內部函數
- 3.2.2 用戶函數的實現
- 3.3 Zend引擎執行流程
- 3.3.1 基本結構
- 3.2 函數實現
- 3.3.2 執行流程
- 3.3.3 函數的執行流程
- 3.3.4 全局execute_data和opline
- 3.4 面向對象實現
- 3.4.1 類
- 3.4.2 對象
- 3.4.3 繼承
- 3.4.4 動態屬性
- 3.4.5 魔術方法
- 3.4.6 類的自動加載
- 3.5 運行時緩存
- 3.6 Opcache
- 3.6.1 opcode緩存
- 3.6.2 opcode優化
- 3.6.3 JIT
- 第4章 PHP基礎語法實現
- 4.1 類型轉換
- 4.2 選擇結構
- 4.3 循環結構
- 4.4 中斷及跳轉
- 4.5 include/require
- 4.6 異常處理
- 第5章 內存管理
- 5.1 Zend內存池
- 5.2 垃圾回收
- 第6章 線程安全
- 6.2 線程安全資源管理器
- 第7章 擴展開發
- 7.1 概述
- 6.1 什么是線程安全
- 7.2 擴展的實現原理
- 7.3 擴展的構成及編譯
- 7.4 鉤子函數
- 7.5 運行時配置
- 7.6 函數
- 7.7 zval的操作
- 7.8 常量
- 7.9 面向對象
- 7.9.1 內部類注冊
- 7.9.2 定義成員屬性
- 7.9.3 定義成員方法
- 7.9.4 定義常量
- 7.9.5 類的實例化
- 7.10 資源類型
- 7.11 經典擴展解析
- 7.8.1 Yaf
- 7.8.2 Redis
- 第8章 命名空間
- 8.2 命名空間的定義
- 8.2.1 定義語法
- 8.2.2 內部實現
- 8.3 命名空間的使用
- 8.3.1 基本用法
- 8.3.2 use導入
- 8.3.3 動態用法
- 附錄
- 附錄1:break/continue按標簽中斷語法實現
- 附錄2:defer推遲函數調用語法的實現
- 8.1 概述