opcode · 深入理解PHP內核

[opcode](http://en.wikipedia.org/wiki/Opcode)是計算機指令中的一部分，用于指定要執行的操作，指令的格式和規范由處理器的指令規范指定。除了指令本身以外通常還有指令所需要的操作數，可能有的指令不需要顯式的操作數。這些操作數可能是寄存器中的值，堆棧中的值，某塊內存的值或者IO端口中的值等等。通常opcode還有另一種稱謂: 字節碼(byte codes)。例如Java虛擬機(JVM)，.NET的通用中間語言(CIL: Common Intermeditate Language)等等。 ### PHP的opcode PHP中的opcode則屬于前面介紹中的后著，PHP是構建在Zend虛擬機(Zend VM)之上的。PHP的opcode就是Zend虛擬機中的指令。 > 有關Zend虛擬機的介紹請閱讀后面相關內容在PHP實現內部，opcode由如下的結構體表示： struct _zend_op { opcode_handler_t handler; // 執行該opcode時調用的處理函數 znode result; znode op1; znode op2; ulong extended_value; uint lineno; zend_uchar opcode; // opcode代碼 }; 和CPU的指令類似，有一個標示指令的opcode字段，以及這個opcode所操作的操作數，PHP不像匯編那么底層，在腳本實際執行的時候可能還需要其他更多的信息，extended_value字段就保存了這類信息，其中的result域則是保存該指令執行完成后的結果。例如如下代碼是在編譯器遇到print語句的時候進行編譯的函數: void zend_do_print(znode *result，const znode *arg TSRMLS_DC) { zend_op *opline = get_next_op(CG(active_op_array) TSRMLS_CC); ? opline->result.op_type = IS_TMP_VAR; opline->result.u.var = get_temporary_variable(CG(active_op_array)); opline->opcode = ZEND_PRINT; opline->op1 = *arg; SET_UNUSED(opline->op2); *result = opline->result; } 這個函數新創建一條zend_op，將返回值的類型設置為臨時變量(IS_TMP_VAR)，并為臨時變量申請空間，隨后指定opcode為ZEND_PRINT，并將傳遞進來的參數賦值給這條opcode的第一個操作數。這樣在最終執行這條opcode的時候，Zend引擎能獲取到足夠的信息以便輸出內容。下面這個函數是在編譯器遇到echo語句的時候進行編譯的函數: void zend_do_echo(const znode *arg TSRMLS_DC) { zend_op *opline = get_next_op(CG(active_op_array) TSRMLS_CC); ? opline->opcode = ZEND_ECHO; opline->op1 = *arg; SET_UNUSED(opline->op2); } 可以看到echo處理除了指定opcode以外，還將echo的參數傳遞給op1，這里并沒有設置opcode的result結果字段。從這里我們也能看出print和echo的區別來，print有返回值，而echo沒有，這里的沒有和返回null是不同的，如果嘗試將echo的值賦值給某個變量或者傳遞給函數都會出現語法錯誤。 PHP腳本編譯為opcode保存在op_array中，其內部存儲的結構如下： struct _zend_op_array { /* Common elements */ zend_uchar type; char *function_name; // 如果是用戶定義的函數則，這里將保存函數的名字 zend_class_entry *scope; zend_uint fn_flags; union _zend_function *prototype; zend_uint num_args; zend_uint required_num_args; zend_arg_info *arg_info; zend_bool pass_rest_by_reference; unsigned char return_reference; /* END of common elements */ ? zend_bool done_pass_two; ? zend_uint *refcount; ? zend_op *opcodes; // opcode數組 ? zend_uint last，size; ? zend_compiled_variable *vars; int last_var，size_var; ? // ... } 如上面的注釋，opcodes保存在這里，在執行的時候由下面的execute函數執行： ZEND_API void execute(zend_op_array *op_array TSRMLS_DC) { // ... 循環執行op_array中的opcode或者執行其他op_array中的opcode } 前面提到每條opcode都有一個opcode_handler_t的函數指針字段，用于執行該opcode，這里并沒有給沒有指定處理函數，那在執行的時候該由哪個函數來執行呢?更多信息請參考Zend虛擬機相關章節的詳細介紹。虛擬機相關章節的詳細介紹。 > PHP有三種方式來進行opcode的處理:CALL，SWITCH和GOTO，PHP默認使用CALL的方式，也就是函數調用的方式，由于opcode執行是每個PHP程序頻繁需要進行的操作，可以使用SWITCH或者GOTO的方式來分發，通常GOTO的效率相對會高一些，不過效率是否提高依賴于不同的CPU。