8.4. 每-CPU 的變量 · Linux 設備驅動 (第三版)

## 8.4.?每-CPU 的變量每-CPU 變量是一個有趣的 2.6 內核的特性. 當你創建一個每-CPU變量, 系統中每個處理器獲得它自己的這個變量拷貝. 這個可能象一個想做的奇怪的事情, 但是它有自己的優點. 存取每-CPU變量不需要(幾乎)加鎖, 因為每個處理器使用它自己的拷貝. 每-CPU 變量也可存在于它們各自的處理器緩存中, 這樣對于頻繁更新的量子帶來了顯著的更好性能. 一個每-CPU變量的好的使用例子可在網絡子系統中找到. 內核維護無結尾的計數器來跟蹤有每種報文類型有多少被接收; 這些計數器可能每秒幾千次地被更新. 不去處理緩存和加鎖問題, 網絡開發者將統計計數器放進每-CPU變量. 現在更新是無鎖并且快的. 在很少的機會用戶空間請求看到計數器的值, 相加每個處理器的版本并且返回總數是一個簡單的事情. 每-CPU變量的聲明可在 <linux/percpu.h> 中找到. 為在編譯時間創建一個每-CPU變量, 使用這個宏定義: ~~~ DEFINE_PER_CPU(type, name); ~~~ 如果這個變量(稱為 name 的)是一個數組, 包含這個類型的維數信息. 因此, 一個有 3 個整數的每-CPU 數組應當被創建使用: ~~~ DEFINE_PER_CPU(int[3], my_percpu_array); ~~~ 每-CPU變量幾乎不必使用明確的加鎖來操作. 記住 2.6 內核是可搶占的; 對于一個處理器, 在修改一個每-CPU變量的臨界區中不應當被搶占. 并且如果你的進程在對一個每-CPU變量存取時將, 要被移動到另一個處理器上, 也不好. 因為這個原因, 你必須顯式使用 get_cpu_var 宏來存取當前處理器的給定變量拷貝, 并且當你完成時調用 put_cpu_var. 對 get_cpu_var 的調用返回一個 lvalue 給當前處理器的變量版本并且禁止搶占. 因為一個 lvalue 被返回, 它可被賦值給或者直接操作. 例如, 一個網絡代碼中的計數器時使用這 2 個語句來遞增的: ~~~ get_cpu_var(sockets_in_use)++; put_cpu_var(sockets_in_use); ~~~ 你可以存取另一個處理器的變量拷貝, 使用: ~~~ per_cpu(variable, int cpu_id); ~~~ 如果你編寫使處理器涉及到對方的每-CPU變量的代碼, 你, 當然, 一定要實現一個加鎖機制來使存取安全. 動態分配每-CPU變量也是可能的. 這些變量可被分配, 使用: ~~~ void *alloc_percpu(type); void *__alloc_percpu(size_t size, size_t align); ~~~ 在大部分情況, alloc_percpu 做的不錯; 你可以調用 __alloc_percpu 在需要一個特別的對齊的情況下. 在任一情況下, 一個每-CPU 變量可以使用 free_percpu 被返回給系統. 存取一個動態分配的每-CPU變量通過 per_cpu_ptr 來完成: ~~~ per_cpu_ptr(void *per_cpu_var, int cpu_id); ~~~ 這個宏返回一個指針指向 per_cpu_var 對應于給定 cpu_id 的版本. 如果你在簡單地讀另一個 CPU 的這個變量的版本, 你可以解引用這個指針并且用它來完成. 如果, 但是, 你在操作當前處理器的版本, 你可能需要首先保證你不能被移出那個處理器. 如果你存取這個每-CPU變量的全部都持有一個自旋鎖, 萬事大吉. 常常, 但是, 你需要使用 get_cpu 來阻止在使用變量時的搶占. 因此, 使用動態每-CPU變量的代碼會看來如此: ~~~ int cpu; cpu = get_cpu() ptr = per_cpu_ptr(per_cpu_var, cpu); /* work with ptr */ put_cpu(); ~~~ 當使用編譯時每-CPU 變量時, get_cpu_var 和 put_cpu_var 宏來照看這些細節. 動態每-CPU變量需要更多的顯式的保護. 每-CPU變量能夠輸出給每個模塊, 但是你必須使用一個特殊的宏版本: ~~~ EXPORT_PER_CPU_SYMBOL(per_cpu_var); EXPORT_PER_CPU_SYMBOL_GPL(per_cpu_var); ~~~ 為在一個模塊內存取這樣一個變量, 聲明它, 使用: ~~~ DECLARE_PER_CPU(type, name); ~~~ DECLARE_PER_CPU 的使用(不是 DEFINE_PER_CPU)告知編譯器進行一個外部引用. 如果你想使用每-CPU變量來創建一個簡單的整數計數器, 看一下在 <linux/percpu_counter.h> 中的現成的實現. 最后, 注意一些體系有有限數量的地址空間變量給每-CPU變量. 如果你創建每-CPU變量在你自己的代碼, 你應當盡量使它們小.