## 8.4.?每-CPU 的變量
每-CPU 變量是一個有趣的 2.6 內核的特性. 當你創建一個每-CPU變量, 系統中每個處理器獲得它自己的這個變量拷貝. 這個可能象一個想做的奇怪的事情, 但是它有自己的優點. 存取每-CPU變量不需要(幾乎)加鎖, 因為每個處理器使用它自己的拷貝. 每-CPU 變量也可存在于它們各自的處理器緩存中, 這樣對于頻繁更新的量子帶來了顯著的更好性能.
一個每-CPU變量的好的使用例子可在網絡子系統中找到. 內核維護無結尾的計數器來跟蹤有每種報文類型有多少被接收; 這些計數器可能每秒幾千次地被更新. 不去處理緩存和加鎖問題, 網絡開發者將統計計數器放進每-CPU變量. 現在更新是無鎖并且快的. 在很少的機會用戶空間請求看到計數器的值, 相加每個處理器的版本并且返回總數是一個簡單的事情.
每-CPU變量的聲明可在 <linux/percpu.h> 中找到. 為在編譯時間創建一個每-CPU變量, 使用這個宏定義:
~~~
DEFINE_PER_CPU(type, name);
~~~
如果這個變量(稱為 name 的)是一個數組, 包含這個類型的維數信息. 因此, 一個有 3 個整數的每-CPU 數組應當被創建使用:
~~~
DEFINE_PER_CPU(int[3], my_percpu_array);
~~~
每-CPU變量幾乎不必使用明確的加鎖來操作. 記住 2.6 內核是可搶占的; 對于一個處理器, 在修改一個每-CPU變量的臨界區中不應當被搶占. 并且如果你的進程在對一個每-CPU變量存取時將, 要被移動到另一個處理器上, 也不好. 因為這個原因, 你必須顯式使用 get_cpu_var 宏來存取當前處理器的給定變量拷貝, 并且當你完成時調用 put_cpu_var. 對 get_cpu_var 的調用返回一個 lvalue 給當前處理器的變量版本并且禁止搶占. 因為一個 lvalue 被返回, 它可被賦值給或者直接操作. 例如, 一個網絡代碼中的計數器時使用這 2 個語句來遞增的:
~~~
get_cpu_var(sockets_in_use)++;
put_cpu_var(sockets_in_use);
~~~
你可以存取另一個處理器的變量拷貝, 使用:
~~~
per_cpu(variable, int cpu_id);
~~~
如果你編寫使處理器涉及到對方的每-CPU變量的代碼, 你, 當然, 一定要實現一個加鎖機制來使存取安全.
動態分配每-CPU變量也是可能的. 這些變量可被分配, 使用:
~~~
void *alloc_percpu(type);
void *__alloc_percpu(size_t size, size_t align);
~~~
在大部分情況, alloc_percpu 做的不錯; 你可以調用 __alloc_percpu 在需要一個特別的對齊的情況下. 在任一情況下, 一個 每-CPU 變量可以使用 free_percpu 被返回給系統. 存取一個動態分配的每-CPU變量通過 per_cpu_ptr 來完成:
~~~
per_cpu_ptr(void *per_cpu_var, int cpu_id);
~~~
這個宏返回一個指針指向 per_cpu_var 對應于給定 cpu_id 的版本. 如果你在簡單地讀另一個 CPU 的這個變量的版本, 你可以解引用這個指針并且用它來完成. 如果, 但是, 你在操作當前處理器的版本, 你可能需要首先保證你不能被移出那個處理器. 如果你存取這個每-CPU變量的全部都持有一個自旋鎖, 萬事大吉. 常常, 但是, 你需要使用 get_cpu 來阻止在使用變量時的搶占. 因此, 使用動態每-CPU變量的代碼會看來如此:
~~~
int cpu;
cpu = get_cpu()
ptr = per_cpu_ptr(per_cpu_var, cpu);
/* work with ptr */
put_cpu();
~~~
當使用編譯時每-CPU 變量時, get_cpu_var 和 put_cpu_var 宏來照看這些細節. 動態每-CPU變量需要更多的顯式的保護.
每-CPU變量能夠輸出給每個模塊, 但是你必須使用一個特殊的宏版本:
~~~
EXPORT_PER_CPU_SYMBOL(per_cpu_var);
EXPORT_PER_CPU_SYMBOL_GPL(per_cpu_var);
~~~
為在一個模塊內存取這樣一個變量, 聲明它, 使用:
~~~
DECLARE_PER_CPU(type, name);
~~~
DECLARE_PER_CPU 的使用(不是 DEFINE_PER_CPU)告知編譯器進行一個外部引用.
如果你想使用每-CPU變量來創建一個簡單的整數計數器, 看一下在 <linux/percpu_counter.h> 中的現成的實現. 最后, 注意一些體系有有限數量的地址空間變量給每-CPU變量. 如果你創建每-CPU變量在你自己的代碼, 你應當盡量使它們小.
- Linux設備驅動第三版
- 第 1 章 設備驅動簡介
- 1.1. 驅動程序的角色
- 1.2. 劃分內核
- 1.3. 設備和模塊的分類
- 1.4. 安全問題
- 1.5. 版本編號
- 1.6. 版權條款
- 1.7. 加入內核開發社團
- 1.8. 本書的內容
- 第 2 章 建立和運行模塊
- 2.1. 設置你的測試系統
- 2.2. Hello World 模塊
- 2.3. 內核模塊相比于應用程序
- 2.4. 編譯和加載
- 2.5. 內核符號表
- 2.6. 預備知識
- 2.7. 初始化和關停
- 2.8. 模塊參數
- 2.9. 在用戶空間做
- 2.10. 快速參考
- 第 3 章 字符驅動
- 3.1. scull 的設計
- 3.2. 主次編號
- 3.3. 一些重要數據結構
- 3.4. 字符設備注冊
- 3.5. open 和 release
- 3.6. scull 的內存使用
- 3.7. 讀和寫
- 3.8. 使用新設備
- 3.9. 快速參考
- 第 4 章 調試技術
- 4.1. 內核中的調試支持
- 4.2. 用打印調試
- 4.3. 用查詢來調試
- 4.4. 使用觀察來調試
- 4.5. 調試系統故障
- 4.6. 調試器和相關工具
- 第 5 章 并發和競爭情況
- 5.1. scull 中的缺陷
- 5.2. 并發和它的管理
- 5.3. 旗標和互斥體
- 5.4. Completions 機制
- 5.5. 自旋鎖
- 5.6. 鎖陷阱
- 5.7. 加鎖的各種選擇
- 5.8. 快速參考
- 第 6 章 高級字符驅動操作
- 6.1. ioctl 接口
- 6.2. 阻塞 I/O
- 6.3. poll 和 select
- 6.4. 異步通知
- 6.5. 移位一個設備
- 6.6. 在一個設備文件上的存取控制
- 6.7. 快速參考
- 第 7 章 時間, 延時, 和延后工作
- 7.1. 測量時間流失
- 7.2. 獲知當前時間
- 7.3. 延后執行
- 7.4. 內核定時器
- 7.5. Tasklets 機制
- 7.6. 工作隊列
- 7.7. 快速參考
- 第 8 章 分配內存
- 8.1. kmalloc 的真實故事
- 8.2. 后備緩存
- 8.3. get_free_page 和其友
- 8.4. 每-CPU 的變量
- 8.5. 獲得大量緩沖
- 8.6. 快速參考
- 第 9 章 與硬件通訊
- 9.1. I/O 端口和 I/O 內存
- 9.2. 使用 I/O 端口
- 9.3. 一個 I/O 端口例子
- 9.4. 使用 I/O 內存
- 9.5. 快速參考
- 第 10 章 中斷處理
- 10.1. 準備并口
- 10.2. 安裝一個中斷處理
- 10.3. 前和后半部
- 10.4. 中斷共享
- 10.5. 中斷驅動 I/O
- 10.6. 快速參考
- 第 11 章 內核中的數據類型
- 11.1. 標準 C 類型的使用
- 11.2. 安排一個明確大小給數據項
- 11.3. 接口特定的類型
- 11.4. 其他移植性問題
- 11.5. 鏈表
- 11.6. 快速參考
- 第 12 章 PCI 驅動
- 12.1. PCI 接口
- 12.2. 回顧: ISA
- 12.3. PC/104 和 PC/104+
- 12.4. 其他的 PC 總線
- 12.5. SBus
- 12.6. NuBus 總線
- 12.7. 外部總線
- 12.8. 快速參考
- 第 13 章 USB 驅動
- 13.1. USB 設備基礎知識
- 13.2. USB 和 sysfs
- 13.3. USB 的 Urbs
- 13.4. 編寫一個 USB 驅動
- 13.5. 無 urb 的 USB 傳送
- 13.6. 快速參考
- 第 14 章 Linux 設備模型
- 14.1. Kobjects, Ksets 和 Subsystems
- 14.2. 低級 sysfs 操作
- 14.3. 熱插拔事件產生
- 14.4. 總線, 設備, 和驅動
- 14.5. 類
- 14.6. 集成起來
- 14.7. 熱插拔
- 14.8. 處理固件
- 14.9. 快速參考
- 第 15 章 內存映射和 DMA
- 15.1. Linux 中的內存管理
- 15.2. mmap 設備操作
- 15.3. 進行直接 I/O
- 15.4. 直接內存存取
- 15.5. 快速參考
- 第 16 章 塊驅動
- 16.1. 注冊
- 16.2. 塊設備操作
- 16.3. 請求處理
- 16.4. 一些其他的細節
- 16.5. 快速參考
- 第 17 章 網絡驅動
- 17.1. snull 是如何設計的
- 17.2. 連接到內核
- 17.3. net_device 結構的詳情
- 17.4. 打開與關閉
- 17.5. 報文傳送
- 17.6. 報文接收
- 17.7. 中斷處理
- 17.8. 接收中斷緩解
- 17.9. 連接狀態的改變
- 17.10. Socket 緩存
- 17.11. MAC 地址解析
- 17.12. 定制 ioctl 命令
- 17.13. 統計信息
- 17.14. 多播
- 17.15. 幾個其他細節
- 17.16. 快速參考
- 第 18 章 TTY 驅動
- 18.1. 一個小 TTY 驅動
- 18.2. tty_driver 函數指針
- 18.3. TTY 線路設置
- 18.4. ioctls 函數
- 18.5. TTY 設備的 proc 和 sysfs 處理
- 18.6. tty_driver 結構的細節
- 18.7. tty_operaions 結構的細節
- 18.8. tty_struct 結構的細節
- 18.9. 快速參考