## 17.8.?接收中斷緩解
當一個網絡驅動如我們上面所述編寫出來, 你的接口收到每個報文都中斷處理器. 在許多情況下, 這是希望的操作模式, 它不是個問題. 然而, 高帶寬接口能夠在每秒內收到幾千個報文. 這個樣子的中斷負載下, 系統的整體性能會受損害.
作為一個提高高端 Linux 系統性能的方法, 網絡子系統開發者已創建了一種可選的基于查詢的接口(稱為 NAPI). [[52](#)]"查詢"可能是一個不妥的字在驅動開發者看來, 他們常常看到查詢是不靈巧和低效的. 查詢是低效的, 但是, 僅僅在接口沒有工作做的時候被查詢. 當系統有一個處理大流量的高速接口時, 會一直有更多的報文來處理. 在這種情況下沒有必要中斷處理器; 時常從接口收集新報文是足夠的.
停止接收中斷能夠減輕相當數量的處理器負載. 適應 NAPI 的驅動能夠被告知不要輸送報文給內核, 如果這些報文只是在網絡代碼里因擁塞而被丟棄, 這樣能夠在最需要的時候對性能有幫助. 由于各種理由, NAPI 驅動也比較少可能重排序報文.
不是所有的設備能夠以 NAPI 模式操作, 但是. 一個 NAPI 適應的接口必須能夠存儲幾個報文( 要么在接口卡上, 要么在內存內 DMA 環). 接口應當能夠禁止中斷來接收報文, 卻可以繼續因成功發送或其他事件而中斷. 有其他微妙的事情使得編寫一個適應 NAPI 的驅動更有難度; 詳情見內核源碼中的 Documentation/networking/NAPI_HOWTO.txt.
相對少有驅動實現 NAPI 接口. 如果你在編寫一個驅動給一個可能產生大量中斷的接口, 但是, 花點時間來實現 NAPI 會被證明是很值得的.
snull 驅動, 當用非零的 use_napi 參數加載時, 在 NAPI 模式下操作. 在初始化時, 我們不得不建立一對格外的結構 net_device 的成員:
~~~
if (use_napi) {
dev->poll = snull_poll;
dev->weight = 2;
}
~~~
poll 成員必須設置為你的驅動的查詢函數; 我們簡短看一下 snull_poll. weight 成員描述接口的相對重要性: 有多少流量可以從接口收到, 當資源緊張時. 如何設置 weight 參數沒有嚴格的規則; 依照慣例, 10 MBps 以太網接口設置 weight 為 16, 而快一些的接口使用 64. 你不能設置 weight 為一個超過你的接口能夠存儲的報文數目的值. 在 snull, 我們設置 weight 為 2, 作為一個演示不同報文接收的方法.
創建適應 NAPI 的驅動的下一步是改變中斷處理. 當你的接口(它應當在接收中斷使能下啟動)示意有報文到達, 中斷處理不應當處理這個報文. 相反, 它應當禁止后面的接收中斷并告知內核到時候查詢接口了. 在 snull的"中斷"處理里, 響應報文接收中斷的代碼已變為如下:
~~~
if (statusword & SNULL_RX_INTR) {
snull_rx_ints(dev, 0); /* Disable further interrupts */
netif_rx_schedule(dev);
}
~~~
當接口告訴我們有報文來了, 中斷處理將其留在接口中; 此時需要的所有東西就是調用 netif_rx_schedule, 它使得我們的 poll 方法在后面某個時候被調用.
poll 方法有下面原型:
~~~
int (*poll)(struct net_device *dev, int *budget);
~~~
snull 的 poll 方法實現看來如此:
~~~
static int snull_poll(struct net_device *dev, int *budget)
{
int npackets = 0, quota = min(dev->quota, *budget);
struct sk_buff *skb;
struct snull_priv *priv = netdev_priv(dev);
struct snull_packet *pkt;
while (npackets < quota && priv->rx_queue) {
pkt = snull_dequeue_buf(dev);
skb = dev_alloc_skb(pkt->datalen + 2);
if (! skb) {
if (printk_ratelimit())
printk(KERN_NOTICE "snull: packet dropped\n"); priv->stats.rx_dropped++; snull_release_buffer(pkt); continue;
}
memcpy(skb_put(skb, pkt->datalen), pkt->data, pkt->datalen);
skb->dev = dev;
skb->protocol = eth_type_trans(skb, dev);
skb->ip_summed = CHECKSUM_UNNECESSARY; /* don't check it */
netif_receive_skb(skb);
/* Maintain stats */
npackets++;
priv->stats.rx_packets++;
priv->stats.rx_bytes += pkt->datalen;
snull_release_buffer(pkt);
}
/* If we processed all packets, we're done; tell the kernel and reenable ints */
*budget -= npackets;
dev->quota -= npackets;
if (! priv->rx_queue) {
netif_rx_complete(dev);
snull_rx_ints(dev, 1);
return 0;
}
/* We couldn't process everything. */
return 1;
}
~~~
函數的中心部分是關于創建一個保持報文的 skb; 這部分代碼和我們之前在 snull_rx 中見到的一樣. 但是, 有些東西不一樣:
-
budget 參數提供了一個我們允許傳給內核的最大報文數目. 在設備結構里, quota 成員給出了另一個最大值; poll 方法必須遵守這兩個限制中的較小者. 它也應當以實際收到的報文數目遞減 dev->quota 和 *budget. budget 值是當前 CPU 能夠從所有接口收到的最多報文數目, 而 quota 是一個每接口值, 常常在初始化時安排給接口以 weight 為起始.
-
報文應當用 netif_receive_skb 遞交內核, 而不是 netif_rx.
-
如果 poll 方法能夠在給定的限制內處理所有的報文, 它應當重新使能接收中斷, 調用 netif_rx_complete 來關閉 查詢, 并且返回 0. 返回值 1 指示有剩下的報文需要處理.
網絡子系統保證任何給定的設備的 poll 方法不會在多于一個處理器上被同時調用. 但是, poll 調用仍然可以與你的其他設備方法的調用并發.
[[52](#)] NAPI 代表"new API"; 網絡黑客們精于創建接口卻疏于給它們起名.
- Linux設備驅動第三版
- 第 1 章 設備驅動簡介
- 1.1. 驅動程序的角色
- 1.2. 劃分內核
- 1.3. 設備和模塊的分類
- 1.4. 安全問題
- 1.5. 版本編號
- 1.6. 版權條款
- 1.7. 加入內核開發社團
- 1.8. 本書的內容
- 第 2 章 建立和運行模塊
- 2.1. 設置你的測試系統
- 2.2. Hello World 模塊
- 2.3. 內核模塊相比于應用程序
- 2.4. 編譯和加載
- 2.5. 內核符號表
- 2.6. 預備知識
- 2.7. 初始化和關停
- 2.8. 模塊參數
- 2.9. 在用戶空間做
- 2.10. 快速參考
- 第 3 章 字符驅動
- 3.1. scull 的設計
- 3.2. 主次編號
- 3.3. 一些重要數據結構
- 3.4. 字符設備注冊
- 3.5. open 和 release
- 3.6. scull 的內存使用
- 3.7. 讀和寫
- 3.8. 使用新設備
- 3.9. 快速參考
- 第 4 章 調試技術
- 4.1. 內核中的調試支持
- 4.2. 用打印調試
- 4.3. 用查詢來調試
- 4.4. 使用觀察來調試
- 4.5. 調試系統故障
- 4.6. 調試器和相關工具
- 第 5 章 并發和競爭情況
- 5.1. scull 中的缺陷
- 5.2. 并發和它的管理
- 5.3. 旗標和互斥體
- 5.4. Completions 機制
- 5.5. 自旋鎖
- 5.6. 鎖陷阱
- 5.7. 加鎖的各種選擇
- 5.8. 快速參考
- 第 6 章 高級字符驅動操作
- 6.1. ioctl 接口
- 6.2. 阻塞 I/O
- 6.3. poll 和 select
- 6.4. 異步通知
- 6.5. 移位一個設備
- 6.6. 在一個設備文件上的存取控制
- 6.7. 快速參考
- 第 7 章 時間, 延時, 和延后工作
- 7.1. 測量時間流失
- 7.2. 獲知當前時間
- 7.3. 延后執行
- 7.4. 內核定時器
- 7.5. Tasklets 機制
- 7.6. 工作隊列
- 7.7. 快速參考
- 第 8 章 分配內存
- 8.1. kmalloc 的真實故事
- 8.2. 后備緩存
- 8.3. get_free_page 和其友
- 8.4. 每-CPU 的變量
- 8.5. 獲得大量緩沖
- 8.6. 快速參考
- 第 9 章 與硬件通訊
- 9.1. I/O 端口和 I/O 內存
- 9.2. 使用 I/O 端口
- 9.3. 一個 I/O 端口例子
- 9.4. 使用 I/O 內存
- 9.5. 快速參考
- 第 10 章 中斷處理
- 10.1. 準備并口
- 10.2. 安裝一個中斷處理
- 10.3. 前和后半部
- 10.4. 中斷共享
- 10.5. 中斷驅動 I/O
- 10.6. 快速參考
- 第 11 章 內核中的數據類型
- 11.1. 標準 C 類型的使用
- 11.2. 安排一個明確大小給數據項
- 11.3. 接口特定的類型
- 11.4. 其他移植性問題
- 11.5. 鏈表
- 11.6. 快速參考
- 第 12 章 PCI 驅動
- 12.1. PCI 接口
- 12.2. 回顧: ISA
- 12.3. PC/104 和 PC/104+
- 12.4. 其他的 PC 總線
- 12.5. SBus
- 12.6. NuBus 總線
- 12.7. 外部總線
- 12.8. 快速參考
- 第 13 章 USB 驅動
- 13.1. USB 設備基礎知識
- 13.2. USB 和 sysfs
- 13.3. USB 的 Urbs
- 13.4. 編寫一個 USB 驅動
- 13.5. 無 urb 的 USB 傳送
- 13.6. 快速參考
- 第 14 章 Linux 設備模型
- 14.1. Kobjects, Ksets 和 Subsystems
- 14.2. 低級 sysfs 操作
- 14.3. 熱插拔事件產生
- 14.4. 總線, 設備, 和驅動
- 14.5. 類
- 14.6. 集成起來
- 14.7. 熱插拔
- 14.8. 處理固件
- 14.9. 快速參考
- 第 15 章 內存映射和 DMA
- 15.1. Linux 中的內存管理
- 15.2. mmap 設備操作
- 15.3. 進行直接 I/O
- 15.4. 直接內存存取
- 15.5. 快速參考
- 第 16 章 塊驅動
- 16.1. 注冊
- 16.2. 塊設備操作
- 16.3. 請求處理
- 16.4. 一些其他的細節
- 16.5. 快速參考
- 第 17 章 網絡驅動
- 17.1. snull 是如何設計的
- 17.2. 連接到內核
- 17.3. net_device 結構的詳情
- 17.4. 打開與關閉
- 17.5. 報文傳送
- 17.6. 報文接收
- 17.7. 中斷處理
- 17.8. 接收中斷緩解
- 17.9. 連接狀態的改變
- 17.10. Socket 緩存
- 17.11. MAC 地址解析
- 17.12. 定制 ioctl 命令
- 17.13. 統計信息
- 17.14. 多播
- 17.15. 幾個其他細節
- 17.16. 快速參考
- 第 18 章 TTY 驅動
- 18.1. 一個小 TTY 驅動
- 18.2. tty_driver 函數指針
- 18.3. TTY 線路設置
- 18.4. ioctls 函數
- 18.5. TTY 設備的 proc 和 sysfs 處理
- 18.6. tty_driver 結構的細節
- 18.7. tty_operaions 結構的細節
- 18.8. tty_struct 結構的細節
- 18.9. 快速參考