## 17.2.?連接到內核
我們從分析 snull 的源碼來查看網絡驅動的結構開始. 把幾個驅動的源碼留在手邊, 對于下面的討論和得知真實世界中的 Linux 網絡驅動如何運行是會有幫助的.
### 17.2.1.?設備注冊
當一個驅動模塊加載進一個運行著的內核中, 它請求資源并提供功能; 這里沒有新內容. 并且在資源是如何請求上也沒有新東西. 驅動應當探測它的設備和它的硬件位置( I/O 端口和 IRQ 線 ) -- 但是不注冊它們 --如在第 10 章的" 安裝一個中斷處理程序 "中所述. 一個網絡驅動通過它的模塊初始化函數注冊的方式與字符和塊驅動是不同的. 因為沒有對等的主次編號給網絡接口, 一個網絡驅動不請求這樣一個號. 相反, 驅動為每個剛剛探測到的接口在一個全局的網絡設備列表里插入一個數據結構.
每個接口由一個結構 net_device 項來描述, 它在 <linux/netdevice.h> 里定義. snull 驅動留有指向兩個這樣結構的指針, 在一個簡單數組里.
struct net_device *snull_devs[2];
net_device 結構, 如同許多其他內核結構, 包含一個 kobject, 以及因此它可被引用計數并通過 sysfs 輸出. 如同別的這樣的結構, 它必須動態分配. 進行這種分配的內核函數是 alloc_netdev, 它有下列原型:
~~~
struct net_device *alloc_netdev(int sizeof_priv,
const char *name,
void (*setup)(struct net_device *));
~~~
這里, sizeof_priv 是驅動的的"私有數據"區的大小; 對于網絡驅動, 這個區是同 net_device 結構一起分配的. 實際上, 這兩個是是在一個大內存塊中一起分配的, 但是驅動作者應當假裝不知道這一點. name 是這個接口的名子, 如同用戶空間看到的一樣; 這個名子可以有一個 printf 風格的 %d 在里面. 內核用下一個可用的接口號來替換這個 %d. 最后, setup 是一個初始化函數的指針, 被調用來設置 net_device 結構的剩余部分. 我們即將進入這個初始化函數, 但是現在, 為強化起見, snull 以這樣的方式分配它的兩個設備結構:
~~~
snull_devs[0] = alloc_netdev(sizeof(struct snull_priv), "sn%d",
snull_init);
snull_devs[1] = alloc_netdev(sizeof(struct snull_priv), "sn%d",
snull_init);
if (snull_devs[0] == NULL || snull_devs[1] == NULL)
goto out;
~~~
象通常一樣, 我們必須檢查返回值來確保分配成功.
網絡子系統為各種接口提供了一些幫助函數, 包裹著 alloc_netdev. 最通用的是 alloc_etherdev, 定義在 <linux/etherdevice.h>:
~~~
struct net_device *alloc_etherdev(int sizeof_priv);
~~~
這個函數分配一個網絡設備使用 eth%d 作為參數 name. 它提供了自己的初始化函數 ( ether_setup )來設置幾個 net_device 字段, 使用對以太網設備合適的值. 因此, 沒有驅動提供的初始化函數給 alloc_etherdev; 驅動應當只完成它要求的初始化, 直接在一個成功的分配之后. 其他類型驅動的編寫者可能想利用這些幫助函數的其中一個, 例如 alloc_fcdev ( 定義在 <linux/fcdevice.h> ) 為 fiber-channel 設備, alloc_fddidev (<linux/fddidevice.h>) 為 FDDI 設備, 或者 aloc_trdev (<linux/trdevice.h>) 為令牌環設備.
snull 可以順利使用 alloc_etherdev; 我們選擇使用 alloc_netdev 來代替, 作為演示低層接口的方式, 并且給我們控制安排給接口的名子.
一旦 net_device 結構完成初始化, 完成這個過程就只是傳遞這個結構給 register_netdev. 在 snull 中, 調用看來如同這樣:
~~~
for (i = 0; i < 2; i++)
if ((result = register_netdev(snull_devs[i])))
printk("snull: error %i registering device \"%s\"\n",
result, snull_devs[i]->name);
~~~
一些經常的注意問題這里提一下: 在你調用 register_netdev 時, 你的驅動可能會馬上被調用來操作設備. 因此, 你不應當注冊設備直到所有東西都已經完全初始化.
### 17.2.2.?初始化每一個設備
我們已經看到了 net_device 結構的分配和注冊, 但是我們越過了中間的完全初始化這個結構的步驟. 注意 net_device 結構在運行時一直是放在一起; 它不能如同一個 file_operations 或者 block_device_opreations 結構一樣在編譯時設置. 必須在調用 register_netdev 之前完成初始化. net_device 結構又大又復雜; 幸運的是, 內核負責了一些以太網范圍中的缺省值, 通過 ether_setup 函數(由 alloc_etherdev 調用).
因為 snull 使用 alloc_netdev, 它有單獨的初始化函數. 該函數的核心( snull_init )如下:
~~~
ether_setup(dev); /* assign some of the fields */
dev->open = snull_open;
dev->stop = snull_release;
dev->set_config = snull_config;
dev->hard_start_xmit = snull_tx;
dev->do_ioctl = snull_ioctl;
dev->get_stats = snull_stats;
dev->rebuild_header = snull_rebuild_header;
dev->hard_header = snull_header;
dev->tx_timeout = snull_tx_timeout;
dev->watchdog_timeo = timeout;
/* keep the default flags, just add NOARP */
dev->flags |= IFF_NOARP;
dev->features |= NETIF_F_NO_CSUM;
dev->hard_header_cache = NULL; /* Disable caching */
~~~
上面的代碼是對 net_device 結構的例行初始化; 大部分是存儲我們的各種驅動函數指針. 代碼的單個不尋常的特性是設置 IFF_NOARP 在 flags 里面. 這個指出該接口不能使用 ARP. ARP 是一個低層以太網協議; 它的工作是將 IP 地址轉變成以太網介質存取控制 (MAC) 地址. 因為由 snull 模擬的遠程系統并不存在, 就沒人回答對它們的 ARP 請求. 不想因為增加 ARP 實現使 snull 變復雜, 我們選擇標識接口作為不能處理這個協議. 其中的對 hard_header_cache 賦值是同樣理由: 它關閉了這個接口的(不存在的) ARP 回答. 這個主題在本章后面的" MAC 地址解析"一節中詳述.
代碼初始化也設置了幾個和發送超時的處理有關的幾個變量( tx_timeout 和 watchdog_time ). 我們在"發送超時"一節完整地涉及這個主題.
我們現在看結構 net_device 的另一個成員, priv. 它的角色近似于我們用在字符驅動上的 private_data 指針. 不同于 fops->private_data, 這個 priv 指針是隨 net_device 結構一起分配的. 也不鼓勵直接存取 priv 成員, 由于性能和靈活性的原因. 當一個驅動需要存取私有數據指針, 應當使用 netdev_priv 函數. 因此, snull 驅動充滿著這樣的聲明:
~~~
struct snull_priv *priv = netdev_priv(dev);
~~~
snull 模塊聲明了一個 snull_priv 數據結構來給 priv 使用:
~~~
struct snull_priv {
struct net_device_stats stats;
int status;
struct snull_packet *ppool;
struct snull_packet *rx_queue; /* List of incoming packets */
int rx_int_enabled;
int tx_packetlen;
u8 *tx_packetdata;
struct sk_buff *skb;
spinlock_t lock;
};
~~~
這個結構包括, 還有其他東西, 一個 net_device_stats 結構的實例, 這是放置接口統計量的標準地方. 下面的在 snull_init 中的各行分配并初始化 dev->priv:
~~~
priv = netdev_priv(dev);
memset(priv, 0, sizeof(struct snull_priv));
spin_lock_init(&priv->lock);
snull_rx_ints(dev, 1); /* enable receive interrupts */
~~~
### 17.2.3.?模塊卸載
模塊卸載時沒什么特別的. 模塊的清理函數只是注銷接口, 進行任何需要的內部清理, 釋放 net_device 結構回系統.
~~~
void snull_cleanup(void)
{
int i;
for (i = 0; i < 2; i++) {
if (snull_devs[i]) {
unregister_netdev(snull_devs[i]);
snull_teardown_pool(snull_devs[i]);
free_netdev(snull_devs[i]);
}
}
return;
}
~~~
對 unregister_netdev 的調用從系統中去除了接口; free_netdev 歸還 net_device 結構給內核. 如果某個地方有對這個結構的引用, 它可能繼續存在, 但是你的驅動不需要關心這個. 一旦你已經注銷了接口, 內核不再調用它的方法.
注意我們的內部清理( 在 snull_teardown_pool 里所做的 )直到已經注銷了設備后才能進行. 它必須, 但是, 在我們返回 net_device 結構給系統之前進行; 一旦我們已調用了 free_netdev, 我們再不能對這個設備或者我們的私有數據做任何引用.
- Linux設備驅動第三版
- 第 1 章 設備驅動簡介
- 1.1. 驅動程序的角色
- 1.2. 劃分內核
- 1.3. 設備和模塊的分類
- 1.4. 安全問題
- 1.5. 版本編號
- 1.6. 版權條款
- 1.7. 加入內核開發社團
- 1.8. 本書的內容
- 第 2 章 建立和運行模塊
- 2.1. 設置你的測試系統
- 2.2. Hello World 模塊
- 2.3. 內核模塊相比于應用程序
- 2.4. 編譯和加載
- 2.5. 內核符號表
- 2.6. 預備知識
- 2.7. 初始化和關停
- 2.8. 模塊參數
- 2.9. 在用戶空間做
- 2.10. 快速參考
- 第 3 章 字符驅動
- 3.1. scull 的設計
- 3.2. 主次編號
- 3.3. 一些重要數據結構
- 3.4. 字符設備注冊
- 3.5. open 和 release
- 3.6. scull 的內存使用
- 3.7. 讀和寫
- 3.8. 使用新設備
- 3.9. 快速參考
- 第 4 章 調試技術
- 4.1. 內核中的調試支持
- 4.2. 用打印調試
- 4.3. 用查詢來調試
- 4.4. 使用觀察來調試
- 4.5. 調試系統故障
- 4.6. 調試器和相關工具
- 第 5 章 并發和競爭情況
- 5.1. scull 中的缺陷
- 5.2. 并發和它的管理
- 5.3. 旗標和互斥體
- 5.4. Completions 機制
- 5.5. 自旋鎖
- 5.6. 鎖陷阱
- 5.7. 加鎖的各種選擇
- 5.8. 快速參考
- 第 6 章 高級字符驅動操作
- 6.1. ioctl 接口
- 6.2. 阻塞 I/O
- 6.3. poll 和 select
- 6.4. 異步通知
- 6.5. 移位一個設備
- 6.6. 在一個設備文件上的存取控制
- 6.7. 快速參考
- 第 7 章 時間, 延時, 和延后工作
- 7.1. 測量時間流失
- 7.2. 獲知當前時間
- 7.3. 延后執行
- 7.4. 內核定時器
- 7.5. Tasklets 機制
- 7.6. 工作隊列
- 7.7. 快速參考
- 第 8 章 分配內存
- 8.1. kmalloc 的真實故事
- 8.2. 后備緩存
- 8.3. get_free_page 和其友
- 8.4. 每-CPU 的變量
- 8.5. 獲得大量緩沖
- 8.6. 快速參考
- 第 9 章 與硬件通訊
- 9.1. I/O 端口和 I/O 內存
- 9.2. 使用 I/O 端口
- 9.3. 一個 I/O 端口例子
- 9.4. 使用 I/O 內存
- 9.5. 快速參考
- 第 10 章 中斷處理
- 10.1. 準備并口
- 10.2. 安裝一個中斷處理
- 10.3. 前和后半部
- 10.4. 中斷共享
- 10.5. 中斷驅動 I/O
- 10.6. 快速參考
- 第 11 章 內核中的數據類型
- 11.1. 標準 C 類型的使用
- 11.2. 安排一個明確大小給數據項
- 11.3. 接口特定的類型
- 11.4. 其他移植性問題
- 11.5. 鏈表
- 11.6. 快速參考
- 第 12 章 PCI 驅動
- 12.1. PCI 接口
- 12.2. 回顧: ISA
- 12.3. PC/104 和 PC/104+
- 12.4. 其他的 PC 總線
- 12.5. SBus
- 12.6. NuBus 總線
- 12.7. 外部總線
- 12.8. 快速參考
- 第 13 章 USB 驅動
- 13.1. USB 設備基礎知識
- 13.2. USB 和 sysfs
- 13.3. USB 的 Urbs
- 13.4. 編寫一個 USB 驅動
- 13.5. 無 urb 的 USB 傳送
- 13.6. 快速參考
- 第 14 章 Linux 設備模型
- 14.1. Kobjects, Ksets 和 Subsystems
- 14.2. 低級 sysfs 操作
- 14.3. 熱插拔事件產生
- 14.4. 總線, 設備, 和驅動
- 14.5. 類
- 14.6. 集成起來
- 14.7. 熱插拔
- 14.8. 處理固件
- 14.9. 快速參考
- 第 15 章 內存映射和 DMA
- 15.1. Linux 中的內存管理
- 15.2. mmap 設備操作
- 15.3. 進行直接 I/O
- 15.4. 直接內存存取
- 15.5. 快速參考
- 第 16 章 塊驅動
- 16.1. 注冊
- 16.2. 塊設備操作
- 16.3. 請求處理
- 16.4. 一些其他的細節
- 16.5. 快速參考
- 第 17 章 網絡驅動
- 17.1. snull 是如何設計的
- 17.2. 連接到內核
- 17.3. net_device 結構的詳情
- 17.4. 打開與關閉
- 17.5. 報文傳送
- 17.6. 報文接收
- 17.7. 中斷處理
- 17.8. 接收中斷緩解
- 17.9. 連接狀態的改變
- 17.10. Socket 緩存
- 17.11. MAC 地址解析
- 17.12. 定制 ioctl 命令
- 17.13. 統計信息
- 17.14. 多播
- 17.15. 幾個其他細節
- 17.16. 快速參考
- 第 18 章 TTY 驅動
- 18.1. 一個小 TTY 驅動
- 18.2. tty_driver 函數指針
- 18.3. TTY 線路設置
- 18.4. ioctls 函數
- 18.5. TTY 設備的 proc 和 sysfs 處理
- 18.6. tty_driver 結構的細節
- 18.7. tty_operaions 結構的細節
- 18.8. tty_struct 結構的細節
- 18.9. 快速參考