## 5.6.?鎖陷阱
多年使用鎖的經驗 -- 早于 Linux 的經驗 -- 已經表明加鎖可能是非常難于正確的. 管理并發是一個固有的技巧性的事情, 有很多出錯的方式. 在這一節, 我們快速看一下可能出錯的東西.
### 5.6.1.?模糊的規則
如同上面已經說過的, 一個正確的加鎖機制需要清晰和明確的規則. 當你創建一個可以被并發存取的資源時, 你應當定義哪個鎖將控制存取. 加鎖應當真正在開始處進行; 事后更改會是難的事情. 開始時花費的時間常常在調試時獲得回報.
當你編寫你的代碼, 你會毫無疑問遇到幾個函數需要存取通過一個特定鎖保護的結構. 在此, 你必須小心: 如果一個函數需要一個鎖并且接著調用另一個函數也試圖請求這個鎖, 你的代碼死鎖. 不論旗標還是自旋鎖都不允許一個持鎖者第 2 次請求鎖; 如果你試圖這樣做, 事情就簡單地完了.
為使的加鎖正確工作, 你不得不編寫一些函數, 假定它們的調用者已經獲取了相關的鎖. 常常地, 只有你的內部的, 靜態函數能夠這樣編寫; 從外部調用的函數必須明確處理加鎖. 當你編寫內部函數對加鎖做了假設, 方便自己(和其他使用你的代碼的人)并且明確記錄這些假設. 在幾個月后可能很難回來并記起是否你需要持有一個鎖來調用一個特殊函數.
在 sucll 的例子里, 采用的設計決定是要求所有的函數直接從系統調用里調用, 來請求應用到被存取的設備結構上的旗標. 所有的內部函數, 那些只是從其他 scull 函數里調用的, 可以因此假設旗標已經正確獲得.
### 5.6.2.?加鎖順序規則
在有大量鎖的系統中(并且內核在成為這樣一個系統), 一次需要持有多于一個鎖, 對代碼是不尋常的. 如果某類計算必須使用 2 個不同的資源進行, 每個有它自己的鎖, 常常沒有選擇只能獲取 2 個鎖.
獲得多個鎖可能是危險的, 然而. 如果你有 2 個鎖, 稱為 Lock1 和 Lock2, 代碼需要同時都獲取, 你有一個潛在的死鎖. 僅僅想象一個線程鎖住 Lock1 而另一個同時獲得 Lock2. 接著每個線程試圖得到它沒有的那個. 2 個線程都會死鎖.
這個問題的解決方法常常是簡單的: 當多個鎖必須獲得時, 它們應當一直以同樣順序獲得. 只要遵照這個慣例, 象上面描述的簡單死鎖能夠避免. 然而, 遵照加鎖順序規則是做比說難. 非常少見這樣的規則真正在任何地方被寫下. 常常你能做的最好的是看看別的代碼如何做的.
一些經驗規則能幫上忙. 如果你必須獲得一個對你的代碼來說的本地鎖(假如, 一個設備鎖), 以及一個屬于內核更中心部分的鎖, 先獲取你的. 如果你有一個旗標和自旋鎖的組合, 你必須, 當然, 先獲得旗標; 調用 down (可能睡眠) 在持有一個自旋鎖時是一個嚴重的錯誤. 但是最重要的, 盡力避免需要多于一個鎖的情況.
### 5.6.3.?細 -粗- 粒度加鎖
第一個支持多處理器系統的 Linux 內核是 2.0; 它只含有一個自旋鎖. 這個大內核鎖將整個內核變為一個大的臨界區; 在任何時候只有一個 CPU 能夠執行內核代碼. 這個鎖足夠好地解決了并發問題以允許內核開發者從事所有其他的開發 SMP 所包含的問題. 但是它不是擴充地很好. 甚至一個 2 個處理器的系統可能花費可觀數量的時間只是等待這個大內核鎖. 一個 4 個處理器的系統的性能甚至不接近 4 個獨立的機器的性能.
因此, 后續的內核發布已經包含了更細粒度的加鎖. 在 2.2 中, 一個自旋鎖控制對塊 I/O 子系統的存取; 另一個為網絡而工作, 等等. 一個現代的內核能包含幾千個鎖, 每個保護一個小的資源. 這種細粒度的加鎖可能對伸縮性是好的; 它允許每個處理器在它自己特定的任務上工作而不必競爭其他處理器使用的鎖. 很少人忘記大內核鎖.[[19](#)]
但是, 細粒度加鎖帶有開銷. 在有幾千個鎖的內核中, 很難知道你需要那個鎖 -- 以及你應當以什么順序獲取它們 -- 來進行一個特定的操作. 記住加鎖錯誤可能非常難發現; 更多的鎖提供了更多的機會使真正有害的加鎖 bug 鉆進內核中. 細粒度加鎖能帶來一定水平的復雜性, 長期來, 對內核的可維護性有一個大的, 不利的效果.
在一個設備驅動中加鎖常常是相對直接的; 你可以用一個鎖來涵蓋你做的所有東西, 或者你可以給你管理的每個設備創建一個鎖. 作為一個通用的規則, 你應當從相對粗的加鎖開始, 除非你有確實的理由相信競爭可能是一個問題. 忍住慫恿去過早地優化; 真實地性能約束常常表現在想不到的地方.
如果你確實懷疑鎖競爭在損壞性能, 你可能發現 lockmeter 工具有用. 這個補丁(從 http://oss.sgi.com/projects/lockmeter/ 可得到) 裝備內核來測量在鎖等待花費的時間. 通過看這個報告, 你能夠很快知道是否鎖競爭真的是問題.
[[19](#)] 這個鎖仍然存在于 2.6, 幾個它現在覆蓋內核非常小的部分. 如果你偶然發現一個 lock_kernel 調用, 你已找到了這個大內核鎖. 但是, 想都不要想在任何新代碼中使用它.
- Linux設備驅動第三版
- 第 1 章 設備驅動簡介
- 1.1. 驅動程序的角色
- 1.2. 劃分內核
- 1.3. 設備和模塊的分類
- 1.4. 安全問題
- 1.5. 版本編號
- 1.6. 版權條款
- 1.7. 加入內核開發社團
- 1.8. 本書的內容
- 第 2 章 建立和運行模塊
- 2.1. 設置你的測試系統
- 2.2. Hello World 模塊
- 2.3. 內核模塊相比于應用程序
- 2.4. 編譯和加載
- 2.5. 內核符號表
- 2.6. 預備知識
- 2.7. 初始化和關停
- 2.8. 模塊參數
- 2.9. 在用戶空間做
- 2.10. 快速參考
- 第 3 章 字符驅動
- 3.1. scull 的設計
- 3.2. 主次編號
- 3.3. 一些重要數據結構
- 3.4. 字符設備注冊
- 3.5. open 和 release
- 3.6. scull 的內存使用
- 3.7. 讀和寫
- 3.8. 使用新設備
- 3.9. 快速參考
- 第 4 章 調試技術
- 4.1. 內核中的調試支持
- 4.2. 用打印調試
- 4.3. 用查詢來調試
- 4.4. 使用觀察來調試
- 4.5. 調試系統故障
- 4.6. 調試器和相關工具
- 第 5 章 并發和競爭情況
- 5.1. scull 中的缺陷
- 5.2. 并發和它的管理
- 5.3. 旗標和互斥體
- 5.4. Completions 機制
- 5.5. 自旋鎖
- 5.6. 鎖陷阱
- 5.7. 加鎖的各種選擇
- 5.8. 快速參考
- 第 6 章 高級字符驅動操作
- 6.1. ioctl 接口
- 6.2. 阻塞 I/O
- 6.3. poll 和 select
- 6.4. 異步通知
- 6.5. 移位一個設備
- 6.6. 在一個設備文件上的存取控制
- 6.7. 快速參考
- 第 7 章 時間, 延時, 和延后工作
- 7.1. 測量時間流失
- 7.2. 獲知當前時間
- 7.3. 延后執行
- 7.4. 內核定時器
- 7.5. Tasklets 機制
- 7.6. 工作隊列
- 7.7. 快速參考
- 第 8 章 分配內存
- 8.1. kmalloc 的真實故事
- 8.2. 后備緩存
- 8.3. get_free_page 和其友
- 8.4. 每-CPU 的變量
- 8.5. 獲得大量緩沖
- 8.6. 快速參考
- 第 9 章 與硬件通訊
- 9.1. I/O 端口和 I/O 內存
- 9.2. 使用 I/O 端口
- 9.3. 一個 I/O 端口例子
- 9.4. 使用 I/O 內存
- 9.5. 快速參考
- 第 10 章 中斷處理
- 10.1. 準備并口
- 10.2. 安裝一個中斷處理
- 10.3. 前和后半部
- 10.4. 中斷共享
- 10.5. 中斷驅動 I/O
- 10.6. 快速參考
- 第 11 章 內核中的數據類型
- 11.1. 標準 C 類型的使用
- 11.2. 安排一個明確大小給數據項
- 11.3. 接口特定的類型
- 11.4. 其他移植性問題
- 11.5. 鏈表
- 11.6. 快速參考
- 第 12 章 PCI 驅動
- 12.1. PCI 接口
- 12.2. 回顧: ISA
- 12.3. PC/104 和 PC/104+
- 12.4. 其他的 PC 總線
- 12.5. SBus
- 12.6. NuBus 總線
- 12.7. 外部總線
- 12.8. 快速參考
- 第 13 章 USB 驅動
- 13.1. USB 設備基礎知識
- 13.2. USB 和 sysfs
- 13.3. USB 的 Urbs
- 13.4. 編寫一個 USB 驅動
- 13.5. 無 urb 的 USB 傳送
- 13.6. 快速參考
- 第 14 章 Linux 設備模型
- 14.1. Kobjects, Ksets 和 Subsystems
- 14.2. 低級 sysfs 操作
- 14.3. 熱插拔事件產生
- 14.4. 總線, 設備, 和驅動
- 14.5. 類
- 14.6. 集成起來
- 14.7. 熱插拔
- 14.8. 處理固件
- 14.9. 快速參考
- 第 15 章 內存映射和 DMA
- 15.1. Linux 中的內存管理
- 15.2. mmap 設備操作
- 15.3. 進行直接 I/O
- 15.4. 直接內存存取
- 15.5. 快速參考
- 第 16 章 塊驅動
- 16.1. 注冊
- 16.2. 塊設備操作
- 16.3. 請求處理
- 16.4. 一些其他的細節
- 16.5. 快速參考
- 第 17 章 網絡驅動
- 17.1. snull 是如何設計的
- 17.2. 連接到內核
- 17.3. net_device 結構的詳情
- 17.4. 打開與關閉
- 17.5. 報文傳送
- 17.6. 報文接收
- 17.7. 中斷處理
- 17.8. 接收中斷緩解
- 17.9. 連接狀態的改變
- 17.10. Socket 緩存
- 17.11. MAC 地址解析
- 17.12. 定制 ioctl 命令
- 17.13. 統計信息
- 17.14. 多播
- 17.15. 幾個其他細節
- 17.16. 快速參考
- 第 18 章 TTY 驅動
- 18.1. 一個小 TTY 驅動
- 18.2. tty_driver 函數指針
- 18.3. TTY 線路設置
- 18.4. ioctls 函數
- 18.5. TTY 設備的 proc 和 sysfs 處理
- 18.6. tty_driver 結構的細節
- 18.7. tty_operaions 結構的細節
- 18.8. tty_struct 結構的細節
- 18.9. 快速參考