# [C#進階系列]專題二:你知道Dictionary查找速度為什么快嗎?
## 一、前言
在之前有一次面試中,被問到你了解Dictionary的內部實現機制嗎?當時只是簡單的了問答了:Dictionary的內部結構是哈希表,從而可以快速進行查找。但是對于更深一步了解就不清楚了。所以面試回來之后,就打算好好研究下Dictionary的源碼。所以也就有了這篇文章。
## 二、Dictionary源碼剖析
大家都知道,現在微軟已經開源了.NET Framework的源碼了,在線源碼查看地址為:[http://referencesource.microsoft.com/](http://referencesource.microsoft.com/)。通過查找可以找到.NET Framework類的源碼。下面我們就一起來看下Dictionary源碼。
## 2.1 添加元素
首先我們來查看下Dictionary.Add方法的實現。為了讓大家更好地實現,下面抽取了Dictionary源碼核心部分來進行分析,詳細的分析代碼如下所示:
```
// buckets是哈希表,用來存放Key的Hash值
// entries用來存放元素列表
// count是元素數量
private void Insert(TKey key, TValue value, bool add)
{
if (key == null)
{
throw new ArgumentNullException(key.ToString());
}
// 首先分配buckets和entries的空間
if (buckets == null) Initialize(0);
int hashCode = comparer.GetHashCode(key) & 0x7FFFFFFF; // 計算key值對應的哈希值(HashCode)
int targetBucket = hashCode % buckets.Length; // 對哈希值求余,獲得需要對哈希表進行賦值的位置
#if FEATURE_RANDOMIZED_STRING_HASHING
int collisionCount = 0;
#endif
// 處理沖突的處理邏輯
for (int i = buckets[targetBucket]; i >= 0; i = entries[i].next)
{
if (entries[i].hashCode == hashCode && comparer.Equals(entries[i].key, key))
{
if (add)
{
throw new ArgumentNullException();
}
entries[i].value = value;
version++;
return;
}
#if FEATURE_RANDOMIZED_STRING_HASHING
collisionCount++;
#endif
}
int index; // index記錄了元素在元素列表中的位置
if (freeCount > 0)
{
index = freeList;
freeList = entries[index].next;
freeCount--;
}
else
{
// 如果哈希表存放哈希值已滿,則重新從primers數組中取出值來作為哈希表新的大小
if (count == entries.Length)
{
Resize();
targetBucket = hashCode % buckets.Length;
}
// 大小如果沒滿的邏輯
index = count;
count++;
}
// 對元素列表進行賦值
entries[index].hashCode = hashCode;
entries[index].next = buckets[targetBucket];
entries[index].key = key;
entries[index].value = value;
// 對哈希表進行賦值
buckets[targetBucket] = index;
version++;
#if FEATURE_RANDOMIZED_STRING_HASHING
if(collisionCount > HashHelpers.HashCollisionThreshold && HashHelpers.IsWellKnownEqualityComparer(comparer))
{
comparer = (IEqualityComparer<TKey>) HashHelpers.GetRandomizedEqualityComparer(comparer);
Resize(entries.Length, true);
}
#endif
}
```
下面以一個實際的添加例子來具體分析下上面的添加元素代碼,從而更好地理解Add方法的實現原理。
當添加第一個元素時,此時會分配哈希表buckets數組和entries數組的空間和初始大小為3,分配完成之后,會計算添加元素key值的哈希值,哈希值的計算由具體的哈希算法來實現的,假設1的哈希值為9的話,此時targetBucket = 9%buckets.Length(3)的值為0,index的值為0,則第一個元素存放在entries列表中的第一個位置,最后對哈希表進行賦值,此時賦值的位置為第0個位置,其值為index的值,所以為0,插入第一個元素后Dictionary的內部結構如下所示:

后面添加元素的過程依次類推。其原理就是,buckets記錄了元素的在元素列表的存儲位置,也就相當于一個映射列表。在查找的時候,就可以通過key值的哈希值來與buckets數組長度求余來獲得元素在元素列表中的索引,這樣就可以快速定位元素的位置,從而獲得元素的key對應的Value值。如上面的例子中,如果想找到key值為1對應的Value值時,此時計算1的哈希值為9,然后對buckets數組長度求余,此時獲得的值正是0,這樣就可以直接從entries[0].Value的方式來獲取對應的Value的值,這也就是Dictionary能完成快速查找的實現原理。后面會通過Dictionary內部的查找源碼來證實上面分析的過程。
## 2.2 解決沖突
在添加元素過程中,有一個很重要的問題,如果產生沖突怎么辦?即如果我后面需要插入的一個元素(假設這個值為11吧)的key值的哈希值也為6,此時targetBucket的值也是為0,但元素列表中0的位置已經存放了元素了,這樣就出現了沖突,那Dictionary是怎樣處理這個沖突的呢?處理沖突的方法有很多種,Dictionary處理的方式是鏈接法。Dictionary會把發生沖突的元素鏈接之前元素的后面,通過next屬性來指定沖突關系。此時Dictionary內部結構如下圖所示:

## 三、Dictionary如何實現快速查找呢?
針對于Dictionary實現快速查找的原因,在上面我們已經做了一個推斷了,下面通過Dictionary內部的代碼實現來驗證下,具體的查找代碼如下所示:
```
public TValue this[TKey key]
{
get
{
int i = FindEntry(key);
// 通過元素所在存在的位置直接獲取其對應的Value
if (i >= 0) return entries[i].value;
throw new KeyNotFoundException();
return default(TValue);
}
set
{
Insert(key, value, false);
}
}
private int FindEntry(TKey key)
{
if (key == null)
{
throw new ArgumentNullException();
}
if (buckets != null)
{
// 獲得Key值對應的哈希值
int hashCode = comparer.GetHashCode(key) & 0x7FFFFFFF;
// 查找元素在元素列表中的位置,如果沒有沖突的情況下,此時查找速度為O(1),存在沖突的情況下為O(N),N為存在沖突的次數
for (int i = buckets[hashCode % buckets.Length]; i >= 0; i = entries[i].next)
{
if (entries[i].hashCode == hashCode && comparer.Equals(entries[i].key, key)) return i;
}
}
return -1;
}
```
通過代碼可以看出,我們之前的分析是完成正確的。從中可以明白:Dictionary之所以能實現快速查找元素,其內部使用哈希表來存儲元素對應的位置,然后我們可以通過哈希值快速地從哈希表中定位元素所在的位置索引,從而快速獲取到key對應的Value值。
## 四、總結
可以說,Dictionary的實現原理也是一種空間換時間的思路,多使用一個buckets的存儲空間來存儲元素的位置,從而來提升查找速度。
接下來,我們新開一個領域驅動設計系列,還請大家多多拍磚。
本文所有源碼下載:[DictonaryInDepth.zip](http://files.cnblogs.com/files/zhili/DictonaryInDepth.zip)
- C# 基礎知識系列
- C# 基礎知識系列 專題一:深入解析委托——C#中為什么要引入委托
- C# 基礎知識系列 專題二:委托的本質論
- C# 基礎知識系列 專題三:如何用委托包裝多個方法——委托鏈
- C# 基礎知識系列 專題四:事件揭秘
- C# 基礎知識系列 專題五:當點擊按鈕時觸發Click事件背后發生的事情
- C# 基礎知識系列 專題六:泛型基礎篇——為什么引入泛型
- C# 基礎知識系列 專題七: 泛型深入理解(一)
- C# 基礎知識系列 專題八: 深入理解泛型(二)
- C# 基礎知識系列 專題九: 深入理解泛型可變性
- C#基礎知識系列 專題十:全面解析可空類型
- C# 基礎知識系列 專題十一:匿名方法解析
- C#基礎知識系列 專題十二:迭代器
- C#基礎知識 專題十三:全面解析對象集合初始化器、匿名類型和隱式類型
- C# 基礎知識系列 專題十四:深入理解Lambda表達式
- C# 基礎知識系列 專題十五:全面解析擴展方法
- C# 基礎知識系列 專題十六:Linq介紹
- C#基礎知識系列 專題十七:深入理解動態類型
- 你必須知道的異步編程 C# 5.0 新特性——Async和Await使異步編程更簡單
- 全面解析C#中參數傳遞
- C#基礎知識系列 全面解析C#中靜態與非靜態
- C# 基礎知識系列 C#中易混淆的知識點
- C#進階系列
- C#進階系列 專題一:深入解析深拷貝和淺拷貝
- C#進階系列 專題二:你知道Dictionary查找速度為什么快嗎?
- C# 開發技巧系列
- C# 開發技巧系列 使用C#操作Word和Excel程序
- C# 開發技巧系列 使用C#操作幻燈片
- C# 開發技巧系列 如何動態設置屏幕分辨率
- C# 開發技巧系列 C#如何實現圖片查看器
- C# 開發技巧 如何防止程序多次運行
- C# 開發技巧 實現屬于自己的截圖工具
- C# 開發技巧 如何使不符合要求的元素等于離它最近的一個元素
- C# 線程處理系列
- C# 線程處理系列 專題一:線程基礎
- C# 線程處理系列 專題二:線程池中的工作者線程
- C# 線程處理系列 專題三:線程池中的I/O線程
- C# 線程處理系列 專題四:線程同步
- C# 線程處理系列 專題五:線程同步——事件構造
- C# 線程處理系列 專題六:線程同步——信號量和互斥體
- C# 多線程處理系列專題七——對多線程的補充
- C#網絡編程系列
- C# 網絡編程系列 專題一:網絡協議簡介
- C# 網絡編程系列 專題二:HTTP協議詳解
- C# 網絡編程系列 專題三:自定義Web服務器
- C# 網絡編程系列 專題四:自定義Web瀏覽器
- C# 網絡編程系列 專題五:TCP編程
- C# 網絡編程系列 專題六:UDP編程
- C# 網絡編程系列 專題七:UDP編程補充——UDP廣播程序的實現
- C# 網絡編程系列 專題八:P2P編程
- C# 網絡編程系列 專題九:實現類似QQ的即時通信程序
- C# 網絡編程系列 專題十:實現簡單的郵件收發器
- C# 網絡編程系列 專題十一:實現一個基于FTP協議的程序——文件上傳下載器
- C# 網絡編程系列 專題十二:實現一個簡單的FTP服務器
- C# 互操作性入門系列
- C# 互操作性入門系列(一):C#中互操作性介紹
- C# 互操作性入門系列(二):使用平臺調用調用Win32 函數
- C# 互操作性入門系列(三):平臺調用中的數據封送處理
- C# 互操作性入門系列(四):在C# 中調用COM組件
- CLR
- 談談: String 和StringBuilder區別和選擇
- 談談:程序集加載和反射
- 利用反射獲得委托和事件以及創建委托實例和添加事件處理程序
- 談談:.Net中的序列化和反序列化
- C#設計模式
- UML類圖符號 各種關系說明以及舉例
- C#設計模式(1)——單例模式
- C#設計模式(2)——簡單工廠模式
- C#設計模式(3)——工廠方法模式
- C#設計模式(4)——抽象工廠模式
- C#設計模式(5)——建造者模式(Builder Pattern)
- C#設計模式(6)——原型模式(Prototype Pattern)
- C#設計模式(7)——適配器模式(Adapter Pattern)
- C#設計模式(8)——橋接模式(Bridge Pattern)
- C#設計模式(9)——裝飾者模式(Decorator Pattern)
- C#設計模式(10)——組合模式(Composite Pattern)
- C#設計模式(11)——外觀模式(Facade Pattern)
- C#設計模式(12)——享元模式(Flyweight Pattern)
- C#設計模式(13)——代理模式(Proxy Pattern)
- C#設計模式(14)——模板方法模式(Template Method)
- C#設計模式(15)——命令模式(Command Pattern)
- C#設計模式(16)——迭代器模式(Iterator Pattern)
- C#設計模式(17)——觀察者模式(Observer Pattern)
- C#設計模式(18)——中介者模式(Mediator Pattern)
- C#設計模式(19)——狀態者模式(State Pattern)
- C#設計模式(20)——策略者模式(Stragety Pattern)
- C#設計模式(21)——責任鏈模式
- C#設計模式(22)——訪問者模式(Vistor Pattern)
- C#設計模式(23)——備忘錄模式(Memento Pattern)
- C#設計模式總結
- WPF快速入門系列
- WPF快速入門系列(1)——WPF布局概覽
- WPF快速入門系列(2)——深入解析依賴屬性
- WPF快速入門系列(3)——深入解析WPF事件機制
- WPF快速入門系列(4)——深入解析WPF綁定
- WPF快速入門系列(5)——深入解析WPF命令
- WPF快速入門系列(6)——WPF資源和樣式
- WPF快速入門系列(7)——深入解析WPF模板
- WPF快速入門系列(8)——MVVM快速入門
- WPF快速入門系列(9)——WPF任務管理工具實現
- ASP.NET 開發
- ASP.NET 開發必備知識點(1):如何讓Asp.net網站運行在自定義的Web服務器上
- ASP.NET 開發必備知識點(2):那些年追過的ASP.NET權限管理
- ASP.NET中實現回調
- 跟我一起學WCF
- 跟我一起學WCF(1)——MSMQ消息隊列
- 跟我一起學WCF(2)——利用.NET Remoting技術開發分布式應用
- 跟我一起學WCF(3)——利用Web Services開發分布式應用
- 跟我一起學WCF(3)——利用Web Services開發分布式應用
- 跟我一起學WCF(4)——第一個WCF程序
- 跟我一起學WCF(5)——深入解析服務契約 上篇
- 跟我一起學WCF(6)——深入解析服務契約 下篇
- 跟我一起學WCF(7)——WCF數據契約與序列化詳解
- 跟我一起學WCF(8)——WCF中Session、實例管理詳解
- 跟我一起學WCF(9)——WCF回調操作的實現
- 跟我一起學WCF(10)——WCF中事務處理
- 跟我一起學WCF(11)——WCF中隊列服務詳解
- 跟我一起學WCF(12)——WCF中Rest服務入門
- 跟我一起學WCF(13)——WCF系列總結
- .NET領域驅動設計實戰系列
- .NET領域驅動設計實戰系列 專題一:前期準備之EF CodeFirst
- .NET領域驅動設計實戰系列 專題二:結合領域驅動設計的面向服務架構來搭建網上書店
- .NET領域驅動設計實戰系列 專題三:前期準備之規約模式(Specification Pattern)
- .NET領域驅動設計實戰系列 專題四:前期準備之工作單元模式(Unit Of Work)
- .NET領域驅動設計實戰系列 專題五:網上書店規約模式、工作單元模式的引入以及購物車的實現
- .NET領域驅動設計實戰系列 專題六:DDD實踐案例:網上書店訂單功能的實現
- .NET領域驅動設計實戰系列 專題七:DDD實踐案例:引入事件驅動與中間件機制來實現后臺管理功能
- .NET領域驅動設計實戰系列 專題八:DDD案例:網上書店分布式消息隊列和分布式緩存的實現
- .NET領域驅動設計實戰系列 專題九:DDD案例:網上書店AOP和站點地圖的實現
- .NET領域驅動設計實戰系列 專題十:DDD擴展內容:全面剖析CQRS模式實現
- .NET領域驅動設計實戰系列 專題十一:.NET 領域驅動設計實戰系列總結