# 前言
Java集合框架 (Java Collections Framework, JCF) 也稱容器,這里可以類比 C++ 中的 STL,在市面上似乎還沒能找到一本詳細介紹的書籍。在這里主要對如下部分進行源碼分析,及在面試中常見的問題。
例如,在阿里面試常問到的 HashMap 和 ConcurrentHashMap 原理等等。深入源碼分析是面試中必備的技能,通過本文的閱讀會對集合框架有更深一步的了解。
本文參考:
* [CarpenterLee/JCFInternals: 深入理解Java集合框架](https://github.com/CarpenterLee/JCFInternals)
* [crossoverJie/Java-Interview:?????Java related : basic, concurrent, algorithm](https://github.com/crossoverJie/Java-Interview)
* [Interview-Notebook/Java 容器.md at master · CyC2018/Interview-Notebook](https://github.com/CyC2018/Interview-Notebook/blob/master/notes/Java%20%E5%AE%B9%E5%99%A8.md)
# [](https://github.com/frank-lam/fullstack-tutorial/blob/master/notes/JavaArchitecture/02-Java%E9%9B%86%E5%90%88%E6%A1%86%E6%9E%B6.md#一概述)一、概述
Java集合框架提供了數據持有對象的方式,提供了對數據集合的操作。Java 集合框架位于`java.util`包下,主要有三個大類:**Collection(接口)**、**Map(接口)**、**集合工具類**。
## [](https://github.com/frank-lam/fullstack-tutorial/blob/master/notes/JavaArchitecture/02-Java%E9%9B%86%E5%90%88%E6%A1%86%E6%9E%B6.md#集合框架圖)集合框架圖
[](https://github.com/frank-lam/fullstack-tutorial/blob/master/notes/JavaArchitecture/assets/1535785576589.png)
## [](https://github.com/frank-lam/fullstack-tutorial/blob/master/notes/JavaArchitecture/02-Java%E9%9B%86%E5%90%88%E6%A1%86%E6%9E%B6.md#collection)Collection
* `ArrayList`:**線程不同步**。默認初始容量為 10,當數組大小不足時容量擴大為 1.5 倍。為追求效率,ArrayList 沒有實現同步(synchronized),如果需要多個線程并發訪問,用戶可以手動同步,也可使用 Vector 替代。
* `LinkedList`:**線程不同步**。**雙向鏈接實現**。LinkedList 同時實現了 List 接口和 Deque 接口,也就是說它既可以看作一個順序容器,又可以看作一個隊列(Queue),同時又可以看作一個棧(Stack)。這樣看來,LinkedList 簡直就是個全能冠軍。當你需要使用棧或者隊列時,可以考慮使用 LinkedList,一方面是因為 Java 官方已經聲明不建議使用 Stack 類,更遺憾的是,Java 里根本沒有一個叫做 Queue 的類(它是個接口名字)。關于棧或隊列,現在的首選是 ArrayDeque,它有著比 LinkedList(當作棧或隊列使用時)有著更好的性能。
* `Stack and Queue`:Java 里有一個叫做 Stack 的類,卻沒有叫做 Queue 的類(它是個接口名字)。當需要使用棧時,Java 已不推薦使用 Stack,而是推薦使用更高效的 ArrayDeque;既然 Queue 只是一個接口,當需要使用隊列時也就首選 ArrayDeque 了(次選是 LinkedList )。
* `Vector`:**線程同步**。默認初始容量為 10,當數組大小不足時容量擴大為 2 倍。它的同步是通過`Iterator`方法加`synchronized`實現的。
* `Stack`:**線程同步**。繼承自 Vector,添加了幾個方法來完成棧的功能。現在已經不推薦使用 Stack,在棧和隊列中有限使用 ArrayDeque,其次是 LinkedList。
* `TreeSet`:**線程不同步**,內部使用`NavigableMap`操作。默認元素 “自然順序” 排列,可以通過`Comparator`改變排序。TreeSet 里面有一個 TreeMap(適配器模式)
* `HashSet`:**線程不同步**,內部使用 HashMap 進行數據存儲,提供的方法基本都是調用 HashMap 的方法,所以兩者本質是一樣的。集合元素可以為 NULL。
* `Set`:Set 是一種不包含重復元素的 Collection,Set 最多只有一個 null 元素。Set 集合通常可以通過 Map 集合通過適配器模式得到。
* `PriorityQueue`:Java 中 PriorityQueue 實現了 Queue 接口,不允許放入 null 元素;其通過堆實現,具體說是通過完全二叉樹(complete binary tree)實現的**小頂堆**(任意一個非葉子節點的權值,都不大于其左右子節點的權值),也就意味著可以通過數組來作為 PriorityQueue 的底層實現。
* **優先隊列的作用是能保證每次取出的元素都是隊列中權值最小的**(Java 的優先隊列每次取最小元素,C++ 的優先隊列每次取最大元素)。這里牽涉到了大小關系,**元素大小的評判可以通過元素本身的自然順序(natural ordering),也可以通過構造時傳入的比較器**(*Comparator*,類似于 C++ 的仿函數)。
* `NavigableSet`:添加了搜索功能,可以對給定元素進行搜索:小于、小于等于、大于、大于等于,放回一個符合條件的最接近給定元素的 key。
* `EnumSet`:線程不同步。內部使用 Enum 數組實現,速度比`HashSet`快。**只能存儲在構造函數傳入的枚舉類的枚舉值**。
## [](https://github.com/frank-lam/fullstack-tutorial/blob/master/notes/JavaArchitecture/02-Java%E9%9B%86%E5%90%88%E6%A1%86%E6%9E%B6.md#map)Map
* `TreeMap`:線程不同步,基于**紅黑樹**(Red-Black tree)的 NavigableMap 實現,能夠把它保存的記錄根據鍵排序,默認是按鍵值的升序排序,也可以指定排序的比較器,當用 Iterator 遍歷 TreeMap 時,得到的記錄是排過序的。
* **TreeMap 底層通過紅黑樹(Red-Black tree)實現**,也就意味著`containsKey()`,`get()`,`put()`,`remove()`都有著`log(n)`的時間復雜度。其具體算法實現參照了《算法導論》。
* `HashTable`:**線程安全**,HashMap 的迭代器 (Iterator) 是`fail-fast`迭代器。**HashTable 不能存儲 NULL 的 key 和 value。**
* `HashMap`:線程不同步。根據`key`的`hashcode`進行存儲,內部使用靜態內部類`Node`的數組進行存儲,默認初始大小為 16,每次擴大一倍。當發生 Hash 沖突時,采用拉鏈法(鏈表)。JDK 1.8中:**當單個桶中元素個數大于等于8時,鏈表實現改為紅黑樹實現;當元素個數小于6時,變回鏈表實現。由此來防止hashCode攻擊。**
* Java?HashMap 采用的是沖突鏈表方式。
* HashMap 是 Hashtable 的輕量級實現,可以接受為 null 的鍵值 (key) 和值 (value),而 Hashtable 不允許。
* `LinkedHashMap`:**保存了記錄的插入順序**,在用 Iterator 遍歷 LinkedHashMap 時,先得到的記錄肯定是先插入的。也可以在構造時用帶參數,按照應用次數排序。在遍歷的時候會比 HashMap 慢,不過有種情況例外,當 HashMap 容量很大,實際數據較少時,遍歷起來可能會比 LinkedHashMap 慢,因為 LinkedHashMap 的遍歷速度只和實際數據有關,和容量無關,而 HashMap 的遍歷速度和他的容量有關。
* `WeakHashMap`:從名字可以看出它是某種?Map。它的特殊之處在于?WeakHashMap?里的 entry 可能會被 GC 自動刪除,即使程序員沒有調用`remove()`或者`clear()`方法。 WeakHashMap 的存儲結構類似于HashMap
* 既然有?WeekHashMap,是否有?WeekHashSet?呢?答案是沒有!不過 Java?Collections 工具類給出了解決方案,`Collections.newSetFromMap(Map<E,Boolean> map)`方法可以將任何?Map包裝成一個Set。
## [](https://github.com/frank-lam/fullstack-tutorial/blob/master/notes/JavaArchitecture/02-Java%E9%9B%86%E5%90%88%E6%A1%86%E6%9E%B6.md#工具類)工具類
* `Collections`、`Arrays`:集合類的一個工具類幫助類,其中提供了一系列靜態方法,用于對集合中元素進行排序、搜索以及線程安全等各種操作。
* `Comparable`、`Comparator`:一般是用于對象的比較來實現排序,兩者略有區別。
> * 類設計者沒有考慮到比較問題而沒有實現 Comparable 接口。這是我們就可以通過使用 Comparator,這種情況下,我們是不需要改變對象的。
> * 一個集合中,我們可能需要有多重的排序標準,這時候如果使用 Comparable 就有些捉襟見肘了,可以自己繼承 Comparator 提供多種標準的比較器進行排序。
**說明**:線程不同步的時候可以通過,Collections.synchronizedList() 方法來包裝一個線程同步方法
## [](https://github.com/frank-lam/fullstack-tutorial/blob/master/notes/JavaArchitecture/02-Java%E9%9B%86%E5%90%88%E6%A1%86%E6%9E%B6.md#通用實現)通用實現
:-: <table align="center"><tr><td colspan="2" rowspan="2" align="center" border="0"></td><th colspan="5" align="center">Implementations</th></tr><tr><th>Hash Table</th><th>Resizable Array</th><th>Balanced Tree</th><th>Linked List</th><th>Hash Table + Linked List</th></tr><tr><th rowspan="4">Interfaces</th><th>Set</th><td><tt>HashSet</tt></td><td></td><td><tt>TreeSet</tt></td><td></td><td><tt>LinkedHashSet</tt></td></tr><tr><th>List</th><td></td><td><tt>ArrayList</tt></td><td></td><td><tt>LinkedList</tt></td><td></td></tr><tr><th>Deque</th><td></td><td><tt>ArrayDeque</tt></td><td></td><td><tt>LinkedList</tt></td><td></td></tr><tr><th>Map</th><td><tt>HashMap</tt></td><td></td><td><tt>TreeMap</tt></td><td></td><td><tt>LinkedHashMap</tt></td></tr></table>
**參考資料:**
* [CarpenterLee/JCFInternals:深入理解Java集合框架](https://github.com/CarpenterLee/JCFInternals)
* [Java基礎-集合框架 - 掘金](https://juejin.im/post/5af86ac8f265da0ba063410e)
- 一.JVM
- 1.1 java代碼是怎么運行的
- 1.2 JVM的內存區域
- 1.3 JVM運行時內存
- 1.4 JVM內存分配策略
- 1.5 JVM類加載機制與對象的生命周期
- 1.6 常用的垃圾回收算法
- 1.7 JVM垃圾收集器
- 1.8 CMS垃圾收集器
- 1.9 G1垃圾收集器
- 2.面試相關文章
- 2.1 可能是把Java內存區域講得最清楚的一篇文章
- 2.0 GC調優參數
- 2.1GC排查系列
- 2.2 內存泄漏和內存溢出
- 2.2.3 深入理解JVM-hotspot虛擬機對象探秘
- 1.10 并發的可達性分析相關問題
- 二.Java集合架構
- 1.ArrayList深入源碼分析
- 2.Vector深入源碼分析
- 3.LinkedList深入源碼分析
- 4.HashMap深入源碼分析
- 5.ConcurrentHashMap深入源碼分析
- 6.HashSet,LinkedHashSet 和 LinkedHashMap
- 7.容器中的設計模式
- 8.集合架構之面試指南
- 9.TreeSet和TreeMap
- 三.Java基礎
- 1.基礎概念
- 1.1 Java程序初始化的順序是怎么樣的
- 1.2 Java和C++的區別
- 1.3 反射
- 1.4 注解
- 1.5 泛型
- 1.6 字節與字符的區別以及訪問修飾符
- 1.7 深拷貝與淺拷貝
- 1.8 字符串常量池
- 2.面向對象
- 3.關鍵字
- 4.基本數據類型與運算
- 5.字符串與數組
- 6.異常處理
- 7.Object 通用方法
- 8.Java8
- 8.1 Java 8 Tutorial
- 8.2 Java 8 數據流(Stream)
- 8.3 Java 8 并發教程:線程和執行器
- 8.4 Java 8 并發教程:同步和鎖
- 8.5 Java 8 并發教程:原子變量和 ConcurrentMap
- 8.6 Java 8 API 示例:字符串、數值、算術和文件
- 8.7 在 Java 8 中避免 Null 檢查
- 8.8 使用 Intellij IDEA 解決 Java 8 的數據流問題
- 四.Java 并發編程
- 1.線程的實現/創建
- 2.線程生命周期/狀態轉換
- 3.線程池
- 4.線程中的協作、中斷
- 5.Java鎖
- 5.1 樂觀鎖、悲觀鎖和自旋鎖
- 5.2 Synchronized
- 5.3 ReentrantLock
- 5.4 公平鎖和非公平鎖
- 5.3.1 說說ReentrantLock的實現原理,以及ReentrantLock的核心源碼是如何實現的?
- 5.5 鎖優化和升級
- 6.多線程的上下文切換
- 7.死鎖的產生和解決
- 8.J.U.C(java.util.concurrent)
- 0.簡化版(快速復習用)
- 9.鎖優化
- 10.Java 內存模型(JMM)
- 11.ThreadLocal詳解
- 12 CAS
- 13.AQS
- 0.ArrayBlockingQueue和LinkedBlockingQueue的實現原理
- 1.DelayQueue的實現原理
- 14.Thread.join()實現原理
- 15.PriorityQueue 的特性和原理
- 16.CyclicBarrier的實際使用場景
- 五.Java I/O NIO
- 1.I/O模型簡述
- 2.Java NIO之緩沖區
- 3.JAVA NIO之文件通道
- 4.Java NIO之套接字通道
- 5.Java NIO之選擇器
- 6.基于 Java NIO 實現簡單的 HTTP 服務器
- 7.BIO-NIO-AIO
- 8.netty(一)
- 9.NIO面試題
- 六.Java設計模式
- 1.單例模式
- 2.策略模式
- 3.模板方法
- 4.適配器模式
- 5.簡單工廠
- 6.門面模式
- 7.代理模式
- 七.數據結構和算法
- 1.什么是紅黑樹
- 2.二叉樹
- 2.1 二叉樹的前序、中序、后序遍歷
- 3.排序算法匯總
- 4.java實現鏈表及鏈表的重用操作
- 4.1算法題-鏈表反轉
- 5.圖的概述
- 6.常見的幾道字符串算法題
- 7.幾道常見的鏈表算法題
- 8.leetcode常見算法題1
- 9.LRU緩存策略
- 10.二進制及位運算
- 10.1.二進制和十進制轉換
- 10.2.位運算
- 11.常見鏈表算法題
- 12.算法好文推薦
- 13.跳表
- 八.Spring 全家桶
- 1.Spring IOC
- 2.Spring AOP
- 3.Spring 事務管理
- 4.SpringMVC 運行流程和手動實現
- 0.Spring 核心技術
- 5.spring如何解決循環依賴問題
- 6.springboot自動裝配原理
- 7.Spring中的循環依賴解決機制中,為什么要三級緩存,用二級緩存不夠嗎
- 8.beanFactory和factoryBean有什么區別
- 九.數據庫
- 1.mybatis
- 1.1 MyBatis-# 與 $ 區別以及 sql 預編譯
- Mybatis系列1-Configuration
- Mybatis系列2-SQL執行過程
- Mybatis系列3-之SqlSession
- Mybatis系列4-之Executor
- Mybatis系列5-StatementHandler
- Mybatis系列6-MappedStatement
- Mybatis系列7-參數設置揭秘(ParameterHandler)
- Mybatis系列8-緩存機制
- 2.淺談聚簇索引和非聚簇索引的區別
- 3.mysql 證明為什么用limit時,offset很大會影響性能
- 4.MySQL中的索引
- 5.數據庫索引2
- 6.面試題收集
- 7.MySQL行鎖、表鎖、間隙鎖詳解
- 8.數據庫MVCC詳解
- 9.一條SQL查詢語句是如何執行的
- 10.MySQL 的 crash-safe 原理解析
- 11.MySQL 性能優化神器 Explain 使用分析
- 12.mysql中,一條update語句執行的過程是怎么樣的?期間用到了mysql的哪些log,分別有什么作用
- 十.Redis
- 0.快速復習回顧Redis
- 1.通俗易懂的Redis數據結構基礎教程
- 2.分布式鎖(一)
- 3.分布式鎖(二)
- 4.延時隊列
- 5.位圖Bitmaps
- 6.Bitmaps(位圖)的使用
- 7.Scan
- 8.redis緩存雪崩、緩存擊穿、緩存穿透
- 9.Redis為什么是單線程、及高并發快的3大原因詳解
- 10.布隆過濾器你值得擁有的開發利器
- 11.Redis哨兵、復制、集群的設計原理與區別
- 12.redis的IO多路復用
- 13.相關redis面試題
- 14.redis集群
- 十一.中間件
- 1.RabbitMQ
- 1.1 RabbitMQ實戰,hello world
- 1.2 RabbitMQ 實戰,工作隊列
- 1.3 RabbitMQ 實戰, 發布訂閱
- 1.4 RabbitMQ 實戰,路由
- 1.5 RabbitMQ 實戰,主題
- 1.6 Spring AMQP 的 AMQP 抽象
- 1.7 Spring AMQP 實戰 – 整合 RabbitMQ 發送郵件
- 1.8 RabbitMQ 的消息持久化與 Spring AMQP 的實現剖析
- 1.9 RabbitMQ必備核心知識
- 2.RocketMQ 的幾個簡單問題與答案
- 2.Kafka
- 2.1 kafka 基礎概念和術語
- 2.2 Kafka的重平衡(Rebalance)
- 2.3.kafka日志機制
- 2.4 kafka是pull還是push的方式傳遞消息的?
- 2.5 Kafka的數據處理流程
- 2.6 Kafka的腦裂預防和處理機制
- 2.7 Kafka中partition副本的Leader選舉機制
- 2.8 如果Leader掛了的時候,follower沒來得及同步,是否會出現數據不一致
- 2.9 kafka的partition副本是否會出現腦裂情況
- 十二.Zookeeper
- 0.什么是Zookeeper(漫畫)
- 1.使用docker安裝Zookeeper偽集群
- 3.ZooKeeper-Plus
- 4.zk實現分布式鎖
- 5.ZooKeeper之Watcher機制
- 6.Zookeeper之選舉及數據一致性
- 十三.計算機網絡
- 1.進制轉換:二進制、八進制、十六進制、十進制之間的轉換
- 2.位運算
- 3.計算機網絡面試題匯總1
- 十四.Docker
- 100.面試題收集合集
- 1.美團面試常見問題總結
- 2.b站部分面試題
- 3.比心面試題
- 4.騰訊面試題
- 5.哈羅部分面試
- 6.筆記
- 十五.Storm
- 1.Storm和流處理簡介
- 2.Storm 核心概念詳解
- 3.Storm 單機版本環境搭建
- 4.Storm 集群環境搭建
- 5.Storm 編程模型詳解
- 6.Storm 項目三種打包方式對比分析
- 7.Storm 集成 Redis 詳解
- 8.Storm 集成 HDFS 和 HBase
- 9.Storm 集成 Kafka
- 十六.Elasticsearch
- 1.初識ElasticSearch
- 2.文檔基本CRUD、集群健康檢查
- 3.shard&replica
- 4.document核心元數據解析及ES的并發控制
- 5.document的批量操作及數據路由原理
- 6.倒排索引
- 十七.分布式相關
- 1.分布式事務解決方案一網打盡
- 2.關于xxx怎么保證高可用的問題
- 3.一致性hash原理與實現
- 4.微服務注冊中心 Nacos 比 Eureka的優勢
- 5.Raft 協議算法
- 6.為什么微服務架構中需要網關
- 0.CAP與BASE理論
- 十八.Dubbo
- 1.快速掌握Dubbo常規應用
- 2.Dubbo應用進階
- 3.Dubbo調用模塊詳解
- 4.Dubbo調用模塊源碼分析
- 6.Dubbo協議模塊