# 0295. 數據流的中位數
## 題目地址(295. 數據流的中位數)
<https://leetcode-cn.com/problems/find-median-from-data-stream/>
## 題目描述
```
<pre class="calibre18">```
中位數是有序列表中間的數。如果列表長度是偶數,中位數則是中間兩個數的平均值。
例如,
[2,3,4] 的中位數是 3
[2,3] 的中位數是 (2 + 3) / 2 = 2.5
設計一個支持以下兩種操作的數據結構:
void addNum(int num) - 從數據流中添加一個整數到數據結構中。
double findMedian() - 返回目前所有元素的中位數。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
進階:
如果數據流中所有整數都在 0 到 100 范圍內,你將如何優化你的算法?
如果數據流中 99% 的整數都在 0 到 100 范圍內,你將如何優化你的算法?
```
```
## 前置知識
- 堆
- 隊列
## 公司
- 阿里
- 百度
- 字節
## 思路
這道題目是求動態數據的中位數,在 leetcode 難度為`hard`. 如果這道題是求靜態數據的中位數,我們用數組去存儲, 空間復雜度 O(1), 時間復雜度 O(1)
> 空間復雜度指的是除了存儲數據之外額外開辟的用于計算等任務的內存空間
代碼也比較簡單
```
<pre class="calibre18">```
<span class="hljs-function"><span class="hljs-keyword">function</span> <span class="hljs-title">findMedian</span>(<span class="hljs-params">a</span>) </span>{
<span class="hljs-keyword">return</span> a.length % <span class="hljs-params">2</span> === <span class="hljs-params">0</span>
? (a[a.length >> <span class="hljs-params">1</span>] + a[a.length >> (<span class="hljs-params">1</span> + <span class="hljs-params">1</span>)]) / <span class="hljs-params">2</span>
: a[a.length >> <span class="hljs-params">1</span>];
}
```
```
但是題目要求是動態數據, 那么是否可以每次添加數據的時候,都去排一次序呢? 假如我們每次插入都用`快速排序`進行排序的話,那么時間復雜度是 O(nlogn) + O(1)
> O(nlogn) 是排序的時間復雜度 O(1)是查詢中位數的時間復雜度
如果你用這種思路進行的話, 恐怕 leetcode 會超時。
那么如何優化呢? 答案是使用堆, Java, C++等語言都有`優先級隊列`中這種數據結構, 優先級隊列本質上就是一個堆。 關于堆和優先級隊列的關系,我會放在《數據結構和算法》部分講解。這里不贅述
如果借助堆這種數據結構, 就可以輕易實現了。
具體的做法是,建立兩個堆,這兩個堆需要滿足:
1. 大頂堆元素都比小頂堆小(由于堆的特點其實只要比較堆頂即可)
2. 大頂堆元素不小于小頂堆,且最多比小頂堆多一個元素
滿足上面兩個條件的話,如果想要找到中位數,就比較簡單了
- 如果兩個堆數量相等(本質是總數為偶數), 就兩個堆頂元素的平均數
- 如果兩個堆數量不相等(本質是總數為奇數), 就取大頂堆的堆頂元素
比如對于\[1,2,3\] 求中位數:

再比如對于\[1,2,3, 4\] 求中位數:

## 關鍵點解析
- 用兩個堆(一個大頂堆,一個小頂堆)來簡化時間復雜度
- 用優先級隊列簡化操作
> JavaScript 不像 Java, C++等語言都有`優先級隊列`中這種數據結構, 因此大家可以使用社區的實現 個人認為沒有非要糾結于優先級隊列怎么實現, 至少這道題不是考這個的 優先級隊列的實現個人認為已經超過了這道題想考察的范疇
>
> ## 代碼
如果不使用現成的`優先級隊列`這種數據結構,代碼可能是這樣的:
```
<pre class="calibre18">```
<span class="hljs-title">/**
* initialize your data structure here.
*/</span>
<span class="hljs-keyword">var</span> MedianFinder = <span class="hljs-function"><span class="hljs-keyword">function</span>(<span class="hljs-params"></span>) </span>{
<span class="hljs-keyword">this</span>.maxHeap = [];
<span class="hljs-keyword">this</span>.minHeap = [];
};
<span class="hljs-function"><span class="hljs-keyword">function</span> <span class="hljs-title">minHeapify</span>(<span class="hljs-params"></span>) </span>{
<span class="hljs-keyword">this</span>.minHeap.unshift(<span class="hljs-params">null</span>);
<span class="hljs-keyword">const</span> a = <span class="hljs-keyword">this</span>.minHeap;
<span class="hljs-title">// 為了方便大家理解,這里選用了粗暴的實現</span>
<span class="hljs-title">// 時間復雜度為O(n)</span>
<span class="hljs-title">// 其實可以降到O(logn), 具體細節我不想在這里講解和實現</span>
<span class="hljs-keyword">for</span> (<span class="hljs-keyword">let</span> i = a.length - <span class="hljs-params">1</span>; i >> <span class="hljs-params">1</span> > <span class="hljs-params">0</span>; i--) {
<span class="hljs-title">// 自下往上堆化</span>
<span class="hljs-keyword">if</span> (a[i] < a[i >> <span class="hljs-params">1</span>]) { <span class="hljs-title">// 如果子元素更小,則交換位置</span>
<span class="hljs-keyword">const</span> temp = a[i];
<span class="hljs-keyword">this</span>.minHeap[i] = a[i >> <span class="hljs-params">1</span>];
<span class="hljs-keyword">this</span>.minHeap[i >> <span class="hljs-params">1</span>] = temp;
}
}
<span class="hljs-keyword">this</span>.minHeap.shift(<span class="hljs-params">null</span>);
}
<span class="hljs-function"><span class="hljs-keyword">function</span> <span class="hljs-title">maxHeapify</span>(<span class="hljs-params"></span>) </span>{
<span class="hljs-keyword">this</span>.maxHeap.unshift(<span class="hljs-params">null</span>);
<span class="hljs-keyword">const</span> a = <span class="hljs-keyword">this</span>.maxHeap;
<span class="hljs-title">// 為了方便大家理解,這里選用了粗暴的實現</span>
<span class="hljs-title">// 時間復雜度為O(n)</span>
<span class="hljs-title">// 其實可以降到O(logn), 具體細節我不想在這里講解和實現</span>
<span class="hljs-keyword">for</span> (<span class="hljs-keyword">let</span> i = a.length - <span class="hljs-params">1</span>; i >> <span class="hljs-params">1</span> > <span class="hljs-params">0</span>; i--) {
<span class="hljs-title">// 自下往上堆化</span>
<span class="hljs-keyword">if</span> (a[i] > a[i >> <span class="hljs-params">1</span>]) { <span class="hljs-title">// 如果子元素更大,則交換位置</span>
<span class="hljs-keyword">const</span> temp = a[i];
<span class="hljs-keyword">this</span>.maxHeap[i] = a[i >> <span class="hljs-params">1</span>];
<span class="hljs-keyword">this</span>.maxHeap[i >> <span class="hljs-params">1</span>] = temp;
}
}
<span class="hljs-keyword">this</span>.maxHeap.shift(<span class="hljs-params">null</span>);
}
<span class="hljs-title">/**
* @param {number} num
* @return {void}
*/</span>
MedianFinder.prototype.addNum = <span class="hljs-function"><span class="hljs-keyword">function</span>(<span class="hljs-params">num</span>) </span>{
<span class="hljs-title">// 為了大家容易理解,這部分代碼寫的比較冗余</span>
<span class="hljs-title">// 插入</span>
<span class="hljs-keyword">if</span> (num >= (<span class="hljs-keyword">this</span>.minHeap[<span class="hljs-params">0</span>] || <span class="hljs-params">Number</span>.MIN_VALUE)) {
<span class="hljs-keyword">this</span>.minHeap.push(num);
} <span class="hljs-keyword">else</span> {
<span class="hljs-keyword">this</span>.maxHeap.push(num);
}
<span class="hljs-title">// 調整兩個堆的節點數量平衡</span>
<span class="hljs-title">// 使得大頂堆的數量最多大于小頂堆一個, 且一定不小于小頂堆數量</span>
<span class="hljs-keyword">if</span> (<span class="hljs-keyword">this</span>.maxHeap.length > <span class="hljs-keyword">this</span>.minHeap.length + <span class="hljs-params">1</span>) {
<span class="hljs-title">// 大頂堆的堆頂元素移動到小頂堆</span>
<span class="hljs-keyword">this</span>.minHeap.push(<span class="hljs-keyword">this</span>.maxHeap.shift());
}
<span class="hljs-keyword">if</span> (<span class="hljs-keyword">this</span>.minHeap.length > <span class="hljs-keyword">this</span>.maxHeap.length) {
<span class="hljs-title">// 小頂堆的堆頂元素移動到大頂堆</span>
<span class="hljs-keyword">this</span>.maxHeap.push(<span class="hljs-keyword">this</span>.minHeap.shift());
}
<span class="hljs-title">// 調整堆頂元素</span>
<span class="hljs-keyword">if</span> (<span class="hljs-keyword">this</span>.maxHeap[<span class="hljs-params">0</span>] > <span class="hljs-keyword">this</span>.minHeap[<span class="hljs-params">0</span>]) {
<span class="hljs-keyword">const</span> temp = <span class="hljs-keyword">this</span>.maxHeap[<span class="hljs-params">0</span>];
<span class="hljs-keyword">this</span>.maxHeap[<span class="hljs-params">0</span>] = <span class="hljs-keyword">this</span>.minHeap[<span class="hljs-params">0</span>];
<span class="hljs-keyword">this</span>.minHeap[<span class="hljs-params">0</span>] = temp;
}
<span class="hljs-title">// 堆化</span>
maxHeapify.call(<span class="hljs-keyword">this</span>);
minHeapify.call(<span class="hljs-keyword">this</span>);
};
<span class="hljs-title">/**
* @return {number}
*/</span>
MedianFinder.prototype.findMedian = <span class="hljs-function"><span class="hljs-keyword">function</span>(<span class="hljs-params"></span>) </span>{
<span class="hljs-keyword">if</span> ((<span class="hljs-keyword">this</span>.maxHeap.length + <span class="hljs-keyword">this</span>.minHeap.length) % <span class="hljs-params">2</span> === <span class="hljs-params">0</span>) {
<span class="hljs-keyword">return</span> (<span class="hljs-keyword">this</span>.minHeap[<span class="hljs-params">0</span>] + <span class="hljs-keyword">this</span>.maxHeap[<span class="hljs-params">0</span>]) / <span class="hljs-params">2</span>;
} <span class="hljs-keyword">else</span> {
<span class="hljs-keyword">return</span> <span class="hljs-keyword">this</span>.maxHeap[<span class="hljs-params">0</span>];
}
};
<span class="hljs-title">/**
* Your MedianFinder object will be instantiated and called as such:
* var obj = new MedianFinder()
* obj.addNum(num)
* var param_2 = obj.findMedian()
*/</span>
```
```
其中`minHeapify` 和 `maxHeapify` 的過程都有一個hack操作,就是:
```
<pre class="calibre18">```
<span class="hljs-keyword">this</span>.heap.unshift(<span class="hljs-params">null</span>);
<span class="hljs-title">// ....</span>
<span class="hljs-keyword">this</span>.heap.shift(<span class="hljs-params">null</span>);
```
```
其實就是為了存儲的數據從1開始,這樣方便計算。 即對于下標為i的元素, `i >> 1` 一定是父節點的下標。

> 這是因為我用滿二叉樹來存儲的堆
這個實現比較繁瑣,下面介紹一種優雅的方式,假設JS和Java和C++等語言一樣有`PriorityQueue`這種數據結構,那么我們實現就比較簡單了。
代碼:
> 關于PriorityQueue的實現,感興趣的可以看下 <https://github.com/janogonzalez/priorityqueuejs>
```
<pre class="calibre18">```
<span class="hljs-keyword">var</span> MedianFinder = <span class="hljs-function"><span class="hljs-keyword">function</span>(<span class="hljs-params"></span>) </span>{
<span class="hljs-keyword">this</span>.maxHeap = <span class="hljs-keyword">new</span> PriorityQueue((a, b) => a - b);
<span class="hljs-keyword">this</span>.minHeap = <span class="hljs-keyword">new</span> PriorityQueue((a, b) => b - a);
};
<span class="hljs-title">/**
* @param {number} num
* @return {void}
*/</span>
MedianFinder.prototype.addNum = <span class="hljs-function"><span class="hljs-keyword">function</span>(<span class="hljs-params">num</span>) </span>{
<span class="hljs-title">// 我們的目標就是建立兩個堆,一個大頂堆,一個小頂堆</span>
<span class="hljs-title">// 結合中位數的特點</span>
<span class="hljs-title">// 這兩個堆需要滿足:</span>
<span class="hljs-title">// 1. 大頂堆元素都比小頂堆小(由于堆的特點其實只要比較堆頂即可)</span>
<span class="hljs-title">// 2. 大頂堆元素不小于小頂堆,且最多比小頂堆多一個元素</span>
<span class="hljs-title">// 滿足上面兩個條件的話,如果想要找到中位數,就比較簡單了</span>
<span class="hljs-title">// 如果兩個堆數量相等(本質是總數為偶數), 就兩個堆頂元素的平均數</span>
<span class="hljs-title">// 如果兩個堆數量不相等(本質是總數為奇數), 就取大頂堆的堆頂元素</span>
<span class="hljs-title">// 問題如果保證滿足上述兩個特點</span>
<span class="hljs-title">// 1. 保證第一點</span>
<span class="hljs-keyword">this</span>.maxHeap.enq(num);
<span class="hljs-title">// 由于小頂堆的所有數都來自大頂堆的堆頂元素(最大值)</span>
<span class="hljs-title">// 因此可以保證第一點</span>
<span class="hljs-keyword">this</span>.minHeap.enq(<span class="hljs-keyword">this</span>.maxHeap.deq());
<span class="hljs-title">// 2. 保證第二點</span>
<span class="hljs-keyword">if</span> (<span class="hljs-keyword">this</span>.maxHeap.size() < <span class="hljs-keyword">this</span>.minHeap.size()){
<span class="hljs-keyword">this</span>.maxHeap.enq(<span class="hljs-keyword">this</span>.minHeap.deq());
}
};
<span class="hljs-title">/**
* @return {number}
*/</span>
MedianFinder.prototype.findMedian = <span class="hljs-function"><span class="hljs-keyword">function</span>(<span class="hljs-params"></span>) </span>{
<span class="hljs-keyword">if</span> (<span class="hljs-keyword">this</span>.maxHeap.size() == <span class="hljs-keyword">this</span>.minHeap.size()) <span class="hljs-keyword">return</span> (<span class="hljs-keyword">this</span>.maxHeap.peek() + <span class="hljs-keyword">this</span>.minHeap.peek()) / <span class="hljs-params">2.0</span>;
<span class="hljs-keyword">else</span> <span class="hljs-keyword">return</span> <span class="hljs-keyword">this</span>.maxHeap.peek();
};
<span class="hljs-title">/**
* Your MedianFinder object will be instantiated and called as such:
* var obj = new MedianFinder()
* obj.addNum(num)
* var param_2 = obj.findMedian()
*/</span>
```
```
- Introduction
- 第一章 - 算法專題
- 數據結構
- 基礎算法
- 二叉樹的遍歷
- 動態規劃
- 哈夫曼編碼和游程編碼
- 布隆過濾器
- 字符串問題
- 前綴樹專題
- 《貪婪策略》專題
- 《深度優先遍歷》專題
- 滑動窗口(思路 + 模板)
- 位運算
- 設計題
- 小島問題
- 最大公約數
- 并查集
- 前綴和
- 平衡二叉樹專題
- 第二章 - 91 天學算法
- 第一期講義-二分法
- 第一期講義-雙指針
- 第二期
- 第三章 - 精選題解
- 《日程安排》專題
- 《構造二叉樹》專題
- 字典序列刪除
- 百度的算法面試題 * 祖瑪游戲
- 西法的刷題秘籍】一次搞定前綴和
- 字節跳動的算法面試題是什么難度?
- 字節跳動的算法面試題是什么難度?(第二彈)
- 《我是你的媽媽呀》 * 第一期
- 一文帶你看懂二叉樹的序列化
- 穿上衣服我就不認識你了?來聊聊最長上升子序列
- 你的衣服我扒了 * 《最長公共子序列》
- 一文看懂《最大子序列和問題》
- 第四章 - 高頻考題(簡單)
- 面試題 17.12. BiNode
- 0001. 兩數之和
- 0020. 有效的括號
- 0021. 合并兩個有序鏈表
- 0026. 刪除排序數組中的重復項
- 0053. 最大子序和
- 0088. 合并兩個有序數組
- 0101. 對稱二叉樹
- 0104. 二叉樹的最大深度
- 0108. 將有序數組轉換為二叉搜索樹
- 0121. 買賣股票的最佳時機
- 0122. 買賣股票的最佳時機 II
- 0125. 驗證回文串
- 0136. 只出現一次的數字
- 0155. 最小棧
- 0167. 兩數之和 II * 輸入有序數組
- 0169. 多數元素
- 0172. 階乘后的零
- 0190. 顛倒二進制位
- 0191. 位1的個數
- 0198. 打家劫舍
- 0203. 移除鏈表元素
- 0206. 反轉鏈表
- 0219. 存在重復元素 II
- 0226. 翻轉二叉樹
- 0232. 用棧實現隊列
- 0263. 丑數
- 0283. 移動零
- 0342. 4的冪
- 0349. 兩個數組的交集
- 0371. 兩整數之和
- 0437. 路徑總和 III
- 0455. 分發餅干
- 0575. 分糖果
- 0874. 模擬行走機器人
- 1260. 二維網格遷移
- 1332. 刪除回文子序列
- 第五章 - 高頻考題(中等)
- 0002. 兩數相加
- 0003. 無重復字符的最長子串
- 0005. 最長回文子串
- 0011. 盛最多水的容器
- 0015. 三數之和
- 0017. 電話號碼的字母組合
- 0019. 刪除鏈表的倒數第N個節點
- 0022. 括號生成
- 0024. 兩兩交換鏈表中的節點
- 0029. 兩數相除
- 0031. 下一個排列
- 0033. 搜索旋轉排序數組
- 0039. 組合總和
- 0040. 組合總和 II
- 0046. 全排列
- 0047. 全排列 II
- 0048. 旋轉圖像
- 0049. 字母異位詞分組
- 0050. Pow(x, n)
- 0055. 跳躍游戲
- 0056. 合并區間
- 0060. 第k個排列
- 0062. 不同路徑
- 0073. 矩陣置零
- 0075. 顏色分類
- 0078. 子集
- 0079. 單詞搜索
- 0080. 刪除排序數組中的重復項 II
- 0086. 分隔鏈表
- 0090. 子集 II
- 0091. 解碼方法
- 0092. 反轉鏈表 II
- 0094. 二叉樹的中序遍歷
- 0095. 不同的二叉搜索樹 II
- 0096. 不同的二叉搜索樹
- 0098. 驗證二叉搜索樹
- 0102. 二叉樹的層序遍歷
- 0103. 二叉樹的鋸齒形層次遍歷
- 105. 從前序與中序遍歷序列構造二叉樹
- 0113. 路徑總和 II
- 0129. 求根到葉子節點數字之和
- 0130. 被圍繞的區域
- 0131. 分割回文串
- 0139. 單詞拆分
- 0144. 二叉樹的前序遍歷
- 0150. 逆波蘭表達式求值
- 0152. 乘積最大子數組
- 0199. 二叉樹的右視圖
- 0200. 島嶼數量
- 0201. 數字范圍按位與
- 0208. 實現 Trie (前綴樹)
- 0209. 長度最小的子數組
- 0211. 添加與搜索單詞 * 數據結構設計
- 0215. 數組中的第K個最大元素
- 0221. 最大正方形
- 0229. 求眾數 II
- 0230. 二叉搜索樹中第K小的元素
- 0236. 二叉樹的最近公共祖先
- 0238. 除自身以外數組的乘積
- 0240. 搜索二維矩陣 II
- 0279. 完全平方數
- 0309. 最佳買賣股票時機含冷凍期
- 0322. 零錢兌換
- 0328. 奇偶鏈表
- 0334. 遞增的三元子序列
- 0337. 打家劫舍 III
- 0343. 整數拆分
- 0365. 水壺問題
- 0378. 有序矩陣中第K小的元素
- 0380. 常數時間插入、刪除和獲取隨機元素
- 0416. 分割等和子集
- 0445. 兩數相加 II
- 0454. 四數相加 II
- 0494. 目標和
- 0516. 最長回文子序列
- 0518. 零錢兌換 II
- 0547. 朋友圈
- 0560. 和為K的子數組
- 0609. 在系統中查找重復文件
- 0611. 有效三角形的個數
- 0718. 最長重復子數組
- 0754. 到達終點數字
- 0785. 判斷二分圖
- 0820. 單詞的壓縮編碼
- 0875. 愛吃香蕉的珂珂
- 0877. 石子游戲
- 0886. 可能的二分法
- 0900. RLE 迭代器
- 0912. 排序數組
- 0935. 騎士撥號器
- 1011. 在 D 天內送達包裹的能力
- 1014. 最佳觀光組合
- 1015. 可被 K 整除的最小整數
- 1019. 鏈表中的下一個更大節點
- 1020. 飛地的數量
- 1023. 駝峰式匹配
- 1031. 兩個非重疊子數組的最大和
- 1104. 二叉樹尋路
- 1131.絕對值表達式的最大值
- 1186. 刪除一次得到子數組最大和
- 1218. 最長定差子序列
- 1227. 飛機座位分配概率
- 1261. 在受污染的二叉樹中查找元素
- 1262. 可被三整除的最大和
- 1297. 子串的最大出現次數
- 1310. 子數組異或查詢
- 1334. 閾值距離內鄰居最少的城市
- 1371.每個元音包含偶數次的最長子字符串
- 第六章 - 高頻考題(困難)
- 0004. 尋找兩個正序數組的中位數
- 0023. 合并K個升序鏈表
- 0025. K 個一組翻轉鏈表
- 0030. 串聯所有單詞的子串
- 0032. 最長有效括號
- 0042. 接雨水
- 0052. N皇后 II
- 0084. 柱狀圖中最大的矩形
- 0085. 最大矩形
- 0124. 二叉樹中的最大路徑和
- 0128. 最長連續序列
- 0145. 二叉樹的后序遍歷
- 0212. 單詞搜索 II
- 0239. 滑動窗口最大值
- 0295. 數據流的中位數
- 0301. 刪除無效的括號
- 0312. 戳氣球
- 0335. 路徑交叉
- 0460. LFU緩存
- 0472. 連接詞
- 0488. 祖瑪游戲
- 0493. 翻轉對
- 0887. 雞蛋掉落
- 0895. 最大頻率棧
- 1032. 字符流
- 1168. 水資源分配優化
- 1449. 數位成本和為目標值的最大數字
- 后序