2.4 解析Disruptor關系組裝 · 并發框架Disruptor介紹

# 解析Disruptor的依賴關系現在我已經講了 RingBuffer? 本身，如何從它讀取? 以及如何向它寫入?。從邏輯上來說，下一件要做的事情就是把所有的東西拼裝到在一起。我前面提到過多生產者的情況——他們通過 ProducerBarrier 保證寫入操作順序與可控。我也提到過簡單場景下的多消費者數據訪問。更多的消費者的場景會變得更加復雜，我們? 實現了一些聰明的機制允許多個消費者在訪問 Ring Buffer 的時候互相等待（依賴）。像很多應用里，有一連串的工作需要在實際執行業務邏輯之前完成 (happen before) —— 例如，在做任何操作之前，我們都必須先保證消息寫入磁盤。 Disruptor 論文? 和性能測試里包含了你可能想到的一些基本結構。我準備講一下其中最有趣的那個，這多半是因為我需要練習如何使用畫圖板。 ## 菱形結構 DiamondPath1P3CPerfTest? 展示了一個并不罕見的結構——獨立的一個生產者和三個消費者。最棘手的一點是：第三個消費者必須等待前兩個消費者處理完成后，才能開始工作。 ![](https://box.kancloud.cn/5a5c667fa846ddd584f9f28745cb9bb9_400x265.png) 消費者 C3 也許是你的業務邏輯。消費者 C1 可能在備份接收到的數據，而消費者 C2 可能在準備數據或者別的東西。 ## 用隊列實現菱形結構在一個 SEDA-風格的架構? 中，每個處理階段都會用隊列分開： ![](https://box.kancloud.cn/fce542391907163b001e71abac76ee5c_400x265.png) （為什么單詞 Queue 里必須有這么多 “e” 呢？這是我在畫這些圖時遇到的最麻煩的詞）。你也許從這里看到了問題的端倪：一條消息從 P1 傳輸到 C3 要完整的穿過四個隊列，每個隊列在消息進入隊列和取出隊列時都會產生消耗成本。 ## 用 Disruptor 實現菱形結構在 Disruptor? 的世界里，一切都由一個單獨的 Ring Buffer 管理： ![](https://box.kancloud.cn/bd427c2b12467d63d5d0b6a9a555ea1b_640x360.png) 這張圖看起來更復雜。不過所有的參與者都只依賴 Ring Buffer 作為一個單獨的聯結點，而且所有的交互都是基于 Barrier 對象與檢查依賴的目標序號來實現的。生產者這邊比較簡單，它是我在上文? 中描述過的單生產者模型。有趣的是，生產者并不需要關心所有的消費者。它只關心消費者 C3，如果消費者 C3 處理完了 Ring Buffer 的某一個節點，那么另外兩個消費者肯定也處理完了。因此，只要 C3 的位置向前移動，Ring Buffer 的后續節點就會空閑出來。管理消費者的依賴關系需要兩個 ConsumerBarrier 對象。第一個僅僅與 Ring Buffer 交互，C1 和 C2 消費者向它申請下一個可訪問節點。第二個 ConsumerBarrier 只知道消費者 C1 和 C2，它返回兩個消費者訪問過的消息序號中較小的那個。 ## Disruptor 怎樣實現消費者等待（依賴） Hmmm。我想需要一個例子。 ![](https://box.kancloud.cn/5049000b13f680e786e2391f5a349234_568x261.png) 我們從這個故事發生到一半的時候來看：生產者 P1 已經在 Ring Buffer 里寫到序號 22 了，消費者 C1 已經訪問和處理完了序號 21 之前的所有數據。消費者 C2 處理到了序號 18。消費者 C3，就是依賴其他消費者的那個，才處理到序號 15。生產者 P1 不能繼續向 RingBuffer 寫入數據了，因為序號 15 占據了我們想要寫入序號 23 的數據節點 (Slot)。 ![](https://box.kancloud.cn/6c2c1dfa883f7d2f34a906b33ee13fcb_568x279.png) （抱歉，我真的試過用其他顏色來代替紅色和綠色，但是別的都更容易混淆。）第一個 ConsumerBarrier（CB1）告訴 C1 和 C2 消費者可以去訪問序號 22 前面的所有數據，這是 Ring Buffer 中的最大序號。第二個 ConsumerBarrier (CB2) 不但會檢查 RingBuffer 的序號，也會檢查另外兩個消費者的序號并且返回它們之間的最小值。因此，三號消費者被告知可以訪問 Ring Buffer 里序號 18 前面的數據。注意這些消費者還是直接從 Ring Buffer 拿數據節點——并不是由 C1 和 C2 消費者把數據節點從 Ring Buffer 里取出再傳遞給 C3 消費者的。作為替代的是，由第二個 ConsumerBarrier 告訴 C3 消費者，在 RingBuffer 里的哪些節點可以安全的處理。這產生了一個問題——如果任何數據都來自于 Ring Buffer，那么 C3 消費者如何讀到前面兩個消費者處理完成的數據呢？如果 C3 消費者關心的只是先前的消費者是否已經完成它們的工作（例如，把數據復制到別的地方），那么這一切都沒有問題—— C3 消費者知道工作已完成就放心了。但是，如果 C3 消費者需要訪問先前的消費者的處理結果，它又從哪里去獲取呢？ ## 更新數據節點秘密在于把處理結果寫入 Ring Buffer 數據節點 (Entry) 本身。這樣，當 C3 消費者從 Ring Buffer 取出節點時，它已經填充好了 C3 消費者工作需要的所有信息。這里真正重要的地方是節點 (Entry) 對象的每一個字段應該只允許一個消費者寫入。這可以避免產生并發寫入沖突 (write-contention) 減慢了整個處理過程。 ![](https://box.kancloud.cn/1408d5261adf4eb72cedbede6ec4658c_291x157.png) 你可以在 DiamondPath1P3CPerfTest? 里看到這個例子—— FizzBuzzEntry? 有兩個字段：fizz 和 buzz。如果消費者是 Fizz Consumer, 它只寫入字段 fizz。如果是 Buzz Consumer, 它只寫入字段 buzz。第三個消費者 FizzBuzz，它只去讀這兩個字段但是不會做寫入，因為讀沒問題，不會引起爭用。 ## 一些實際的 Java 代碼這一切看起來都要比隊列實現更復雜。是的，它涉及到更多的內部協調。但是這些細節對于消費者和生產者是隱藏的，它們只和 Barrier 對象交互。訣竅在消費者結構里。上文例子中提到的菱形結構可以用下面的方法創建： ``` ConsumerBarrier consumerBarrier1 = ringBuffer.createConsumerBarrier(); BatchConsumer consumer1 = new BatchConsumer(consumerBarrier1, handler1); BatchConsumer consumer2 = new BatchConsumer(consumerBarrier1, handler2); ConsumerBarrier consumerBarrier2 = ringBuffer.createConsumerBarrier(consumer1, consumer2); BatchConsumer consumer3 = new BatchConsumer(consumerBarrier2, handler3); ProducerBarrier producerBarrier = ringBuffer.createProducerBarrier(consumer3); ``` ## 總結現在你知道了——如何關聯 Disruptor 與相互依賴（等待）的多個消費者。關鍵點是： - 使用多個 ConsumerBarrier 來管理消費者之間的依賴（等待）關系。 - 使用 ProducerBarrier 監視結構圖中最后一個消費者。 - 只允許一個消費者更新數據節點 (Entry) 的每一個獨立字段。更新：Adrian 寫了一個非常好的 DSL 工具讓拼接 Disruptor 更加簡單了。更新 2：注意 Disruptor 2.0 版使用了與本文不一樣的命名。如果你對類名感到困惑，請閱讀我的變更總結??。另外，Adrian 的 DSL 工具現在是 Disruptor 主干代碼的一部分了。