# Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
> 原文: [http://highscalability.com/blog/2014/4/28/how-disqus-went-realtime-with-165k-messages-per-second-and-l.html](http://highscalability.com/blog/2014/4/28/how-disqus-went-realtime-with-165k-messages-per-second-and-l.html)

*這是關于[的 Disqus 更新:它仍然是實時的,但是 Go 拆除了 Python](http://highscalability.com/blog/2014/5/7/update-on-disqus-its-still-about-realtime-but-go-demolishes.html) 。*
您如何向 Web 規模應用程序添加實時功能? 這就是 [Adam Hitchcock](https://www.linkedin.com/in/adamhitchcock) ,在 Disqus 上,Disqus 的一名軟件工程師在精彩的演講中談到:[使 DISQUS Realtime](https://www.youtube.com/watch?v=5A5Iw9z6z2s) ([幻燈片](https://speakerdeck.com/pyconslides/scaling-realtime-at-disqus-by-adam-hitchcock))。
Disqus 必須采用他們的評論系統并為其添加實時功能。 在談話之時(2013 年),他們每月只有 10 億的唯一身份訪問者,這并非易事。
Disqus 開發的是一種稱為“實時”的實時評論系統,該系統經過測試可處理 150 萬個并發連接的用戶,每秒 45,000 個新連接,每秒 165,000 條消息,并且端到端的延遲少于 0.2 秒。
評論系統的本質是它受 IO 約束并且具有很高的扇出度,這是評論的傳入,必須將其發送給許多讀者。 這個問題與 Twitter 必須解決的[非常相似。](http://highscalability.com/blog/2013/7/8/the-architecture-twitter-uses-to-deal-with-150m-active-users.html)
Disqus 的解決方案及其解決之道非常有趣。 他們嘗試了不同的體系結構,但選擇了基于 Python,Django,Nginx Push Stream Module 和 Thoonk 構建的解決方案,這些解決方案均通過靈活的管道體系結構進行了統一。 在此過程中,我們能夠大幅減少其服務器數量并輕松處理高流量負載。
在演講的某一時刻,亞當問管道式架構是否是一個好的架構? 對于 Disqus 消息,通過一系列轉換進行過濾是完美的選擇。 這是一個非常古老的想法。 Unix 系統 5 長期以來具有 [Streams 功能](http://infohost.nmt.edu/~eweiss/222_book/222_book/0201433079/ch14lev1sec4.html)用于創建靈活的管道體系結構。 這是組織代碼的一種非常靈活而強大的方式。
因此,讓我們看看 Disqus 如何發展其實時評論架構并在此過程中創建新舊事物。
## 統計資料
* 當前:
* 300 萬個網站使用 Disqus 作為其評論系統
* 每月有十億人參與對話
* 每月有 2000 萬條評論
* 截至 2013 年 3 月:
* 每月有十億獨立訪客。
* 18 位工程師
## 平臺
* Python(Disqus 是一項服務,用 Python 和其他語言編寫)
* Django
* [Thoonk Redis 隊列](http://blog.thoonk.com/) -Redis 之上的隊列庫。
* Nginx [推流模塊](http://wiki.nginx.org/HttpPushStreamModule) -用于 Nginx 設置的純流 http 推技術。 Comet 變得簡單且真正可擴展。
* [Gevent](http://www.gevent.org/) -基于協程的 Python 網絡庫,該庫使用 greenlet 在 libev 事件循環的頂部提供高級同步 API。
* 使用 EventSource 的長輪詢(在瀏覽器中)
* [Sentry](https://github.com/getsentry/sentry) -一個與平臺無關的實時錯誤記錄和聚合平臺。
* [縮放比例](https://github.com/Cue/scales) -跟蹤服務器狀態和統計信息,使您可以查看服務器的運行狀況。
* 在原始金屬(而非 EC2)上運行。
## 架構
* 實時動機:
* **參與度** 。 評論的實時分發鼓勵用戶在頁面上停留更長的時間。 實時評論后的人比以前多。
* **買賣數據** 。 從全局評論流中創建消防軟管產品。
* 舊的實時系統:
* 用 Django 編寫的 Disqus 應用程序將通過許多鍵發布到內存緩存:Forum:id,thread:id,user:id,post:id。 也許將來有人會覺得有趣。 由于 pub / sub 的價格便宜,因此可以進行以后的創新。
* 前端客戶端每隔幾秒鐘會輪詢一次內存緩存密鑰。
* 客戶端將顯示任何新評論。
* 問題:根本沒有縮放。 一次只有 10%的網絡可以使用該產品。
* 第一種解決方法:
* 新帖-> Disqus-Redis [發布/訂閱](http://redis.io/topics/pubsub) -> [燒瓶](http://en.wikipedia.org/wiki/Flask_(web_framework)) (一個 Web 框架)前端集群<-HAProxy <-客戶端。
* 客戶端將連接到 HAProxy。 HAProxy 用于處理數百萬個連接。
* 問題:由于燒瓶計算機正在執行冗余工作,因此它們很快耗盡了 CPU。 如果兩個訂戶正在偵聽同一線程,則該消息將被格式化兩次。
* 第二種方法:
* 已創建后端服務器以執行重復數據刪除格式化工作。
* 新流程:新帖子-> Disqus-> redis 隊列->“ python 膠” Gevent 格式服務器(2 個服務器用于冗余)-> redis 發布/訂閱(6 個服務器) -> Flask FE(前端)群集(14 個大服務器)<-HA 代理(5 個服務器)<-客戶端
* 效果很好。 除了擴展外,它使用的服務器越來越多,尤其是 Flask 集群。 Redis 發布/訂閱集群也迅速增長。
## 第三種制勝法則:
* 使用 [流水線架構](http://www.cs.sjsu.edu/~pearce/modules/patterns/distArch/pipeline.htm) ,其中消息在過濾器作用下從一個隊列傳遞到另一個隊列。
* 切換到 Nginx +推送流模塊。 這取代了 redis pub / sub,flask 服務器和 HAProxy 集群。
* 新流程如下所示:新帖子-> Disqus-> redis 隊列->“ python 膠” Gevent 格式服務器(2 個服務器)-> http 帖子-> nginx pub 端點- > nginx +推送流模塊(5 個服務器)<-客戶端
* 僅使用了 redis 的 pub / sub,并且 nginx 推送流模塊支持相同的功能。
* 由于內核中的網絡內存限制,需要 5 個推送流服務器。 這是一個套接字分配問題,即有很多套接字打開。 否則可以在 3 臺服務器上運行,包括冗余。
* 流程中的 Disqus 部分是 Django Web 應用程序,它使用 post_save 和 post_delete 掛鉤將內容放入 thunkk 隊列中。 這些掛鉤對于生成實時數據通知非常有用。
* Thoonk 是 Redis 之上的隊列庫。
* 他們已經有了 thunkk,因此可以使用它來代替分解 RabbitMQ 計算機的 HA 集群。 最終真的很喜歡它。
* Thoonk 被實現為狀態機,因此很容易查看已聲明或未聲明哪些作業,等等。使故障后的清除變得容易。
* 由于使用 zset 將隊列存儲在 Redis 中,因此可以在隊列上執行范圍查詢。 例如,您可以詢問哪些消息已被處理,并采取適當的措施,因此對實施端到端的確認很有用。
* python 膠水程序。
* 收聽 thoonk 隊列。
* 為客戶端執行所有格式化和計算。 包括清潔和格式化數據。
* 最初是在 Flask 群集中進行格式化的,但是這占用了太多 CPU。
* 發現用 gzip 壓縮單個郵件并不成功,因為郵件中沒有足夠的冗余來從壓縮中節省足夠的錢。
* 對于這樣的 IO 綁定系統,Gevent 的運行速度非常快。
* 看門狗確保 [綠色](https://pypi.python.org/pypi/greenlet) 始終在運行,也就是說,始終在執行工作。 Greenlet 是沒有隱式調度的微線程: [協程](http://en.wikipedia.org/wiki/Coroutine) 。
* 監視器監視許多故障,然后在觀察到時發出警報。
* 流水線架構。
* python 膠水程序的結構是一個數據管道,數據必須經過幾個階段:解析,計算,發布到另一個地方。 這些在 greenlet 中運行。
* [Mixins](http://stackoverflow.com/questions/533631/what-is-a-mixin-and-why-are-they-useful) 用于實現階段功能:JSONParserMixin,AnnomizeDataMixin,SuperSecureEncryptDataMixin,HTTPPublisher,FilePublisher。
* 這個想法是組成管道。 一條消息將從 thunkk 中傳出并通過以下管道運行:JSONAnnonHTTPPipeline,JSONSecureHTTPPipeline,JSONAnnonFilePipeline。
* 管道可以共享它們的大多數功能,但是仍然是專門的。 啟用新功能時很棒,您可以創建一個新的管線階段,創建一個新的管線,并使舊管線與新管線并排運行。 新舊功能愉快地共存。
* 測試也可以在管道中進行。 要運行測試,只需在管道中插入 filter / module / mixin 即可運行測試。
* 容易推斷。 每個 mixin 都很容易理解。 它做一件事。 項目中的新工程師使用這種方法設計的系統要容易得多。
* Nginx 推送流
* 處理系統的發布/訂閱方面和 Web 服務方面。 并且都很好。
* 最近通過 5 臺服務器吸引了 200 萬并發用戶。 CPU 使用率低于 15%時,每臺計算機的用戶數量達到約 950K 的峰值,每臺計算機達到 40 MB /秒。
* 持續將數據寫入套接字以測試套接字是否仍然打開。 如果不是,則將其清理以為下一次連接騰出空間。
* 配置是發布端點和訂閱端點,以及如何在它們之間映射數據。
* 內置良好的監視功能,可通過推送流狀態端點進行訪問。
* 模塊中的內存泄漏需要全天滾動重啟,尤其是當每個進程有數十萬個并發連接時。 瀏覽器將在斷開連接時迅速知道,因此它將重新啟動并重新連接。
* 較長的輪詢
* 這是在瀏覽器/ JavaScript 客戶端上。
* 當前使用 WebSocket 的原因是它們速度很快,但由于它內置在瀏覽器中并且可以處理所有內容,因此正在遷移到 EventSource。 只需注冊消息類型并為其提供回調處理程序即可。
## 測試
* 黑暗時間測試。 Disqus 已安裝在數百萬個網站上,因此需要對數百萬個并發連接進行測試。 使用現有網絡進行負載測試,而不是在 EC2 中創建偽設置。
* 例如,有條理的客戶說只有 10%的用戶或恰好這個網站應該流經新系統。
* 最暗時間。 世界上發生了一些重要的事情,而且兩個網站的流量也很大。 因此,他們接受了所有流量,并通過系統中的單個 pub / sub 密鑰發送了流量。 這有助于識別代碼中的許多熱點。
## 度量
* 測量所有東西。 在流水線系統中,您只需測量每個階段的輸入和輸出,即可與 HAProxy 等其他系統協調數據。 沒有測量數據,就無法向下鉆取并找出誰是錯的。
* 盡可能將指標表示為+1 和-1。 (我不太了解這一點)
* Sentry 幫助查找代碼中的問題。
* 通過測量,可以輕松創建漂亮的圖形。
* 當選擇教皇并看到白色煙霧時,流量峰值達到每秒 245 MB,當天傳輸了 6 TB 數據,峰值 CPU 為 12%。
## 獲得的經驗教訓
* **一次工作**。 在大型扇出架構中,在一個地方進行工作,然后將其發送給所有消費者。 不要為每個消費者重復工作。
* **最有可能失敗的代碼是您的代碼**。 您很聰明,但是很聰明的人寫了 redis 和其他產品,所以要比系統的其他部分更關心您的代碼。
* **端到端的支架不錯,但價格昂貴**。 想要 100%交付的客戶所必需。 無法為每個前端用戶做到這一點。
* **Greenlets 是免費的**。 使用它們。 它們使代碼更易于閱讀。
* **發布是免費的**。 發布到所有頻道。 由于消息已通過所有渠道發布,因此他們無需事先進行計劃就可以制作出實時的流量大圖。
* **有時候會有個大勝利。** 發現 Nginx 推送流模塊簡化了其系統的巨大塊并減少了服務器數量。
* **了解負載測試時的用例,以便您可以真正測試系統**。
* **使用實際流量進行測試**。 當您的系統變大并且生成合成負載本身就是一個巨大的項目時,這是一種容易得多的方法。
* **使用 Python** 。 他們確實喜歡 Python 和 Django,盡管其中一些后端內容現在是用 Go 編寫的。
* **響應規模而增加的服務器數量是您的體系結構可能需要進行一些調整的標志。 看一看,您可以更改架構并更有效地使用資源。**
* **使用現成的技術**。 不必覺得您必須從頭開始構建所有內容。 利用代碼,使您的團隊規模變小。
## 相關文章
* [將 DISQUS 擴展到 7500 萬評論和 17,000 RPS](http://highscalability.com/blog/2010/10/26/scaling-disqus-to-75-million-comments-and-17000-rps.html) (2010)
* Disqus [nginx-push-stream-module 配置](https://gist.github.com/dctrwatson/0b3b52050254e273ff11) 適用于> 1MM 并發用戶。
* [通過](https://www.youtube.com/watch?v=5A5Iw9z6z2s) [Adam 制作 DISQUS 實時](https://www.linkedin.com/in/adamhitchcock) ( [幻燈片](https://speakerdeck.com/pyconslides/scaling-realtime-at-disqus-by-adam-hitchcock) ) 希區柯克 ,軟件工程師,?2013 年 3 月
* [將 Django 擴展到 80 億頁面瀏覽量](http://blog.disqus.com/post/62187806135/scaling-django-to-8-billion-page-views) [Matt Robenolt](https://www.linkedin.com/in/mattrobenolt) ,運籌領先,2013 年 9 月
* [HTTP for Great Good](https://www.youtube.com/watch?v=HAjOQ09I1UY) ([幻燈片](https://speakerdeck.com/mattrobenolt/http-for-great-good)),作者:Matt Robenolt,2013 年 10 月
* [Google On Latency Tolerant Systems:由不可預測的部分組成可預測的整體](http://highscalability.com/blog/2012/6/18/google-on-latency-tolerant-systems-making-a-predictable-whol.html)
* [Twitter 用來處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 的架構,并在 5 秒內發送推文](http://highscalability.com/blog/2013/7/8/the-architecture-twitter-uses-to-deal-with-150m-active-users.html)
* John Watson 的 [C1MM 和 NGINX](https://www.youtube.com/watch?v=yL4Q7D4ynxU) ([[幻燈片](https://speakerdeck.com/dctrwatson/c1m-and-nginx))-Disqus 結構的更新。
* [試試這個 Go 事情…](http://blog.disqus.com/post/51155103801/trying-out-this-go-thing)
引用“如果可以的話,將指標表示為+1 和-1。(我不太了解這一點)”
這不僅僅是計數指標嗎?也就是說,因為您正在使用鏈接的消息隊列,因為消息到達您對計數器+1 的每個點,而消息離開您-1 的另一個計數器。 您可以在每個節點/隊列的輸入和輸出處執行此操作。
每個點+1 的變化,每個點-1 的變化告訴您每個時間間隔(傳入和傳出)的消息吞吐量,總+1 和總-1 的差告訴您消息' 在隊列中”。
好讀!
好東西。
現在,他們需要解決垃圾郵件問題。
這看起來像一團糟。 在這家公司工作會很害怕。 這就是為什么您需要良好的系統架構師的原因。 如果您不能用 c / c ++自己編寫(暗示理解)這些工具的一半,則需要重新考慮領導該項目。 現在您有了一個巨大的泥球,上帝知道有多少種不同類型的“粘土”。
http://en.wikipedia.org/wiki/Big_ball_of_mud
我很好奇他們是否會考慮為此使用 elixir 以及 phoenix 框架。 流水線方法,大規模,并發性和容錯性固有地內置于長生不老藥中,并且不需要像這樣做的一整套分散的組件。 話雖如此。 做到這一點仍然是一個了不起的壯舉,我敢肯定,出于很多原因,研究長生不老藥可能不是他們追求的解決方案。
這看起來很混亂。 會害怕在這個組織工作。 這就是為什么您需要好的程序設計師。 如果您不能在 c / c ++中自己創建(暗示理解)這些資源的 50%,則需要重新評估獲得的資源。 現在您有了一個偉大的泥濘足球,上帝知道有多少種“粘土”。
我很好奇你們在 django 中存儲持久連接的位置,這是我們的主要問題,我們的隊列(我們使用 Rabbitmq)連接快要死了并且無法恢復。
現在他們需要解決垃圾郵件問題。這就是為什么您需要優秀的程序設計師。 如果您不能在 c / c ++中自己創建(暗示理解)這些資源的 50%,則需要重新評估獲得的資源。
好東西。
從它的聲音來看,它聽起來像是一個混亂的機構,但是,從它提供的服務的種類來看,我相信他們可能已經將其微調到可以接受的水平。
我喜歡這篇文章,但有一個問題。
Disqus 使用的數據庫是什么?
該帖子解釋了如何保存新帖子,但是當我打開網站并打開 Disqus 評論時。 獲取所有評論并顯示在網站上的過程是什么?
謝謝這個
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓