# Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
> 原文: [http://highscalability.com/blog/2011/3/22/facebooks-new-realtime-analytics-system-hbase-to-process-20.html](http://highscalability.com/blog/2011/3/22/facebooks-new-realtime-analytics-system-hbase-to-process-20.html)
 Facebook 再次這樣做。 他們建立了另一個系統,能夠對大量的實時數據流進行有用的處理。 上次我們看到 Facebook 發布其[新的實時消息系統:HBase 每月存儲 135 億條消息](http://highscalability.com/blog/2010/11/16/facebooks-new-real-time-messaging-system-hbase-to-store-135.html)。 這次,它是一個實時分析系統,每天處理*超過 200 億個事件(每秒 200,000 個事件),時延不到 30 秒*。
Facebook 工程經理 Alex Himel [解釋了他們構建的](http://www.facebook.com/note.php?note_id=10150103900258920)([[視頻](http://www.facebook.com/video/video.php?v=707216889765&oid=9445547199&comments))以及所需的規模:
> 在過去的一年中,社交插件已成為數百萬網站的重要且不斷增長的流量來源。 上周,我們發布了新版本的“網站洞察”,以使網站所有者可以更好地分析人們如何與其內容進行互動,并幫助他們實時優化網站。 為此,我們必須設計一個系統,每天處理 200 億個事件(每秒 200,000 個事件),而延遲不到 30 秒。
亞歷克斯在演講中做得很好。 強烈推薦。 但是讓我們更深入地了解發生了什么...
Facebook 通過通過[社交插件](http://developers.facebook.com/docs/plugins/)的病毒傳播,將非 Facebook 網站重新綁定到 Facebook 中,并將 Facebook 網站重新綁定到 Facebook 中,從而實現了這種強大的分析系統的需求,這是 Facebook 出色的計劃,旨在實現全球網絡統治 非 Facebook 網站。 基本上,人們可以做的任何事情都會被 Facebook 捕獲并反饋,而 Facebook 上所做的任何事情都可以顯示在您的網站上,從而在兩者之間建立更緊密的聯系。
Facebook 的社交插件是 Roman Empire Management101。您不必征服所有人就可以建立帝國。 您只要控制每個人,使他們意識到自己可以被征服的威脅,同時使他們意識到,哦,與羅馬友好可以賺很多錢。 我記得這一策略已經工作了很長時間。
毫無疑問,您在網站上看到了社交插件。 社交插件可讓您查看朋友喜歡,在網絡上的站點上評論或共享的內容。 想法是將社交插件放在網站上,使內容更具吸引力。 您的朋友可以看到您喜歡的東西,而網站可以看到每個人都喜歡的東西。 引人入勝的內容為您帶來更多點擊,更多喜歡和更多評論。 對于企業或品牌甚至個人而言,內容越具有吸引力,人們看到的內容就越多,新聞源中出現的內容就越多,從而將其吸引到網站的流量也就越大。
以前的孤狼網是內容獵人無聲無息地跟蹤著網站的地方,如今已變成一個迷人的小村莊,每個人都知道您的名字。 這就是社交的力量。
例如,此處有關 HighScalability 的帖子現在具有 [Like 按鈕](http://developers.facebook.com/docs/reference/plugins/like/)。 TechCrunch 已使用 Facebook 的評論系統移至[。 立即辯論集中在評論系統本身的質量上,但這并不是重點,重點是使 TechCrunch 更深入地投入到 Facebook 的 500+百萬用戶的生態系統中。 其他插件包括:推薦,活動源,登錄,注冊,Facepile 和實時流。](http://techcrunch.com/2011/03/01/facebook-rolls-out-overhauled-comments-system-try-them-now-on-techcrunch/)
除非您能理解所有這些數據,否則它們意義不大,并且還向內容提供商證明了社交插件確實確實使他們的網站更具吸引力。 這就是 Facebook 的[洞察系統](http://www.allfacebook.com/facebook-rolls-out-expanded-insights-for-domains-2011-03)出現的地方。這是一個分析系統,可讓您訪問所收集的所有多汁數據。 它提供統計信息,例如“贊”按鈕分析,“評論”框分析,“熱門頁面”,“受眾特征”和“自然共享”。
想象一下,數百萬個網站和數十億個頁面以及數百萬的人通過這些社交插件不斷地流式傳輸數據。 您如何實時理解所有這些數據? 這是一個具有挑戰性的問題。
## 價值主張
借助 Insights System,內容生產者可以看到人們喜歡的東西,這將使內容生產者能夠產生更多人們喜歡的東西,從而提高網絡的內容質量,從而為用戶提供更好的 Facebook 體驗。
## 系統目標
* 以非常可靠的方式為人們提供實時計數器,這些計數器涉及許多不同的指標,并解決了數據偏差問題。
* 提供匿名數據。 您無法弄清這些人是誰。
* 展示為什么插件很有價值。 您的業??務從中獲得什么價值?
* 使數據更具可操作性。 幫助用戶采取行動,使其內容更具價值。
* 新的 UI 隱喻。 使用漏斗的想法。
* 有多少人看到了該插件,有多少人對此采取了行動,以及有多少人轉化為訪問您網站的流量。
* 使數據更及時。
* 他們實時進行。 從 48 小時轉向 30 秒。
* 消除了多個故障點以實現此目標。
## 挑戰性
* **許多事件類型**
* 跟蹤 100 多個指標。
* 插件印象。
* 喜歡
* 新聞提要印象
* 新聞訂閱源點擊
* 客層
* **大量數據**
* 每天 200 億個事件(每秒 200,000 個事件)
* **數據偏斜-密鑰分布不均**
* 喜歡遵循類似冪律分布的方法。 長尾巴很少有人喜歡,但有些資源卻得到大量喜歡。
* 這帶來了熱區,熱鍵和鎖爭用的問題。
## 實現了一堆不同的原型
* **MySQL 數據庫計數器**
* 排有一把鑰匙和一個柜臺。
* 導致大量數據庫活動。
* 統計信息每天存儲在桶中。 每天午夜時分,統計數據都會累積。
* 當達到過渡期時,這將導致對數據庫的大量寫入,從而導致大量的鎖爭用。
* 嘗試通過考慮時區來分散工作。
* 試圖以不同的方式分割事物。
* 高寫入率導致鎖爭用,很容易使數據庫超載,必須不斷監視數據庫,并且必須重新考慮其分片策略。
* 解決方案不適合該問題。
* **內存中計數器**
* 如果您擔心 IO 中的瓶頸,則將其全部放入內存中。
* 沒有規模問題。 計數器存儲在內存中,因此寫入速度快并且計數器易于分片。
* 由于未說明的原因,感覺到內存中的計數器并不像其他方法那樣準確。 甚至只有 1%的失敗率也是不可接受的。 Analytics(分析)可以賺錢,所以計數器必須非常準確。
* 他們沒有實現這個系統。 這是一個思想實驗,準確性問題導致他們繼續前進。
* **MapReduce**
* 將 Hadoop / Hive 用于先前的解決方案。
* 靈活。 易于運行。 可以處理大量寫入和讀取的 IO。 不必知道他們將如何提前查詢。 數據可以存儲然后查詢。
* 不是實時的。 許多依賴項。 很多失敗點。 復雜的系統。 不夠可靠,無法達到實時目標。
* **卡桑德拉**
* 基于可用性和寫入率,HBase 似乎是一個更好的解決方案。
* 寫速度是要解決的巨大瓶頸。
## 獲勝者:HBase + Scribe + Ptail + Puma
* 在高層次上:
* HBase 在分布式計算機上存儲數據。
* 使用尾部架構,新事件存儲在日志文件中,并且尾部有日志。
* 系統匯總事件并將其寫入存儲。
* UI 會拉出數據并將其顯示給用戶。
* 數據流
* 用戶在網頁上單擊“贊”。
* 向 Facebook 發送 AJAX 請求。
* 使用 Scribe 將請求寫入日志文件。
* 編寫極其精簡的日志行。 日志行越緊湊,則可以在內存中存儲的越多。
* 抄寫員處理文件翻轉之類的問題。
* Scribe 建立在 Hadoop 建立在同一個 HTFS 文件存儲上。
* 尾巴
* 使用 Ptail 從日志文件讀取數據。 Ptail 是一個內部工具,用于聚合來自多個 Scribe 存儲的數據。 它拖尾日志文件并提取數據。
* Ptail 數據分為三個流,因此最終可以將它們發送到不同數據中心中自己的群集。
* 插件印象
* 新聞提要印象
* 動作(插件+新聞源)
* 彪馬
* 批處理數據可減少熱鍵的影響。 盡管 HBase 每秒可以處理大量寫入操作,但它們仍要批處理數據。 熱門文章會產生大量的印象和新聞提要印象,這將導致巨大的數據偏斜,從而導致 IO 問題。 批處理越多越好。
* 批量平均 1.5 秒。 想要批處理更長的時間,但是它們具有太多的 URL,以至于在創建哈希表時它們用盡了內存。
* 等待上一次刷新完成以開始新批處理,以避免鎖爭用問題。
* UI 渲染數據
* 前端都是用 PHP 編寫的。
* 后端是用 Java 編寫的,并且 Thrift 用作消息傳遞格式,因此 PHP 程序可以查詢 Java 服務。
* 緩存解決方案用于使網頁顯示更快。
* 效果因統計信息而異。 計數器可以很快回來。 在域中查找頂級 URL 可能需要更長的時間。 范圍從 0.5 到幾秒鐘。
* 緩存的數據越長越長,實時性就越差。
* 在 Memcache 中設置不同的緩存 TTL。
* MapReduce
* 然后將數據發送到 MapReduce 服務器,以便可以通過 Hive 查詢。
* 這也可以用作備份計劃,因為可以從 Hive 恢復數據。
* 一段時間后,原始日志將被刪除。
* HBase 是分發列存儲。
* Hadoop 的數據庫接口。 Facebook 的內部人員在 HBase 上工作。
* 與關系數據庫不同,您不在表之間創建映射。
* 您不創建索引。 您擁有主行鍵的唯一索引。
* 通過行鍵,您可以擁有數百萬個稀疏列的存儲。 非常靈活。 您不必指定架構。 您定義列族,可以隨時向其中添加鍵。
* WAL 預寫日志是可伸縮性和可靠性的關鍵功能,它是應該執行的操作的日志。
* 根據密鑰,數據將分片到區域服務器。
* 首先寫給 WAL。
* 數據被存入內存。 在某個時間點,或者如果已經積累了足夠的數據,則將數據刷新到磁盤。
* 如果機器出現故障,您可以從 WAL 重新創建數據。 因此,不會永久丟失數據。
* 結合使用日志和內存存儲,它們可以可靠地處理極高的 IO 率。
* HBase 處理故障檢測并自動跨故障路由。
* 當前,HBase 重新分片是手動完成的。
* 自動熱點檢測和重新分片在 HBase 的路線圖上,但還沒有。
* 每個星期二,有人查看密鑰并決定對分片計劃進行哪些更改。
* **模式**
* 在每個 URL 上存儲一堆計數器。
* 行鍵是唯一的查找鍵,是反向域的 MD5 哈希
* 選擇適當的密鑰結構有助于掃描和分片。
* 他們遇到的問題是將數據正確分片到不同的計算機上。 使用 MD5 哈希值可以更容易地說出該范圍在此處,該范圍在該位置。
* 對于 URL,它們會執行類似的操作,此外還會在其上添加一個 ID。 Facebook 中的每個 URL 都有一個唯一的 ID,該 ID 用于幫助分片。
* 使用反向域,例如 *com.facebook /* ,以便將數據聚集在一起。 HBase 確實擅長掃描集群數據,因此,如果他們存儲數據以便集群在一起,則它們可以有效地計算整個域的統計信息。
* 將每行 URL 和每個單元格視為一個計數器,就可以為每個單元格設置不同的 TTL(生存時間)。 因此,如果每小時進行一次計數,則沒有必要永久保留每個 URL,因此他們將 TTL 設置為兩周。 通常按每個列族設置 TTL。
* 每個服務器每秒可處理 10,000 次寫入。
* 從日志文件讀取數據時,檢查點用于防止數據丟失。
* 裁縫將日志流檢查點保存在 HBase 中。
* 在啟動時重播,因此不會丟失數據。
* 用于檢測點擊欺詐,但沒有內置欺詐檢測。
* **泰勒熱點**
* 在分布式系統中,系統的一個部分可能比另一個部分更熱。
* 一個示例是區域服務器可能很熱,因為以這種方式定向了更多的密鑰。
* 一個尾巴也可能落后于另一個。
* 如果一個拖尾落后一個小時,而其他拖尾已經更新,那么您將在 UI 中顯示哪些數字?
* 例如,展示次數比操作要高得多,因此點擊率在過去一小時中要高得多。
* 解決方案是找出最新的拖尾,并在查詢指標時使用。
* **未來方向**
* **熱門列表**
* 對于 YouTube 這樣的域名,很難找到最喜歡的 URL(最受歡迎的 URL),因為這些 URL 可以快速共享數百萬個 URL。
* 需要更多創新的解決方案來保持內存中的排序并隨著數據的變化而保持最新。
* **不同的用戶計數**
* 一個時間窗中**上有多少人喜歡某個 URL。 在 MapReduce 中很容易做到,而在幼稚的計數器解決方案中很難做到。**
* **適用于社交插件**以外的應用程序
* **移至多個數據中心**
* 當前是單個數據中心,但希望遷移到多個數據中心。
* 當前的后備計劃是使用 MapReduce 系統。
* 備份系統每晚都會進行測試。 比較針對 Hive 和此新系統的查詢,以查看它們是否匹配。
* **項目**
* 花了大約 5 個月的時間。
* 首先有兩名工程師開始從事該項目。 然后添加了 50%的工程師。
* 前端有兩個 UI 人員??。
* 看起來大約有 14 個人從工程,設計,PM 和運營中從事了該產品的工作。
當我們查看消息傳遞系統和此分析系統時,我們注意到兩個系統的共同點:大量,HBase,實時。 以可靠,及時的方式處理大量寫入負載的挑戰是這些問題的共同基礎。 Facebook 專注于 HBase,Hadoop,HDFS 生態系統,并指望稍后解決的操作問題。 其他人之所以選擇 Cassandra,是因為他們喜歡 Cassandra 的可伸縮性,多數據中心功能以及易于使用的功能,但它并不適合整個分析堆棧。
這對您意味著什么? 即使您不是 Facebook,該體系結構也足夠簡單,并且由足夠多的現成工具組成,甚至可以用于許多小型項目。
## 相關文章
* [Medialets 體系結構-擊敗艱巨的移動設備數據洪水](http://highscalability.com/blog/2011/3/8/medialets-architecture-defeating-the-daunting-mobile-device.html)-分析平臺的另一種表現。
* [Twitter 的計劃分析 1000 億條推文](http://highscalability.com/blog/2010/2/19/twitters-plan-to-analyze-100-billion-tweets.html)
* [擴展分析解決方案技術講座(3/2/11)[HQ]](http://www.facebook.com/video/video.php?v=707216889765&oid=9445547199&comments)
這是一個很棒的文章。 如何在不同的時間范圍內進行匯總? 每個<計數器和時間窗口>對都有單獨的單元格嗎?
好消息是,即使您不是 Facebook 人士,也沒有整個工程師團隊來構建您的分析平臺,您仍然可以使用現有的帶有 [OpenTSDB](http://opentsdb.net) 的開源軟件來構建類似的平臺。 在 StumbleUpon,我們僅使用 20 個節點群集中的 3 個即可輕松地[每秒處理 200,000 個事件](https://issues.apache.org/jira/browse/HBASE-2170?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel&focusedCommentId=13008872#comment-13008872),因此,大概您還可以使用更多節點輕松地將其擴展為每天數十億個事件。
當 Facebook 工程師在 6 個月前啟動該項目時,Cassandra 沒有分布式計數器,該計數器現在已提交到主干中。 Twitter 正在 Facebook 上投入大量資金用于實時分析(請參閱 Rainbird)。 由于計數器寫入分散在多個主機上,因此寫入速率對于 Cassandra 來說應該不是瓶頸。 對于 HBase,每個計數器仍然受單個區域服務器性能的約束嗎? 兩者的性能比較將很有趣。
一個簡單的問題-如果您拖尾的日志文件可能以不同的速率寫入,那么您如何知道從頭到尾有多少行? 尾巴-跟隨什么? 但是,如何將其傳送到另一個程序?
謝謝
HBase 表中的主鍵不是索引。 由于行以排序順序存儲,因此查找速度很快。
這些家伙在做什么只是在計數在線中/事件中的事件.....沒什么好說的,這全都取決于一個人可以計數的速度......
我認為他們也使它變得復雜 只是為了計算這些點擊/事件
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓