# StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
> 原文: [http://highscalability.com/blog/2012/6/25/stubhub-architecture-the-surprising-complexity-behind-the-wo.html](http://highscalability.com/blog/2012/6/25/stubhub-architecture-the-surprising-complexity-behind-the-wo.html)

StubHub 是一個有趣的架構,因為作為門票的做市商,他們所從事的業務與我們通常考慮的業務不同。
StubHub 規模驚人,每年以 20%的速度增長,每小時可處理 80 萬個復雜頁面,每年可售出 500 萬張門票,每小時可處理 200 萬次 API 調用。
票務空間異常復雜。 StubHub 的流量非常棘手。 突發性,圍繞不可預測的游戲結果,事件,時間表和季節。 涉及很多錢。 有很多不同的參與者。 涉及許多復雜的業務流程。 StubHub 在業務上有幾個互補但又截然不同的部分:它們有一個廣告服務器組件,可為 ESPN 等網站提供廣告,豐富的交互式 UI 和實時門票市場組件。
對我而言,最有趣的是 StubHub 如何將票務,銷售點系統,FedEx 交付,買賣雙方以及金錢等曾經一度是高接觸的實體世界帶入數字領域。 他們通過與組織(例如美國職業棒球大聯盟)的深度電子集成以及將復雜業務流程移出應用程序空間的生命周期總線來實現這一目標。
這是一個很有趣的問題,因為在處理業務構建功能成為首要任務時必須繼續處理構建的舊系統,這使問題變得更加復雜。 讓我們看看 StubHub 如何使其全部工作...
## 資源
* 查理·芬曼(Charlie Fineman)在 QCon 上的演講: [StubHub:為全球最大的票務市場](http://www.infoq.com/presentations/StubHub-Designing-for-Scale-and-Innovation-for-the-World-s-Largest-Ticket-Marketplace)設計規模和創新
## 商業模式
* **StubHub 是用于門票** 的 eBay。 為門票買賣雙方提供一個市場。 他們不像 Ticketmaster 。
* **托管模型用于為賣家** 提供信任和安全。 信用卡記錄在 StubHub 上,當確認訂單已收到時,才轉移款項。
* **門票不是商品** 。 買家想要特定的門票,而不是看臺座位。 數量有限,沒有滯票。 賣方不斷更新價格和數量以響應市場力量。 這是一個非常活躍的市場。
## 統計信息
* 每年 500 萬訂單
* 200 萬個活動列表/門票。
* 門票圍繞 45,000 個賽事進行。 美國職業棒球大聯盟的職缺賽季和超級碗是最活躍的時期。
* 銷售額每年以 20%的速度增長。
* 每小時可處理 600k-800k 復雜頁面。 在后期賽季每小時爆破一百萬。
* 在美國 10 到 12 個核心醒著時間的狹窄時段中,流量突發。 例如,季后賽結束后,會有買家為下一場比賽瘋狂。
* 每小時有 200 萬來自會員的 API 調用。
* 24-36 工程師。
* 這是一項高觸感的業務。 交易的支持電話過去是 1-1,但現在好多了。 員工最大的部分是客戶服務和后臺業務運營支持。
## 平臺
* Java
* 冷融合(舊版)
* ActiveMQ
* [SEDA](http://www.eecs.harvard.edu/~mdw/proj/seda/) (分段事件驅動的體系結構)
* Lucene / Solr
* Jboss
* 內存緩存
* Infiniband -到 SAN 的快速網絡
* XSL
* Oracle 的高級隊列
* TeamWorks -IBM 工作流構建器
* Splunk
* Apache HttpClient
* Log4j(使用消息格式)
* 掛毯
## 架構
* 門票的三種購買來源:Web,銷售點系統,批量上傳。 批量上傳允許將票證單上傳到系統中。
* Manager 層在 Ticket 數據庫上方提供了業務對象抽象。 它調解了所有與票證表的對話。
* 票務表會因買賣雙方的活動以及事件周圍的自然流量突發性而受到影響。
* 活躍的市場可能導致移動客戶端與系統的當前狀態過時,因此買家對舊數據做出反應。
* 兩個數據泵將來自 Tickets 數據庫的數據饋送到內部和外部系統:我的帳戶,查找和公共饋送。 我的帳戶是用戶帳戶的界面。 查找是一種搜索功能。 Public Feeds 為 ESPN 和 eBay 等網站提供支持。
* 內部供稿-包含用于儀表板,賣家是誰,銷售情況,銷售速度,熱圖等敏感信息,例如帳戶信息。它還根據敏感的市場數據供稿主頁的某些部分, 例如熱門話題,他們不想與公眾分享。
* 外部供稿(LCS)-廣告商,例如 ESPN ,都通過此供稿供稿。 廣告是通過 IP 地址映射的地理位置。
* LCS (上市目錄服務):
* 我在這里道歉,幻燈片有些偏離,并且很難使演講者與演示文稿匹配。 所有錯誤都是我的。
* 觸發器用于使修改表保持最新狀態,以進行數據庫中發生的更改。
* 更改數據捕獲作業不斷輪詢更改,并將消息注入到 ActiveMQ 代理中。 這是路由的第一級,包含 sma ll 有效負載:對象 ID,對象類型和更改日期。
* 更改數據被路由到主服務器,這是在數據中心之間進行復制的基本機制。 輔助數據中心訂閱了這些主題,這就是在數據中心之間復制數據的方式。
* 進入主數據后,數據將被注入 SEDA 隊列中進行處理(稍后會有更多介紹)。
* 未使用管理器是因為存在許多不使用管理器而直接進入數據庫的舊系統,因此數據庫是分發增量的常見點。
* 他們的大多數廣告是 Flash,但有些廣告使用 HTML 呈現。
* LCS 提供了購物體驗,例如從體育場的交互式圖形中選擇門票。 Solr 使添加這樣的新功能非常容易。
* SEDA (分段事件驅動的體系結構)在主服務器中使用
* 主服務器接收 sma ll 更新并弄清楚如何 構建進入內存緩存的內容,以便最終將路由到 Solr 。
* 使用協議緩存格式將消息緩存在 memcached 中。
* 消息發送到第二個代理,該代理將消息分散到邊緣,即 Lucene / Solr。
* 消息使用者從代理接收消息。
* 從數據庫加載實體。
* 確定更新是否有任何級聯影響。 因為 Solr 和其他 NoSQL 數據庫不進行聯接,所以例如,如果更改了樂隊名稱,則該更改必須傳播到 ll 事件。
* 序列化實體。 將其存儲在內存緩存中。
* 將消息發送到第二個 ActiveMQ 代理,該代理將消息路由到邊緣,即 Solr。
* 通過單獨的路由處理代理偵聽代理。 這曾經在 Jboss 中,但是 Jboss 會不知所措,他們遇到了饑餓問題,因此將其移出 Jboss。 該偵聽器成為系統中用于操作管理的有用閥門。 如果他們需要換出新的 Solr 索引以放入新架構,則可以關閉閥門,讓消息在消息代理中備份,然后再次打開閥門,消息將再次開始流動。 從 Solr 故障中恢復,復制索引和更新模式時,這些閥門對其操作穩定性產生了巨大影響。
* A ll 這些都是阻塞操作,因此使用線程池可以防止數據庫連接風暴。
* SEDA 是一種平滑負載的技術。 從資源管理的角度來看,這對他們是有效的。 想法是將工作分解成足夠小的部分,以至于緩慢的工作不會竊取其他用戶的線程。 工作是分階段建模的,每個階段都有自己的線程池,可作為工作節流閥。
* Solr
* Solr 提供了一個不錯的文檔存儲和自然語言文本查詢功能。
* 所有搜索都基于 Solr,包括構面。
* 快速。 查詢以 10 毫秒或更短的時間返回。 他們在 SAN 上使用了 Infiniband 網絡,發現他們不需要在內存中緩存數據,他們可以通過快速的網絡以足夠快的速度為 SAN 提供數據服務。
* 潛力。 靈活的查詢語言,可以使用 ll 文本搜索以及 geo -特殊搜索。
* 支持許多輸出格式:XML,Atom, RSS ,CSV, Json 。 使與各種客戶端的集成變得更加容易。
* 高頻寫入不是很好。 在高頻寫入下復制似乎集成得不好。 看到成千上萬的更改時執行 rsync 不起作用。 您會獲得真正過時的數據。 因此,他們必須建立自己的復制機制。
* 平面數據結構。 仍然幾乎是面向行的。 他們希望支持結構更復雜的文檔。
* DCL -雙擊介紹瀏覽
* URL 映射到 ID :類型 ID,地理位置 ID,渲染類型 ID。
* DCL (僅是 XSL )使用類型 ID 和 Geo ID 為 LCS 創建查詢。 然后可以一般性地呈現返回的數據。 因此 ll footba ll 小組可以使用 URL 映射 XSL 和 LCS 為他們生成具有完全相同結構的相似頁面 ]。
* 巨大的生產率提高,使添加新功能變得更加容易。 頁面中的每個塊都是通過 CMS 管理的單個資產。 它們是 XSL 的大塊,針對從 LCS 中檢索到的上下文文檔進行渲染。
* A RenderChunkByName ca ll 使在 Facebook 等其他服務上呈現事件變得容易。
* 在后端進行所有這些操作以實現 SEO 目的。 當搜索引擎可以為 Ajax 編制索引時,他們可能不需要這樣做。
* gifs ,樣式表等的邊緣緩存,但是數據緩存在它們的服務器上。
* 減少每筆交易的客戶互動次數:
* 客戶互動是其營業收入的最大消耗。 當情況惡化時,需要與買賣雙方共同努力以解決問題。
* 增加客戶自助服務。 顧客想知道什么時候拿到錢和票。 MyAccount 屏幕允許客戶在不使用客戶服務的情況下檢查訂單進度。
* 向賣家公開 API ,以便他們可以將這些功能集成到他們的系統中。
* IVR -集成的語音識別系統支持客戶打電話以查找其帳戶狀態。
* 現金流量對供應商很重要,因此他們致力于更快地付款。
* 與美國職棒大聯盟(Major League Baseball)的電子集成,因此他們可以在賣方實際擁有票證之前直接從賣方將票證轉讓給買方。 即時交付并極大地提高了客戶滿意度并消除了故障點。
* 生命周期總線
* 用于防止硬鏈接應用程序中的復雜工作流。 簽出應用程序不必擔心 ll 下游存在的不同業務流程。 您只需要擔心已驗證的信用卡和訂單,而不要擔心配送和電子郵件之類的問題。
* 在處理遺留問題和管理站點更改時很有用。
* 有關于 ll 主要生命周期事件的主題。 代理在 Oracle 隊列中偵聽主題。 下訂單時,它將進入未確認狀態。 偵聽器將收聽“未經確認”的主題,并通過電子郵件向賣方發送電子郵件以訪問該站點并確認訂單。 當賣方確認訂單后,那里的代理商將從買方的托管賬戶中提取款項,向買方發送電子郵件,說明賣方已確認并在何處找到機票。 確認票證后,付款便退給了賣方。
* 所有這些邏輯都與面向網站的最終用戶分離。 這些都是后臺引擎。
* TeamWorks 為這些流程建模,發現弱點,監視流程,檢查 SLA 并觸發操作。 幫助更好地優化后臺業務流程。 由于他們每年以 20%的速度增長,因此他們不希望運營團隊的年增長率達到 20%。
* FedEx 是最初的履行方式。 電子實現已添加。 業務流程如下:未確認->自動確認; 已確認->條碼重發和付款 PDF; 實現。 您要做的就是編寫在相同訂單生命周期內生存的代理,以實現新的實現模式。 該邏輯不在應用程序中。 它在代理中,是一個可單獨部署和測試的單元。
* 避免欺詐。 使用相同的生命周期模型來實現,但增加了兩個新狀態:已購買和已批準。 他們無需進行任何更改即可添加避免欺詐的功能。 他們只需要更改狀態機即可。 代理決定將其移至批準狀態或未批準狀態。
* 銷售點系統集成
* 使用兩個階段的提交:在外部系統上預訂票證,將其標記為 StubHub 中聲明的內容,在外部系統上提交購買。
* 希望對此進行概括,以便其他系統可以在交易中購買門票。 將門票與旅行或酒店購買捆綁在一起。
* Splunk 和染料
* 在 StubHub 上最大的投資回報率項目之一。 節省了很多調試時間。
* 染色-工件被放置在每個請求的 HTTP 標頭中。
* 這些使用 Log4j 記錄。
* 使用 Splunk ,如果訂單有問題,您可以使用染料標記查看日志行以向后推 ll ,然后查看 ll 屬于請求的呼叫,包括對 LCS 之類的其他服務的二次呼叫。 追溯活動很容易。
* 確實類似于 Splunk 。 就像日志行的文檔存儲。 將染料標記和 ID 排序到日志行,就像一系列鍵值對一樣, Splunk 使得查看日志變得非常容易。 他們的儀表板是使用 Splunk 編寫的,用于統計信息,例如每分鐘的事務,每分鐘的失敗。 您可以根據需要對數據進行切片和切塊。
* 將 Log4j 與消息格式一起使用,以便它不會創建動態字符串。
## 得到教訓
* **可擴展性是專業化** 。 每個問題空間都有其獨特的特征,必須構建任何系統來解決該特定問題。 StubHub 受制于對安全購買體驗的需求,票務市場的獨特性質,突發流量以及事件多變的局面。 他們的系統必須反映這些要求。
* **從一開始就使用抽象層** 。 否則,您將無法繼續為舊客戶提供支持,而超出了您的承受能力。
* **生產中的烘烤** 。 實施多種解決方案,并在生產中進行審核,以確定哪個版本更好。 StubHub 在生產中測試了兩個不同的數據泵版本,以發現哪種版本更合適。 您不想支持多種基礎架構。
* **將工作移出 Jboss** 。 大量請求可能會導致 Jboss 餓死,因此他們將工作移到 Jboss 之外。
* **通過因果鏈** 滲濾染料。 檢測請求,以便可以在整個堆棧中跟蹤請求。 這是一個巨大的投資回報,能夠調試整個堆棧中的問題。
* **優化業務流程。** 系統之間的電子集成。 通過充當賣方,買方和 MLB 之間的協調者,他們能夠提高客戶滿意度并消除交易中的大量可能失敗點。 購買了受歡迎的銷售點程序,以便他們可以與它集成。
* **建立在您自己的 API** 上。 他們花費大量時間嘗試在自己的 API 上構建自己的應用程序,以便他們可以更好地管理其用戶和合作伙伴的體驗。
* **一般定義資產** 。 定義資產以便可以在任何上下文中呈現它們,可以輕松組成不同格式的頁面并在其他網站上呈現事件。
* **從 ROI 透視圖** 最大化開發。 尋找可提高開發人員 ROI 的項目。 使用 Solr 對他們來說是一個巨大的勝利。 它易于使用,快速且非常實用,可以立即滿足許多類型的查詢。
* **SEDA 適合阻止讀取** 。 他們的許多系統都基于阻止讀取,因此 SEDA 非常適合該用例。 線程池可防止淹沒他們要使用的資源。
* **在客戶端** 上呈現。 對于像體育場館地圖這樣非常酷的交互式地圖,在客戶端上通過 ll 處理 ll 的 UI 交互可節省大量服務器負載。 即使對于具有 10-20K 列表的大型活動,下載整個列表也是一個更好的解決方案。
* **比重框架**更薄。 沉重的框架易于使用和濫用。 隱藏的復雜性使您很快失去對站點的控制。 示例:Hibernate 和基于組件的框架。 驗證和業務邏輯可能會泄漏到表示層中。 做出明智的決定。 了解遺留問題方面的問題。
* **糟糕的經歷是最好的訓練** 。 就像沒有教給如何正確做事一樣。 剛開始 StubHub 的家伙正在通過盡快發布功能來建立業務,但這留下了一筆遺產。 管理遺留物的關鍵是管理依賴關系。 使用基于代理的 Lifecycle Bus 樣式解決方案可幫助他們了解對遺留系統的依賴性。
* **使用工作流將狀態機與應用程序分離。** 不要在應用程序邏輯中嵌入復雜的流。 外部化邏輯,以便業務流程可以更靈活的方式耦合在一起。 這使系統在未來變得無限靈活和適應性強。
* **避免使用 ETL** 。 它引入了許多您不想處理的依賴項。 有風險。 當您嘗試確定財務上依賴的變更對您而言是否很大時,舊式數據模型可以真正占用資源。
* **不要縮短 CM 和部署**。 當前,對于開發人員來說,這是最大的浪費時間。 非常痛苦 現在投資您的 CM 和部署系統。
* **投資持續改進** 。 它不是免費提供的。 在項目上運行驗尸。 確保問題不再出現。 隨著公司的發展,這些東西無法擴展。 立即做出正確的決定,否則將來 ll 需要花費 3 到 5 倍來解決。
* **在系統** 中建立操作閥。 例如,如果您需要換出新的架構,請使用一個閥門,您可以在其中關閉事件并重新啟動它們。
該 Java Framework Tapestry 在哪里使用?
您是在我們網站上還是其他地方?
“當您試圖找出變更是否會帶來巨大收益時,它們將成為您財務上依賴的系統。”
句子里有錯字,對不對? 難道不是“當您試圖確定變更是否會創建您在財務上依賴的系統時”嗎? 謝謝。
愛德華
我認為這個家伙在獲得我的要點方面做得很好,但是在這種情況下...是的...這很想念...我認為不是錯字。 :-)在不返回原始錄音版本的情況下,它應該類似于:
“當您試圖確定更改是否會在您所依賴的系統中造成回歸時”
我真的想了解更多有關如何在 HTTP 標頭中使用 splunk 和 dye 來跟蹤整個堆棧中的每個請求的信息,從調試的角度來看,這是非常有用的功能。
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓