# MySpace 如何與 100 萬個并發用戶一起測試其實時站點
> 原文: [http://highscalability.com/blog/2010/3/4/how-myspace-tested-their-live-site-with-1-million-concurrent.html](http://highscalability.com/blog/2010/3/4/how-myspace-tested-their-live-site-with-1-million-concurrent.html)
這是 [SOASTA](http://www.soasta.com/) 副總裁 Dan Bartow 的嘉賓帖子,內容是他們如何使用 800 個 EC2 實例與 100 萬并發用戶共享 MySpace。 我認為這是一個有趣的故事,因為:用戶很多,需要花費大量的精力來測試您的實時站點,而并非所有工作都能按預期進行。 我要感謝 Dan 抽出寶貴的時間寫和分享這篇文章。

在 MySpace 音樂先前取得成功的基礎上,MySpace 在 2009 年 12 月在新西蘭掀起了新的流音樂視頻產品浪潮。 這些新功能包括觀看音樂視頻,搜索藝術家的視頻,創建收藏夾列表等等的功能。 在 MySpace 等熱門網站上,此類功能的預期負載增加是巨大的,他們希望在啟用這些功能之前先進行測試。
如果您管理高流量應用程序背后的基礎架構,則不會感到意外。 您想了解自己的斷裂點,定義容量閾值,并知道在超過這些閾值時如何應對。 用實際的預期負載水平測試生產基礎架構是了解高峰流量到達時事物將如何運行的唯一方法。
對于 MySpace,目標是在其實時站點上測試另外的 100 萬并發用戶,以強調新的視頻功能。 這里的關鍵詞是“并發”。 不到一個小時或一天的時間……網站上同時有 100 萬用戶同時活動。 應當指出,一百萬個虛擬用戶只是 MySpace 在高峰期通常在站點上擁有的虛擬用戶的一部分。 他們想用測試流量來補充實時流量,以了解新產品對整個基礎架構的總體性能影響。 這需要大量的負載生成功能,而這正是云計算發揮作用的地方。 為了進行此測試,MySpace 與 SOASTA 一起使用了云作為負載生成平臺。
以下是測試過程中生成的負載的詳細信息。 所有數字均與虛擬用戶的測試流量有關,不包括實時用戶的指標:
* 100 萬個并發虛擬用戶
* 測試用例分為搜索和觀看音樂視頻,對視頻進行評級,將視頻添加到收藏夾以及查看藝術家的頻道頁面。
* 每秒 16 吉比特的傳輸速率
* 每小時傳輸 6 TB 的數據
* 每秒點擊次數超過 77,000,不包括實時流量
* 800 個用于生成負載的 Amazon EC2 大型實例(3200 個云計算核心)
**測試環境體系結構**
SOASTA CloudTest?管理對云提供商(在本例中為 Amazon)的調出,并配置服務器以進行測試。 捕獲 800 個 EC2 實例的過程用了不到 20 分鐘的時間。 我們對 Amazon EC2 API 進行了調用,并以 25 個為一組請求服務器。在這種情況下,團隊正在請求具有以下規范的 EC2 Large 實例充當負載生成器和結果收集器:
* 7.5 GB 內存
* 4 個 EC2 計算單元(2 個虛擬 CPU 內核,每個虛擬 CPU 內核具有 2 個 EC2 計算單元)
* 850 GB 實例存儲(2×420 GB 加上 10 GB 根分區)
* 64 位平臺
* Fedora Core 8
* 另外,有 2 個 EC2 Extra-Large 實例充當測試控制器實例和結果數據庫,其規格如下:
* 15 GB 內存
* 8 個 EC2 計算單元(4 個虛擬內核,每個虛擬內核具有 2 個 EC2 計算單元)
* 1,690 GB 實例存儲(4×420 GB 加上 10 GB 根分區)
* 64 位平臺
* Fedora Core 8
* PostgreSQL 數據庫
一旦擁有測試所需的所有服務器,便開始對它們進行運行狀況檢查,以確保它們響應并穩定。 當發現死服務器時,它將丟棄它們,并請求其他服務器來填補空白。 設置基礎結構相對容易。 下圖(圖 1)顯示了如何在 EC2 上設置測試云以將大量負載推入 MySpace 的數據中心。

**圖 1\.**
測試運行時,成批的負載生成器將其性能測試指標報告回單個分析服務。 每個分析服務都連接
到 PostgreSQL 數據庫,以將性能數據存儲在聚合存儲庫中。 這是這種規模的測試可以擴展以生成和存儲大量數據的方式的一部分-通過將對數據庫的訪問限制為僅度量指標聚合器并水平擴展。
**挑戰**
由于規模往往會破壞一切,因此在整個測試過程中會遇到許多挑戰。
**該測試僅限于使用 800 個 EC2 實例**
SOASTA 是云計算資源的最大消費者之一,通常在多個云提供商之間一次使用數百臺服務器來進行這些大規模負載測試。 在測試時,團隊要求提供的 EC2 實例數量上限。 可用硬件的限制意味著每個服務器都需要模擬相對大量的用戶。 每個負載生成器模擬了 1,300 至 1,500 個用戶。 此負載水平約為典型 CloudTest?負載生成器將驅動的負載的 3 倍,這給產品帶來了新的壓力,工程團隊需要一些創造性的工作來解決。 用于減輕負載生成器壓力的一些策略包括:
* 錯開了每個虛擬用戶的請求,以免每個負載生成器的點擊都一次觸發
* 縮減收集的數據,僅包括性能分析所需的內容
## **MySpace 資產的很大一部分由 Akamai 提供,并且該測試反復使 Akamai 基礎架構** 的部分服務能力最大化。
CDN 通常會根據訪問者的地理位置從最接近訪問者的位置向他們提供內容。 例如,如果您從亞馬遜的東海岸可用區生成所有測試流量,那么您很可能只會遇到一個 Akamai 服務點。
在負載下,該測試正在向少量 Akamai 數據中心生成大量數據傳輸和連接流量。 這意味著這些數據中心的負載將超過典型高峰期間可能產生的負載,但是鑒于此功能啟動僅針對新西蘭流量,因此這不一定是不現實的。 這種壓力導致新連接在某些負載水平下被 Akamai 破壞或拒絕,并在測試中產生許多錯誤。
這是在生產現場產生負載時需要克服的常見障礙。 需要設計大規模生產測試,以考慮到這一點并準確地對整個生產生態系統施加壓力。 這意味著從多個地理位置生成負載,以便將流量分散到多個數據中心。 最終,了解地理 POPs 的能力是該測試的重要收獲。
## **由于額外負載的影響,MySpace 必須即時調整其某些服務器的位置,以支持正在測試的功能**
在測試過程中,額外的虛擬用戶流量使 MySpace 基礎架構中的一些負擔沉重。 MySpace 的運營團隊能夠在幾分鐘內從其他功能集群中獲取未充分利用的服務器,并使用它們為視頻站點集群增加容量。
也許最令人驚奇的是 MySpace 能夠做到這一點。 他們能夠實時監控整個基礎架構的容量,并在需要時靈活地收縮和擴展。 人們一直在談論彈性可伸縮性,這在實踐中是一件很美的事情。
**經驗教訓**
1. 對于高流量網站,在生產中進行測試是準確了解容量和性能的唯一方法。 對于大型應用程序基礎結構,如果您僅在實驗室中進行測試然后嘗試進行推斷,那么就會出現太多“看不見的墻”。
2. 彈性可伸縮性正成為應用程序體系結構中越來越重要的部分。 應該構建應用程序,以便可以獨立監視和擴展關鍵業務流程。 能夠相對快速地增加容量將成為來年的關鍵體系結構主題,而大型企業早就知道了這一點。 Facebook,Ebay,Intuit 和許多其他大型網站都宣揚了這種設計原則。 使事物保持松散耦合具有以前宣傳過的許多好處,但是容量和性能正在迅速移到該列表的前面。
3. 實時監控至關重要。 為了對容量或性能問題做出反應,您需要進行實時監控。 此監視應與您的關鍵業務流程和功能區域相關聯,并且需要盡可能實時。
## 相關文章
* [MySpace 體系結構](/blog/2009/2/12/myspace-architecture.html)
* [如何在不進行實際嘗試的情況下成功完成容量規劃:Flickr 的 John Allspaw 專訪他的新書](/blog/2009/6/29/how-to-succeed-at-capacity-planning-without-really-trying-an.html)
另一篇令人失望的簡短文章:/
這篇文章對于學習和觀察真實的云一樣有用。
這本來真是令人贊嘆的文章,但事實證明,更多的是 soasta 廣告:(
嗯 我也希望有更多細節。 里面沒有什么新東西,只是一則廣告。
您想要保羅什么細節?
我想知道這項測試的亞馬遜賬單是多少?
雖然可能有點像廣告,但我不認為這太過分了。 SOASTA 僅被特別提及了三遍,考慮到它們都執行了測試并撰寫了有關測試的文章,這似乎是合理的。
總體而言,我認為這是一篇相當不錯的文章,并為我提供了許多以前所沒有的見識。 也許是因為我沒有參與需要進行云部署測試的大型站點。 如果是的話,我可能會有所不同。
根據讀者的不同,一篇文章幾乎總是細節太少或太多,我認為這篇文章取得了很好的平衡。
感謝您的撰寫。
這聽起來像是廣告,它實際上是一項糟糕的服務。
強調 Akamai 在美國的基礎設施將如何幫助應對來自新西蘭的流量猛增? 這些新西蘭人最終將身處 Akamai 的新西蘭基礎設施中。
另外,如果要在 MySpace 上對后端進行負載測試,而不是 Akamai 提供內容,則根本不需要測試 Akamai 部分。 只需在 MySpace 網絡中內部運行測試即可。
最后,哪種產品需要 16 GB 的 RAM 才能同時下載一些 http 請求? 你在開玩笑吧。 Java 用什么寫的?
這篇文章讓人印象深刻。 鑒于單核奔騰 M 筆記本電腦可以輕松使千兆位以太網連接(尤其是傳入)飽和,因此沒有理由使用 16 臺以上的服務器。 從亞馬遜那里購買它們特別愚蠢,因為與新西蘭的 DSL 客戶相比,它們往往連接良好。 如果啟動該服務確實產生了如此大的影響,那么您將受到新西蘭微薄的互聯網連接的自然限制,并且必須與所有其他新西蘭人共享。
關于先前的投訴,我認為您至少讓讀者停滯了一點:
(1)對于僅命中一個 Akamai 數據中心的問題有什么解決方案? 您是否能夠克服該瓶頸并測試其他潛在瓶頸?
我也想知道:
(2)是否遇到任何挑戰
-傳輸速率為每秒 16 吉比特
-每小時傳輸 6 TB 數據
進入 Amazon AWS? 還是僅僅是產生足夠多的實例來獲得這種傳輸速率?
您能否說明一下為什么選擇 PostgreSQL 來存儲日志數據?
我很確定某些鍵值存儲系統會比常規 SQL 系統更快地占用資源,同時存儲日志數據。
盡管它沒有描述所有細節,但了解/聽到使用 EC2 進行這種負載測試的方法仍然非常有趣。
謝謝
費利克斯(Felix),即使您的行為像孩子一樣在 YouTube 上匿名發動,我還是決定,我會盡力為您解答問題。 他們來了:
>強調 Akamai 在美國的基礎設施將如何幫助應對來自新西蘭的流量猛增? 這些新西蘭人最終將身處 Akamai 的新西蘭基礎設施中。
來自 Akamai 的內容只是正在測試的整個基礎架構的一部分。 這是在測試設計期間提出的,并被團隊接受,因為:
1)沒有其他選擇-尚無主要的云播放器在新西蘭(但是)擁有與某些較大的播放器一樣強大的 API,并且具有一定數量的服務器
2)大多數 Akamai 的存在都相對 在性能方面具有可重復性,因此,由于我們主要測試的不是 Akamai,因此我們假定來自新西蘭其他數據中心的性能也與眾不同,因為每個人都愿意接受這種風險。
有了 SLA,并且對數據中心進行的壓力測試比預期的要高得多,這在邏輯上是可以接受的風險。
>
>如果要在 MySpace 上對后端進行負載測試,而不是 Akamai 提供的內容,則根本不需要測試 Akamai 部分。 只需在 MySpace 網絡中內部運行測試即可。
如果您希望基礎架構的所有部分都能承受預計的負載的 100%的信心,則每個組件都需要進行測試。 我們經常根據客戶的要求測試 CDN。 在這種情況下,沒有人想到 CDN 會遇到麻煩,但我們遇到了很多麻煩。 即使我們可能一直在強調一種持久性有機污染物,其強度比預期的要高,但我們觀察到一個以前沒有人知道的能力點。
要記住的一件事是,它不僅僅是從容量角度測試 Akamai。 當本應由 Akamai 提供服務但沒有提供服務時,會發生不好的事情,最終回到原始服務器并破壞 MySpace 基礎結構。 團隊需要首先確保內容全部來自 Akamai。 其次,我們需要確保在 Akamai 緩存刷新等過程中沒有負載傳遞到 MySpace。
同樣,在內部運行測試不能像在防火墻外部進行測試那樣準確地提供性能信息。
>
>哪種產品需要 16 gigs RAM 才能同時下載一些 http 請求? 你在開玩笑吧。 Java 用什么寫的?
不值得花時間回答這個問題。 如果聽起來讀者理解這里發生的一切,就很樂意做出回應;)
>
>本文頗為令人印象深刻。 鑒于單核奔騰 M 筆記本電腦可以輕松使千兆位以太網連接(尤其是傳入)飽和,因此沒有理由使用 16 臺以上的服務器。 從亞馬遜那里購買它們特別愚蠢,因為與新西蘭的 DSL 客戶相比,它們往往連接良好。 如果啟動該服務確實產生了如此大的影響,那么您將受到新西蘭微薄的互聯網連接的自然限制,并且必須與所有其他新西蘭人共享。
在線應用程序的性能測試遠不止于飽和。 在下載或流式傳輸內容時,實際上保持打開狀態的打開線程和套接字是您逐個服務器消耗所有容量的地方。 下載內容需要時間,并且在下載或流式傳輸內容時,您失去了生成負載的能力。
除此之外,對于性能測試,您還不會發出請求以生成負載并將其釋放。 您正在記錄有關每個用戶的大量性能數據。 每次命中所花費的時間,傳輸的帶寬,錯誤以及類似性質的事情。
在 DSL 點上,帶寬限制很少在性能測試中完成,因為如果最終用戶連接不受應用程序公司的控制,則不會進行限制。
>
>(1)僅命中一個 Akamai 數據中心的問題的解決方案是什么? 您是否能夠克服該瓶頸并測試其他潛在瓶頸?
>
我們接受了這樣的風險,即我們實際上要測試一個 Akamai 的存在點,其強度要高于此次發布的程度。 但是,識別瓶頸是一項關鍵的學習,并且隨著流量的增長,運營團隊和他們的頭腦現在已經知道了解其閾值,這可能是需要逐步解決的問題。
>我也想知道:
>
>(2)在獲得
>
>方面是否存在任何挑戰-每 16 吉比特的傳輸速率 第二
>-每小時傳輸 6 TB 的數據
>
>到 Amazon AWS? 還是僅僅是產生足夠多的實例來獲得這種傳輸速率?
>
我很想告訴您是否有,但完全沒有挑戰。 只是產生 EC2 實例就給我們帶來了其他一切,包括看似開放的數據傳輸管道和磁盤訪問,以及 I / O 都可以正常工作。 實際上,在與亞馬遜合作進行了 3 年這些測試之后,我們從未遇到任何帶寬或 I / O 問題。
我喜歡這篇文章,感謝您撰寫。
托德(Todd)-如果您要花時間反駁某項陳述,最好花點時間進行拼寫檢查以提高信譽
除了 MySpace 本身之外,其他各方(Akamai 和/或沿途的其他運營商)是否也了解這種“受控 DoS”? 是否不增加容量來處理流量的突然增加,但至少要知道這是請求的合法流量,而不是某些 DoS 攻擊?
您可以從 Amazon 獲得如此多的實例和資源,這沒有問題,因為 Amazon 知道您是誰以及這是一家什么樣的公司,因此他們消除了對您帳戶的任何限制? 還是亞馬遜真的有這么多的產能供任何支付者使用?
該測試花了多長時間? 您準備了多長時間了?
您是否想念一些后來才意識到有用的數據?
您是在看到 MySpace 正在處理負載還是在從頭到尾從 0 到 1 磨時增加點擊量嗎?
對于我的一項工作,我們進行了類似的測試; 一切順利,直到我們開始生產為止。 即將發布的消息是,我們的某些后端日志記錄和報告系統正在執行 DNS 反向查找。 由于我們的測試來自有限的 IP 空間,因此查找并不是全部可見-但是由于數千名用戶使用不同的 IP 位置,我們發現這造成了巨大的瓶頸。 值得牢記。
哇,我無法想象必須處理所有的流量以及在“開放”期間可能出現的任何問題。 我已經處理了高流量的網站,但沒有像 Myspace 這樣的網站。
我從事表演業務,并使用云模擬了 40,000 個虛擬用戶。 這篇文章強調了我面臨的一些問題-大型數據集,將負載分散到可用區域等。還有一個我還沒有解決的問題,那就是 jmeter 無法像瀏覽器一樣進行并行下載。 當下載頁面命中的所有資源時,這反映在較大的事務響應時間中。 在澳大利亞和美國西部之間的每次請求中,RTT 為 250 毫秒也會使情況變得更糟。 到目前為止,我不得不在報告中說明這一點,盡管結果表明事務 x 花費了 12 到 15 秒之間的時間,但這實際上相當于 0.5 到 3.5 秒的響應時間,并且總吞吐量并不是瓶頸。
SOASTA 加載工具是否可以執行并行下載,您是否考慮了 250 毫秒的 RTT?
另一件事-如果同時有 100 萬新西蘭人同時使用 Myspace,那么那里的街道將空無一人。
哦,還有一件事。 當然,您可以從一臺筆記本電腦運行 1,000 個用戶。 您不會達到 1GB /秒的速度。 您的響應時間度量將反映測試硬件(而不是被測系統)中的延遲。 關鍵在于您的負載生成器是否可以及時處理網卡生成的中斷。
SeaPerf,為什么您不閱讀他的講話而不是尋找拼寫錯誤? 獲得生活。 沒有人需要互聯網上的另一位抱怨拼寫的笨蛋。
你好
感謝您的文章,這很有趣。 我正在研究這個主題,并且有一些問題。 也許你可以幫忙。
您如何定義我們需要強調的計算機數量。
例如,如果我在瓶頸所在的位置使用 apache bench,那么我可以同時運行 1000 個用戶嗎?
網絡,CPU 和 RAM 有一些瓶頸,如何定義它們?
對于較小的壓力測試,您建議使用哪種軟件? (Apache Bench,JMeter,Siege 等),以及如何定義場景? (使用 Jmeter 代理,處理 apache 訪問日志嗎?)
西里爾
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓