# AWS 的驚人規模及其對云的未來意味著什么
> 原文: [http://highscalability.com/blog/2015/1/12/the-stunning-scale-of-aws-and-what-it-means-for-the-future-o.html](http://highscalability.com/blog/2015/1/12/the-stunning-scale-of-aws-and-what-it-means-for-the-future-o.html)

[James Hamilton](http://www.mvdirona.com/jrh/work/) ,亞馬遜副總裁兼杰出工程師,以及[博主](http://perspectives.mvdirona.com/)長期從事有趣的話題,在 [AWS 上進行了熱情洋溢的演講:](https://reinvent.awsevents.com/) [AWS 創新規模](https://www.youtube.com/watch?v=JIQETrFC_SQ) 上的 Invent 2014 。 他顯然為他們正在做的工作感到自豪,這表明了。
James 分享了有關 AWS 的一些驚人數據:
* 1 百萬活躍客戶
* 所有其他 14 個云提供商的總和是 AWS 總容量的 1/5(2013 年 Gartner 估計)
* 2014 年發布了 449 種新服務和主要功能
* 作為一家年收入達 7 億美元的企業(2004 年),AWS 每天都會增加足夠的新服務器容量來支持亞馬遜的全球所有基礎架構。
* S3 的數據傳輸同比增長 132%
* 數據中心的網絡容量為 102Tbps。
演講的主題是云是一個不同的世界。 這是一個特殊的環境,允許 AWS 大規模地做偉大的事情,而您做不到的事情,這就是為什么從內部 x86 服務器到公共云的過渡正以驚人的速度發生的原因。 公有云具有如此眾多的規模驅動優勢,這是無法停止的過渡。 云將以您無法開始與有限資源,通才裝備,膨脹的軟件堆棧,緩慢的供應鏈和過時的創新范式匹配的速度,變得越來越可靠,功能更多,價格更低。
至少是 PR 消息。 但是您可以說的關于亞馬遜的一件事就是他們正在生活。 他們使它成為現實。 因此,一個健康的懷疑是健康的,但推斷命運的界限也是明智的。
AWS 擁??有命運決定權的多變之一是資源。 在擁有一百萬個客戶的情況下,他們有足夠的規模來保持擴展和改善的動力。 利潤沒有被提取出來,金錢被重新投資了。 這也許是規模最重要的優勢。
但是沒有聰明人的錢簡直就是浪費。 亞馬遜希望您知道他們有聰明人。 我們聽說過 Google 和 Facebook 如何建立自己的設備,亞馬遜也是如此。 他們構建了自己的網絡設備,網絡軟件,機架,并且與 Intel 合作獲得了比市場上更快的處理器版本的處理器。 關鍵是他們對環境一無所知,并且可以控制一切,因此他們可以制造出更簡單的設備來實現自己想要的功能,從而最終變得更便宜,更可靠。
完全控制允許將質量指標內置到所有內容中。 指標推動系統各個部分的質量不斷提高,這就是為什么在創新步伐加快的情況下,AWS 變得更加可靠的原因。 大量可操作的數據轉化為知識是規模的另一個巨大優勢。
AWS 不能做的另一件事是可用區架構本身。 每個可用區都是其自己的數據中心,一個區域內的可用區非常靠近。 這減少了消息傳遞延遲,這意味著可以在 AZ 之間同步復制狀態,與冗余數據中心相距甚遠的典型方法相比,這可以大大提高可用性。
這是一次充滿信息的演講,而且……實在太夸張了。 演講的真正元主題是亞馬遜如何有意識地利用規模來獲得競爭優勢。 對于亞馬遜來說,擴展規模不僅是要花的錢,如果您知道如何擴展規模,它就是一種資源。
這是詹姆斯·漢密爾頓令人難以置信的談話的掩飾...
## 對話中的所有內容都具有規模
* 當 AWS 成為年收入 7B 的企業(2004 年)時,每天都會增加足夠的新服務器容量來支持 Amazon 的所有全球基礎架構。
* 一年 365 天,組件制造商必須與服務器和存儲制造商聯系,服務器和存儲制造商必須生產齒輪并將其推入物流渠道,必須將其從物流渠道轉移到正確的數據中心 ,它必須到達裝貨平臺,人們必須在那里將機架輪到 DC 中的正確位置,必須有電源,散熱,網絡連接,必須加載應用堆棧,必須進行測試 ,它必須發布給客戶。
* S3 使用率:數據傳輸量同比增長 132%; EC2 使用量:使用量同比增長 99%; AWS 的整體業務:超過一百萬的活躍客戶。
* 所有其他 14 個云提供商的總和是 AWS 總容量的 1/5(Gartner 在 2013 年估計)
* 擁有超過一百萬的客戶,這意味著您處于一個豐富的生態系統中。 您可以選擇軟件供應商,如果您以前遇到過別人可能遇到的問題,則可以更快地完成工作。
* 如此高的增長速度意味著亞馬遜擁有資源,可以通過增加其提供的服務的廣度和深度來繼續進行再投資和創新。
* 通常,經濟效益要好得多時,例如從大型機到 UNIX 服務器,然后從 UNIX 服務器到 x86 服務器,就會發生大的轉變。 這些過渡通常需要 10 年以上的時間。 x86 本地遷移到云的不同之處在于它發生的速度。 云遷移的速度是具有很高的經濟價值的功能,而且采用的摩擦也很低。 您不需要軟件,不需要硬件,就可以做到。
## 聯網中存在較大的成本問題
* 聯網是整個行業的紅色預警情況。 這是一場完美的風暴。
* **問題 1** :相對于所有其他設備的成本,網絡成本正在不斷上升。 這是反摩爾定律。 所有其他設備的成本都在下降,隨著時間的流逝,網絡變得越來越昂貴。 每月相對費用:服務器:57%; 網絡設備:8%; 功率分配和冷卻:18%; 功率:13%; 其他:4%。
* **問題 2** :在網絡變得越來越昂貴的同時,網絡與計算的比率也在上升。 部分原因是摩爾定律在服務器上仍在起作用,并且計算密度也在不斷提高。 部分原因是,隨著計算成本的下降,執行的高級分析數量將增加,并且分析需要占用大量網絡資源。 解決使用大量服務器的大問題需要大量的網絡。 網絡流量已向東西方向移動,而不是傳統的 [南北方向](http://highscalability.com/blog/2012/9/4/changing-architectures-new-datacenter-networks-will-set-your.html) 。
* 5 年前,Amazon 的解決方案是數據驅動的并且是激進的:**他們根據自己的網絡設計**構建。 建立了特殊路由器。 雇用了一個團隊來構建協議棧,一直到頂部。 他們自己將所有這些都部署在了網絡中。 全球所有服務都在此設備上運行。
* **這種策略原來便宜得多**。 僅網絡設備的支持合同就花費了數千萬美元。
* **可用性提高了**。 改進的來源是簡單性。 AWS 試圖解決的問題比企業齒輪要解決的問題更簡單。 企業設備必須遵守許多未使用的復雜規范,只會使系統更加脆弱。 僅實現所需的功能就意味著可以簡化系統,從而提高可用性。 任何取勝的方法都是取勝的好方法。
* **指標**的聚寶盆。 他們衡量一切。 規則是,如果客戶在使用他們的系統時體驗不好,他們的指標必須顯示出來。 這意味著指標一直在提高,因為客戶問題推動了指標的提高。 一旦有了可以準確反映客戶體驗的指標,就可以設定目標,以使系統變得更好。 每周都會進行改進,以使事情變得更好。 如果代碼起步不好,那么隨著時間的推移它就會變得更好。
* **可測試性**。 他們的裝備更好,因為他們進行了更好的測試。 企業級設備很難進行大規模測試。 他們創建了一個耗資 4000 萬美元的測試平臺,其中包含 8000 臺服務器(3 兆瓦)。 但是由于這是云,他們有效地租用了幾個月的服務器,因此價格相對便宜。
## 從最上層到網絡接口卡的逐層網絡解釋
### AWS 全球網絡骨干
* 全球 11 個 AWS 區域。 根據與客戶的接近程度或所需的管轄范圍選擇要使用的那些。
* 專用光纖鏈路將大多數主要區域互連。 這樣可以避免所有容量規劃問題(Amazon 可以進行更好的容量規劃),對等問題以及在公共鏈接上發生的緩沖問題。 因此,運行自己的網絡速度更快,更可靠,更便宜且延遲更短。
### 示例 AWS 區域(美國東部((弗吉尼亞北部))
* 所有區域至少都有兩個可用區。 美國東部有五個可用區。
* 冗余路徑通向運輸中心。
* 每個區域都有冗余的運輸中心。 轉運中心將專用鏈接連接到其他 AWS 區域,將專用鏈接連接到 AWS Direct Connect 客戶,并通過對等和付費轉接連接到 Internet。
* 如果一個可用區發生故障,所有其他可用區繼續工作。
* 可用區之間的城域 DWDM 鏈接
* 區域中有 82,864 根纖維束
* AZ 間隔小于 2ms,通常間隔小于 1ms。 從等待時間的角度來看,它們在幾公里之內非常接近。 相隔足夠遠以確保安全,相隔足夠遠以獲得良好的延遲。
* 可用區之間的峰值流量為 25Tbps
* AWS 提供可用區,因為:
* 使用單個加固的數據中心,您將獲得的最佳可靠性約為 [99.9%](http://en.wikipedia.org/wiki/High_availability) 。 高可靠性要求在兩個數據中心中運行。 傳統上,數據中心的多樣性來自相距很遠的兩個數據中心,因為保持數據中心相互靠近的成本效益不高。 這意味著更長的等待時間。 LA 到 NEW 是往返 74ms。 提交給 SSD 的時間為 1 到 2 毫秒。 您不能等待 70 毫秒以上的時間才能提交交易。 這意味著應用程序在本地提交,然后復制到第二個數據中心。 在故障情況下,這種設計會在故障轉移期間丟失數據。 盡管真正的故障很少發生,例如建筑物燒毀,但瞬態故障更常??見,例如負載平衡器問題。 那么,您是否會在 3 分鐘內對您的連接進行故障轉移? 不可以,因為數據將丟失,并且需要很長時間才能從其他來源恢復該數據。 因此,您將失去常見事件的可用性。
* 可用區間隔為毫秒,因此您可以同時提交兩個可用區。 這意味著,如果您進行故障轉移,則由于數據復制是同步的,客戶將無法得知。 它是不可見的。 很難為該模型編寫代碼,因此您不會為所有事情做到這一點。 對于某些應用程序,對多可用區故障的擔心也可能會阻止您使用多個可用區,但是對于其余應用程序,這是一個非常強大的模型。 成本更高,但是它為 AWS 提供了某些優勢。
### 示例 AWS 可用區
* 可用區始終是完全獨立的建筑物中的數據中心。
* 亞馬遜擁有 28 多個數據中心。 加號表示 AZ 中有更多數據中心,作為擴展 AZ 能力的一種方式。 在可用區中添加了更多數據中心以擴展可用區的容量。 否則,即使您不想這樣做,也將不得不將應用程序劃分為多個可用區。
* 一些可用區具有相當大的數據中心大小。
* AZ 中的 DC 間隔小于 1/4 毫秒。
### 示例數據中心
* AWS 數據中心故意不是巨大的。 單個數據中心的功率為 25-30 兆瓦,具有 50,000-80,000 臺服務器
* 數據中心規模的回報減少。 隨著您構建的規模越來越大,數據中心擴展的優勢下降了。 早期的優勢是巨大的。 后來的優勢很小。 從 2000 機架增加到 2500 機架要好一些。 一個很小的數據中心太昂貴了。 真正的大型數據中心僅比機架中型數據中心貴一點。
* 數據中心越大,風險越大。 爆炸半徑如果出現問題并破壞了數據中心,則損失太大。
* 到數據中心的網絡容量為 102Tbps。
### 機架示例,服務器& NIC
* 唯一重要的延遲是連接兩端的軟件延遲。 發送消息時,兩個服務器之間的延遲:
* 您的應用->來賓操作系統->虛擬機管理程序-> NIC:延遲為毫秒
* 通過網卡:延遲為微秒
* 光纖上的:等待時間為納秒
* SR-IOV( [單根 I / O 虛擬化](http://www.redbooks.ibm.com/abstracts/redp5065.html?Open) )允許 NIC 在硬件網卡中提供虛擬化。 每個來賓都有自己的網卡。 好處是>平均延遲減少 2 倍,>延遲抖動增加 10 倍。 這意味著離群值下降到原來的 1/10。 SR-IOV 現在正在新的實例類型上部署,并且最終將在任何地方使用。 困難的部分不是添加 SR-IOV,而是添加了隔離,計量,DDoS 保護以及容量限制,這使得 SR-IOV 在云環境中很有用。
## AWS Custom Server &存儲設計
* 負面情況的成本不高,因此可以取消昂貴的不需要的保護。 服務器是針對其功能而設計的,而不是針對一般用戶。 亞馬遜確切地知道服務器將在什么環境中運行,他們會確切地知道何時出現問題,因此可以在設計時減少工程空間。 對于他們來說,服務器故障的代價并不是很大。 它們已經在現場,并且非常擅長更換硬盤等。因此,企業設備中的許多注意事項都是不必要的。
* **可以用力推動處理器**。 他們知道散熱要求,影響機械設計,他們只是設計好的服務器,因此可以從服務器中獲得更多性能。 盡管與英特爾亞馬遜的合作關系使處理器的運行速度比在公開市場上購買的處理器要快。
* 例如,他們自己的儲物架設計。 它重達一噸,寬 19 英寸,可容納 864 個磁盤驅動器。 對于某些工作負載而言,這是一款出色的改變游戲規則的設計,可幫助他們在某些地區獲得更高的價格。
## 電源基礎架構
* 亞馬遜已經設計并建造了自己的變電站。 它只節省一點錢,但是他們可以更快地構建它們。 公用事業公司不習慣應對 AWS 的增長速度,因此他們不得不自己建立。
* 3 個 100%碳中和地區:美國西部(俄勒岡州),AWS GovCloud(美國),歐盟(法蘭克福)
## 創新的快節奏
* 2014 年發布了 449 個新服務和主要功能。2008 年為 24 個,2009 年為 48 個,2010 年為 61 個,2011 年為 82 個,2012 年為 159 個,2013 年為 280 個。
* 隨著創新步伐的加快,AWS 變得越來越可靠。 他們的目標是向客戶提供與實現這種創新速度和高質量相同的工具。
## 相關文章
* 在[黑客新聞](https://news.ycombinator.com/item?id=8875549)上/在 [reddit](http://www.reddit.com/r/programming/comments/2s6nf6/the_stunning_scale_of_aws_and_what_it_means_for/) 上
* James Hamilton 的 [博客](http://perspectives.mvdirona.com/) 以及其他 [討論和幻燈片](http://mvdirona.com/jrh/work/)
* [深入了解 AWS 的大規模規模](http://www.enterprisetech.com/2014/11/14/rare-peek-massive-scale-aws/) 和 [,有關黑客新聞](https://news.ycombinator.com/item?id=8643248) / [on reddit](http://www.reddit.com/r/programming/comments/2n5p8c/a_rare_peek_into_the_massive_scale_of_aws/)
* [十億個數據包生命中的一天](https://www.youtube.com/watch?v=Zd5hsL-JNY4)
* [亞馬遜如何以及為什么進入云計算業務?](http://www.quora.com/How-and-why-did-Amazon-get-into-the-cloud-computing-business)
輕微錯字。 “到數據中心的 10Tbps 網絡容量。” 它應顯示為“到數據中心的 102Tbps 網絡容量”。 參考:https://www.youtube.com/watch?v = JIQETrFC_SQ(26:40)
更正,謝謝喬爾
還有“每周 365 天零件制造商”-我認為應該是“一年 365 天” ...?
已更正,謝謝 Krys。 我讀了十遍,每次都錯過了。
只是澄清一下,Gartner 的確切報價是:“ AWS 是壓倒性的市場領導者,使用的計算能力是其他 14 家提供商的總和的五倍多”,并且在 2013 年。情況可能已經發生變化。 自 2013 年以來,隨著 Azure 和 App Engine 的增長,
來源: [http://www.theregister.co.uk/2013/08/19/amazon_gartner_magic_quadrant/](http://www.theregister.co.uk/2013/08/19/amazon_gartner_magic_quadrant/)
“ spunk”是在池塘的這一側具有完全不同含義的單詞之一。 也許要避免:)
關于“快速創新步伐”的注釋很有趣,因為盡管 AWS 每周發布新功能(有時還發布服務),但我們發現所發布的內容缺乏質量。
我們不斷有大量的公開支持案例,其中發現了我們使用的服務中的錯誤。 讓 AWS 確認問題的存在通常很痛苦,然后要花幾周甚至幾個月才能解決問題。 有時這些問題似乎很關鍵,有時很煩人。
如果我們不訂閱他們的支持產品,我不確定如何獲得答案。
很多時候,即使我不得不承認該部分是值得商—的,功能似乎也沒有經過深思熟慮,這可能是過早發布,經常發布的情況。
最重要的是,我寧愿看到不太快速的創新,而將重點放在提供穩定的基礎架構服務上。 穩定地說,我并不是在指 EC2 的普遍可用性(我同意這要好得多),而是要提供更多的質量保證和更快的錯誤修復時間。
精彩演講的精彩文章。 感謝您編寫它,它給了我時間慢慢進行所有操作,總的來說,這真是令人印象深刻:)
嘿,您可能希望對本文進行快速的復制編輯,因為其中有很多語言/語法故障,使您分心。 除此之外,還不錯的文章。 在公開發布它并從 reddit 之類的站點進行鏈接之前,只需確保您已經通過了一個不錯的復制編輯器。
你能舉個喬納森的例子嗎? 這比一般的批評更有幫助。 文本特意簡短且斷斷續續,以供快速瀏覽,這是一種樣式選擇,它不是典型的文章格式,因此為簡潔起見,經常會忽略語法。 在我的網站上只有我一個人,所以我成為了自己的副本編輯器,所以有時我會犯錯。
如今,您自己的專用服務器 8GB RAM 2TB 磁盤的價格每月不到 30 美元,而類似的 Amazon 機器則要貴 6 倍。 除了超成功的創業公司的微不足道的優勢(可能需要在一小時內購買 100 臺機器)外,沒有任何優勢。
這很令人著迷,但我也對許多普通用戶的成本效益表示懷疑。 我有客戶在亞馬遜上花費數萬美元,并在亞馬遜之上構建服務,這些服務可以復制到機架中擁有的設備成本的十分之一。 這些是有利可圖的服務,具有可觀但可預測的流量,并且并沒有瘋狂增長。 甚至那個 Facebook 游戲公司都說他們在亞馬遜上發布,但是一旦游戲達到可預測的增長曲線,他們就會轉向擁有的便宜基礎設施。 現在,您可以在低功耗但完全適合典型 Web 工作負載的商品消費硬件上使用開源資源構建類似 AWS 和 Heroku 的私有功能……甚至還可以獲取每個節點都被視為一次性使用的 HA 功能。 如果正確地構建自己的東西,則可以通過這些公共云服務節省大量資金。
> >如果正確構建架構,則可以通過這些公共云服務節省大量資金。
是的,不是,如果您像迅猛發展一樣,并且/或者計算需求出現非常不可預測的高峰和下降,那么除非您想擁有數十臺或數百臺服務器,否則您可能無法以更低的價格或足夠快的速度進行調整 ,未充分利用大量時間,因此您有足夠的能力來滿足這些需求。
另一方面,如果您的工作負載處于穩定狀態,則只要沒有問題,就可以節省一些錢。 只要確保您正在比較蘋果之間。 不要將您擁有的 10 個服務器放在一個區域內的數據中心中,與在全球范圍內分布在具有獨立電源,冗余連接路徑的多可用性區域中的 10 臺服務器相同,如果架構正確, 可以在幾分鐘內將容量翻倍,翻倍或翻倍。
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓