# Google 和 eBay 關于構建微服務生態系統的深刻教訓
> 原文: [http://highscalability.com/blog/2015/12/1/deep-lessons-from-google-and-ebay-on-building-ecosystems-of.html](http://highscalability.com/blog/2015/12/1/deep-lessons-from-google-and-ebay-on-building-ecosystems-of.html)

當您查看 Google,Twitter,eBay 和 Amazon 的大型系統時,它們的體系結構已演變為類似的東西:**一組多語言微服務**。
當您處于多語言微服務最終狀態時,會是什么樣? [Randy Shoup](https://www.linkedin.com/in/randyshoup) 曾在 Google 和 eBay 的高層職位上進行過非常有趣的演講,探討了這個想法:[大規模服務體系結構:Google 和 eBay 的經驗](http://www.infoq.com/presentations/service-arch-scale-google-ebay)。
我真正喜歡 Randy 的演講的是,他如何自我意識地使您沉浸于您可能沒有經驗的事物的體驗中:創建,使用,持久化和保護大型體系結構。
在演講的*服務生態系統*部分中,Randy 問:擁有一個多語言微服務的大規模生態系統看起來像什么? 在*大規模運營服務*部分中,他問:作為服務提供商,運營這樣的服務感覺如何? 在*建立服務*部分中,他問:當您是服務所有者時,它是什么樣的? 在 *Service Anti-Patterns* 部分中,他問:哪里會出問題?
一個非常強大的方法。
對我來說,這次演講的重點是**,**,**激勵動機,**,一致主題的想法,這些主題貫穿了整個工作。 盡管從來沒有明確地提出將其作為單獨的策略,但這是為什么您希望小型團隊開發小型清潔服務,內部服務的收費模型如此強大,架構如何在沒有架構師的情況下可以發展,清潔設計可以如何發展的背后動機。 從下至上的過程,以及沒有中央委員會如何發展標準。
我的收獲是**動機的故意調整是您如何擴展大型動態組織和大型動態代碼庫**。 引入適當的激勵措施[會使](https://en.wikipedia.org/wiki/Nudge_(book))事情在沒有顯式控制的情況下發生,幾乎就像在刪除鎖,不共享狀態,與消息進行通信并并行化所有內容時,分布式系統中的更多工作一樣 。
讓我們看看現代系統是如何構建大規模系統的。
## 多語言微服務是終局游戲
* 大型系統最終演變成看起來非常相似的東西: **一組多語言微服務** 。 多種語言意味著微服務可以用多種語言編寫。
* **eBay** 成立于 1995 年。根據您的計算方式,它們屬于其體系結構的第 5 代。
* 最初是創始人在 1995 年勞動節周末寫的一個整體式 Perl 應用程序。
* 然后,它移至一個整體的 C ++應用程序,最終在單個 DLL 中包含了 340 萬行代碼。
* 以前的經驗促使人們轉向 Java 中分布更分散的分區系統。
* 當今的 eBay 具有相當多的 Java,但是一組多語言的微服務。
* **Twitter** 的演變非常相似。 根據您的計算方式,它們取決于其體系結構的第三代。
* 開始于單片 Ruby on Rails 應用程序。
* 在前端轉移到 Javascript 和 Rails 的組合,在后端轉移了很多 Scala。
* 最終,他們已經遷移到我們今天所說的一套多語言微服務。
* **Amazon** 遵循類似的路徑。
* 從單片 C ++應用程序開始。
* 然后用 Java 和 Scala 編寫的服務。
* 最后得到了一組多語言微服務。
## 服務生態系統
* 擁有多語種微服務的大規模生態系統看起來如何?
* 在 eBay 和 Google 上,成百上千的獨立服務一起工作。
* 現代大型系統以關系圖而不是層次結構或層級集合來構成服務。
* 服務依賴于許多其他服務,同時又依賴于許多服務。
* 較舊的大型系統通常按嚴格的等級進行組織。
### 如何創建服務生態系統?
* 這些性能最佳的系統比智能設計更是進化的**產品。 例如,在 Google,從來沒有一個集中的自上而下的系統設計。 隨著時間的流逝,它以一種非常有機的方式進化和成長。**
* 變異和自然選擇。 當需要解決問題時,會創建新服務,或更經常地從現有服務或產品中提取新服務。 **服務只要被使用**就可以生存,只要它們能夠提供價值,否則它們將被棄用。
* 這些大型系統**從下至上**發展。 **干凈的設計可以是一種緊急特性,而不是自上而下的設計**的產物。
* 作為示例,請考慮 Google App Engine 的一些服務分層。
* Cloud Datastore(NoSQL 服務)基于 Megastore(地理規模結構化數據庫),Megastore 基于 Bigtable(集群級結構化服務)構建,Bigtable 基于 Colossus(下一代集群文件系統)構建 )(基于 Borg(集群管理基礎架構)構建)。
* 分層很干凈。 每個圖層都會添加不屬于下方圖層的內容。 它不是自上而下設計的產品。
* 它是自下而上構建的。 Colossus,首先建立了 Google 文件系統。 幾年后,Bigtable 建成了。 幾年后,Megastore 建成了。 幾年后,云數據庫遷移到 Megastore。
* 如果沒有自上而下的體系結構,則可以將關注點分離得如此美妙。
* **這是沒有架構師**的體系結構。 Google 的所有人都沒有 Architect 的頭銜。 技術決策沒有中央批準。 大多數技術決策是由各個團隊根據自己的目的在本地做出的,而不是全球范圍內做出的。
* 與 2004 年的 eBay 形成對比。有一個體系結構審查委員會,該委員會必須批準所有大型項目。
* 通常,只有在更改項目為時已晚時,他們才參與項目。
* 集中批準機構成為瓶頸。 通常,它唯一的影響是在最后一分鐘說不。
* eBay 處理此問題的更好方法是**在審查委員會中編碼聰明有經驗的人的知識**,然后將**放入各個團隊可以重用的**。 將這些經驗編碼到一個庫或服務中,或者甚至是一組指南,人們可以自己使用它們,而不必在最后一刻才進入流程。
### 沒有架構師,標準將如何發展?
* 沒有中央控制的**可能最終以**標準化。
* 服務和公共基礎架構之間的通信趨向于發生**標準化。**
* 標準之所以成為標準,是因為它們比替代的更適合**。**
* 通常標準化的通信部分:
* **網絡協議**。 Google 使用稱為 [Stubby](https://www.quora.com/What-functionality-does-Google-have-around-Protocol-Buffers-that-isnt-included-in-the-current-public-release) 的專有協議。 eBay 使用 REST。
* **數據格式**。 Google 使用協議緩沖區。 eBay 傾向于使用 JSON。
* **接口模式標準**。 Google 使用協議緩沖區。 對于 JSON,有 JSON 模式。
* 通常標準化的常見基礎設施:
* 源代碼控制。
* 配置管理。
* 集群管理器。
* 監視系統。
* 警報系統。
* 診斷工具。
* 所有這些組件都可能脫離約定。
* 在進化環境中,**通過**來實施標準:代碼,鼓勵,代碼審查和代碼搜索。
* 鼓勵最佳實踐的最簡單方法是通過實際代碼。 這與自上而下的審查或前期的設計無關,而是與某人產生的代碼可以輕松完成工作有關。
* 鼓勵是通過**團隊提供一個庫**來進行的。
* 鼓勵也是通過您要依賴于支持 X 協議或 Y 協議的服務獲得的。
* Google 以**聞名,每一行代碼**都已簽到至少要由另一位程序員檢查過的源代碼控件**。 這是交流常規做法的好方法。**
* 除少數例外,Google 的每個工程師都可以**搜索整個代碼庫**。 當程序員試圖弄清楚如何做某事時,這是一個巨大的附加值。 在擁有 1 萬名工程師的情況下,您很可能會嘗試做某人以前已經做過的事情。 這允許從一個區域開始的**最佳實踐通過代碼庫**傳播。 它還允許錯誤傳播。
* 為了鼓勵通用做法和標準化約定**,做正確的事情**真的很容易,而做錯事情的難度會更大。
* 各個**服務彼此獨立。**
* Google 沒有**來標準化服務內部**。 服務是外面的黑匣子。
* 存在約定和通用庫,但是沒有編程語言要求。 通常使用四種語言:C ++,Go,Java,Python。 許多不同的服務都以各種語言編寫。
* 框架或持久性機制尚無標準化。
* **在成熟的服務生態系統中,我們標準化了圖的弧線,而不是節點本身。** 定義一個通用形狀,而不是通用實現。
### 創建新服務
* 新服務的使用已得到證實,便會創建它們。
* 通常針對一個特定用例構建了一項功能。 然后發現功能是通用且有用的。
* 組成了一個團隊,并將服務分解為自己的獨立單元。
* 僅當一項功能成功并且適合許多不同的用例時,才會發生這種情況。
* 這些**體系結構通過實用主義**得以發展。 沒有人坐在高處,說應該增加一項服務。
* Google 文件系統支持搜索引擎。 分布式文件系統更普遍可用也就不足為奇了。
* Bigtable 最初支持搜索引擎,但用途更為廣泛。
* Megastore 是作為 Google 應用程序的存儲機制而建立的,但用途更為廣泛。
* Google App Engine 本身由一小組工程師啟動,他們認識到需要幫助來構建網站。
* Gmail 來自內部項目,該項目在內部非常有用,然后被其他人外部化。
### 淘汰舊服務
* 如果不再使用服務會怎樣?
* 可以重新利用的技術被重用。
* 人們可以被解雇或重新部署到其他團隊。
* Google Wave 在市場上并不成功,但是其中一些技術最終出現在 Google Apps 中。 例如,多人編輯文檔的能力來自 Wave。
* 更常見的情況是核心服務要經過多代,而舊代則已棄用。 Google 經常發生這種情況。 變化是如此之大,以至于 Google 內部的每項服務似乎都已被棄用或尚未準備就緒。
## 建立服務
* 當您是服務所有者時,在多語言微服務的大規模系統中構建服務時會是什么樣?
* 大型體系結構中性能良好的服務是:
* **通用**。 它將具有一個簡單的定義明確的界面。
* **模塊化且獨立的**。 我們可以稱之為微服務。
* **不共享持久層**。 稍后再詳細介紹。
### 服務所有者的目標是什么?
* **滿足客戶的需求** 。 以適當的質量級別提供必要的功能,同時滿足協商的性能級別,同時保持穩定性和可靠性,同時不斷改進服務。
* **以最小的成本和精力滿足需求** 。
* 該**目標以鼓勵**使用通用基礎結構**的方式調整激勵**。
* 每個團隊的資源有限,因此要利用經過戰斗測試的通用工具,流程,組件和服務符合他們的利益。
* 它還可以激發良好的操作行為。 自動構建和部署服務。
* 它還鼓勵優化資源的有效利用。
### 服務所有者的職責是什么?
* **生成并運行**。
* 團隊通常是一個小團隊,擁有從設計到開發和部署,一直到退休的服務。
* 沒有單獨的維護或維護工程團隊。
* 團隊可以自由選擇自己的技術,方法和工作環境。
* 團隊應對自己做出的選擇負責。
* **服務作為有界上下文**。
* 團隊的**認知負擔是有限的**。
* 無需了解生態系統中的所有其他服務。
* 團隊需要深入了解其服務及其所依賴的服務。
* 這意味著**團隊可以非常小巧和敏捷**。 一個典型的團隊是 3-5 人。 (此外,美國海軍陸戰隊 [消防隊](https://en.wikipedia.org/wiki/Fireteam) 有四個人。)
* 較小的團隊規模意味著團隊內部的通信具有很高的帶寬和質量。
* 康韋定律對您有利。 通過組織小型團隊,您最終將只有幾個單獨的組件。
### 服務之間是什么關系?
* 即使您在同一家公司,也可以將服務之間的**關系視為供應商-客戶關系**。
* 要非常友好和合作,但在關系中要有條理。
* 要非常清楚所有權。
* 要非常清楚誰對什么負責。 在很大程度上,這與定義一個清晰的界面并進行維護有關。
* **激勵措施是一致的,因為客戶可以選擇是否使用服務**。 這鼓勵服務由其客戶來做。 這是最終構建新服務的方式之一。
* 定義 SLA。 由于服務提供商向其客戶承諾一定水平的服務,因此客戶可以依賴該服務。
* **客戶團隊為服務**付費。
* **為服務收費符合經濟激勵**。 它激勵雙方在資源使用方面非常高效。
* 當事物為**時,我們傾向于不對其進行估價,也不傾向于對其進行優化**。
* 例如,一個內部客戶免費使用 Google App Engine,他們使用了大量資源。 要求他們提高其資源使用效率不是一個好策略。 退款開始后一周,他們就可以通過一兩個簡單的更改將其 GAE 資源消耗減少 90%。
* 使用 GAE 的團隊并不是邪惡的,他們還有其他優先事項,因此沒有動力去優化 GAE 的使用。 事實證明,使用更高效的體系結構,它們實際上獲得了更好的響應時間。
* **收費還激勵服務提供商保持較高的質量**,否則內部客戶可能會去其他地方。 這直接激勵了良好的開發和管理實踐。 代碼審查就是一個例子。 Google 的大規模構建和測試系統是另一個。 Google 每天都會運行數百萬次自動測試。 每次在存儲庫中接受代碼時,都會對所有相關代碼進行驗收測試,這有助于所有小型團隊保持其服務質量。
* 退款模型**鼓勵進行小幅增量更改**。 較小的更改更容易理解。 同樣,代碼更改的影響是非線性的。 千行變更的風險比 100 行變更的風險高 10 倍,而風險高出 100 倍。
* **保持接口**的完全向后/向前兼容性。
* 請勿破壞客戶端代碼。
* 這意味著維護多個接口版本。 在某些討厭的情況下,這意味著維護多個部署,一個部署用于新版本,其他部署用于舊版本。
* 通常由于增量更改較小,因此不會更改接口。
* 具有明確的棄用策略。 然后,強烈希望服務提供商將所有客戶端從版本 N 移到版本 N + 1。
## 大規模運營服務
* 作為服務提供商,在多語言微服務的大規模系統中操作服務的感覺如何?
* **可預測的性能是一項要求。**
* 大規模服務**非常容易受到性能變化**的影響。
* **性能的可預測性**比平均性能重要得多。
* 性能不一致的低延遲實際上根本不是低延遲。
* 當客戶提供一致的性能時,對它進行編程很容易。
* 由于服務使用許多其他服務來執行其工作,因此尾巴延遲主導著性能。
* 想象一下,一個服務在中值處有 1 毫秒的延遲,而在 99.999%的位置(萬分之一),延遲是一秒。
* 撥打一個電話意味著您的時間慢了 0.01%。
* 如果您使用的是 5,000 臺計算機(就像 Google 的許多大型服務一樣),那么您的速度就會降低 50%。
* 例如,memcached 的百萬分之一問題被追溯到低級數據結構重新分配事件。 隨著等待時間的增加,這個罕見的問題浮出水面。 事實證明,像這樣的低級細節在大型系統中非常重要。
* 深度彈性。
* 服務中斷更有可能是由于人為錯誤而不是硬件或軟件故障引起的。
* 對機器,群集和數據中心的故障具有彈性。
* 調用其他服務時進行負載平衡并提供流量控制。
* 能夠快速回滾更改。
* 增量部署。
* **使用金絲雀系統**。 不要一次部署到所有計算機。 選擇一個系統,將該軟件的新版本放在該系統上,然后查看其在新世界中的行為。
* 如果**有效,則開始分階段推出**。 首先是 10%的機器,然后是 20%的機器,以此類推。
* 如果在部署中的 50%點發生問題,那么您應該能夠回滾。
* eBay 使用**功能標志將代碼部署與功能部署**分離。 通常,代碼是在功能關閉的情況下部署的,然后可以將其打開或關閉。 這樣可以確保在啟用新功能之前可以正確部署代碼。 這也意味著,如果新功能存在錯誤,性能問題或業務故障,則可以在不部署新代碼的情況下關閉該功能。
* 您可能會發出太多警報,而您永遠不會受到太多監視。
## 服務反模式
* **大型服務**
* 一項服務過多。 您想要的是一個非常小的清潔服務生態系統。
* 做得太多的服務就是**只是另一個整體**。 難以推理,難以擴展,難以更改,并且還會創建比您想要的更多的上游和下游依賴項。
* **共享持久性**
* 在分層模型中,服務放在應用程序層中,而持久層則作為通用服務提供給應用程序。
* 他們在 eBay 上進行了此操作,但**無效**。 它**破壞了服務的封裝**。 應用程序可以通過更新數據庫將**后門連接到您的服務**中。 最終導致重新引入服務耦合。 共享數據庫不允許松散耦合的服務。
* 微服務通過小巧,隔離和獨立來防止此問題,這是使生態系統保持健康和成長的方式。
## 相關文章
* 關于 [HackerNews](https://news.ycombinator.com/item?id=10657251)
* 蘭迪·舒普[在 Twitter](https://twitter.com/randyshoup) 上
* [微服務-不是免費的午餐!](http://highscalability.com/blog/2014/4/8/microservices-not-a-free-lunch.html)
* [Google On Latency Tolerant Systems:由不可預測的部分組成可預測的整體](http://highscalability.com/blog/2012/6/18/google-on-latency-tolerant-systems-making-a-predictable-whol.html)
* [10 個易趣的星球擴展尺度](http://highscalability.com/blog/2009/11/17/10-ebay-secrets-for-planet-wide-scaling.html)(2009)
像所有其他文章一樣。 這篇文章令人著迷。
我想知道微服務具體做什么? Gmail 和 Google Wave 聽起來不夠小,不能被視為可以由小型團隊完成的微服務。
很棒的帖子! 我希望您能詳細說明不同的工程團隊如何“使用服務付費”。 我完全同意,圍繞激勵機制組織大型團隊要比自上而下的設計優越得多,而讓團隊付費使用其他團隊服務是其中的一部分。 但是實際上,您如何實際跟蹤服務的“付款”? 你真的是說錢嗎? 還是您在指其他?
-克里斯
>定義一個通用形狀,而不是通用實現。
找出*為什么*被認為是好的,這將更為有用。 我發現本文中的許多建議都缺乏推理。 這使得它們非常無用。
信息發布! 為了回答克里斯的問題,每個擁有很少微服務的產品團隊都應該有一個成本中心,可以向其他產品團隊收取使用費用。 大多數企業都擁有像 SAP 這樣的良好財務系統來跟蹤付款。 當為更多新服務提供資金時,這種“按需付費”的模式非常有效。 我希望這回答了你的問題。
-拉杰什
所有已知的問題/建議,但仍然是一個很好的談話,永遠不會老。 令人驚訝的是,許多公司沒有遵循這些基本原則。 技術演講的作者很容易理解,值得從事面向服務的體系結構工作的人們閱讀一次。
在 11 月 5 日舉行的紐約 Kubernetes 會議上,來自 Google 的一位人士說:“ Gmail 是數百種微服務。” http://www.meetup.com/New-York-Kubernetes-Meetup/events/226173240/
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓