# 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
> 原文: [http://highscalability.com/blog/2015/7/20/algolias-fury-road-to-a-worldwide-api-steps-part-2.html](http://highscalability.com/blog/2015/7/20/algolias-fury-road-to-a-worldwide-api-steps-part-2.html)

我們為開發人員和開發人員回答的最常見問題是關于[我們的體系結構](http://highscalability.com/blog/2015/3/9/the-architecture-of-algolias-distributed-search-network.html)以及我們如何實現如此高的可用性。 他們中的一些人對裸機服務器的高可用性持懷疑態度,而另一些人則對我們如何在全球范圍內分發數據持懷疑態度。 但是,我更喜歡的問題是“初創企業如何建立這樣的基礎架構”。 的確,對于一個年輕的公司,我們當前的架構令人印象深刻:
* 我們的高端專用計算機在全球 13 個地區托管,擁有 25 個數據中心
* 我們的主從設置會在至少 3 臺不同的計算機上復制我們的搜索引擎
* 我們每個月處理超過 60 億個查詢
* 我們每個月接收和處理超過 200 億次寫操作
就像羅馬不是一天建成的,我們的基礎架構也不是很好。 本系列文章將探討我們在構建基礎架構時采取的 15 個工具步驟。 我什至將討論我們的中斷和錯誤,以便您了解我們如何使用它們來改進我們的體系結構。
該系列的 [第一篇博客文章](http://highscalability.com/blog/2015/7/13/algolias-fury-road-to-a-worldwide-api.html) 專注于我們 Beta 的早期。 這篇博客文章將重點介紹從 2013 年 9 月到 2014 年 12 月我們服務的前 18 個月,甚至包括我們的首次停機!
## 步驟 4:2014 年 1 月
### 部署是高可用性的大風險
目前,我們的主要關注之一是確保我們的發展敏捷,同時又不以犧牲穩定性為代價。 因此,我們開發了一個包含 6,000 多個單元測試和 200 多個非回歸測試的測試套件,以確保代碼更改不會引入新的錯誤。 不幸的是,這還不夠。 通過我們所有測試的一項新功能引入了一個生產錯誤,該錯誤導致 [八分鐘的索引停機時間](https://blog.algolia.com/postmortem-todays-8min-indexing-downtime/) 。 值得慶幸的是,由于我們的體系結構旨在將搜索查詢與索引分開,因此不會影響搜索查詢。
此問題幫助我們確定了高可用性設置中的幾個問題:
* 回滾需要很快,因此我們開發了使用單個命令行執行回滾的功能。
* 部署腳本需要執行完整性檢查,并在出現錯誤時自動回滾,因此我們將其添加到了部署過程中。
* 我們不應該僅僅因為測試通過 而部署到所有生產集群。 在此問題之后,我們對集群進行了一系列部署。 我們從測試集群開始,然后是社區集群(免費客戶),最后是付費用戶集群。
今天,當要測試一項新功能時,我們的部署有所不同。 我們選擇一組集群進行測試,然后使用以下步驟進行部署:
1. 部署到所選集合的所有群集中的第一臺計算機。
2. 監視 24 小時,然后部署到所選集中所有群集中的第二臺計算機。
3. 監視 24 小時,然后部署到所選集中所有群集中的第三臺計算機。
4. 幾天后,我們部署到了所有生產集群。
使用這種方法,我們能夠在幾個小時內檢測到幾乎不可能通過單元測試發現的錯誤。 由于我們每月有數十億的查詢,因此這種檢測是可能的。
# 第 5 步:2014 年 3 月
### 管理大量寫操作
當我們在加拿大/東部和歐洲/西部的集群很好地處理了我們的增長時,我們開始解決一個新問題:延遲。 來自亞洲的集群的延遲太高,無法獲得令人滿意的性能。 我們決定首先通過在 AWS 中部署計算機來測試市場。 我們不愿意做出選擇,因為即使使用 AWS 提供的最佳 CPU(當時的 E5-2680),搜索查詢的性能也比 E5-2687W CPU 低 15%! 我們這樣做是為了減少啟動實驗的時間,但要確保不引入對 AWS 的任何依賴關系。 如果測試成功,這使我們可以輕松地遷移到其他提供商。 在紙上,一切看起來都不錯。 當我們發現他們的虛擬化不支持 AVX 指令時,我們遇到了一個問題,這對我們來說是重要的功能。 我們必須生成沒有 AVX 指令集的二進制文件(這再次降低了搜索查詢的性能)。
在享受我們最近在新加坡推出的服務時,我們開始收到一些來自歐洲客戶的投訴,他們抱怨他們的搜索查詢延遲時間增加。 我們很快發現它與大量的索引操作相關聯,這很奇怪,因為我們確信索引和搜索 CPU 使用率之間的體系結構劃分正常工作。 經過調查,我們發現用于處理寫操作的整個集群的分布式一致性的共識算法存在潛在的瓶頸。 當出現瓶頸時,它將阻塞 HTTP 服務器線程。 然后,這將導致搜索查詢需要等待線程。 我們是無意中設計造成的!
我們通過在達成共識之前實施隊列來解決此問題。 它使我們能夠收到大量的寫操作,進行批處理,然后將其發送給共識。 共識不再存在于 HTTP 服務器的序列中,因此寫操作無法再凍結 HTTP 服務器線程。 在正常操作期間,除了將作業傳遞給共識以外,隊列什么都不做。 在出現峰值的情況下,它允許我們在達成共識之前進行緩沖和批量處理。 進行此更改后,我們沒有凍結任何群集。
## 步驟 6:2014 年 4 月
### 一個數據中心幾乎無法實現網絡高可用性
從 2014 年 4 月開始,我們開始收到使用在加拿大/東部使用集群的美國東部客戶的投訴。 我們在美國西部的用戶沒有受到影響。 我們立即懷疑加拿大和美國東部之間存在網絡問題,并發現我們的提供商正在報告同一問題。 一場車禍使蒙特利爾和紐約之間的一根含 120 根纖維的管道破裂。 所有的交通都在經過芝加哥的不同路徑上進行。 不幸的是,帶寬不足以防止數據包丟失。 中斷不僅影響了我們的提供商,而且影響了加拿大和美國東部之間的所有流量。 這類事故可能會破壞我們經常忘記的互聯網,但仍然可能發生。 那天我們除了幫助每個客戶并通知他們當前的情況外,無能為力。
就在這一天,我們開始了一場大型基礎設施討論。 我們需要依靠更多的提供商,數據中心和網絡提供商來提高高可用性。 更重要的是,我們需要在美國擁有基礎設施。 通過從加拿大為美國服務,我們可以削減成本,但高可用性受到了影響。 我們需要真正分布我們的基礎架構。 我們不能再在一個提供商上擁有多個可用區!
## 步驟 7:2014 年 7 月
### 首次在兩個數據中心中部署
我們發現在單個數據中心中進行部署是不夠的。 我們決定從最大的客戶之一開始,在兩個不同的數據中心(它們之間相距 100 公里以上)部署一臺機器。 這兩個數據中心使用的是同一提供程序(相同的自治系統),并且已經提供了高可用性級別,比云提供程序的多個可用性區域略高一點。 這是由于兩個數據中心位置在網絡鏈接和電源單元方面完全不同。
根據我們過去的經驗,我們花了這段時間來設計具有下一代 CPU 和 SSD 的硬件的下一版本:
* Xeon E5-1650v2(6 核,12 線程,3.5Ghz-3.9Ghz)
* 128G RAM
* 英特爾 SSD S3500(2x480G)或 S3700(2x400G)。 我們將 intel S3700 用于每天寫入量較高的計算機,因為它們更耐用
我們所做的更改主要圍繞 CPU。 我們從未在 E5-2687W 上使用 100%的 CPU。 E5-1650v2 是下一代 CPU,并提供了更高的時鐘速度。 結果是,與以前的 CPU 相比,我們的服務速度提高了近 15%。 毫秒很重要!
## 步驟 8:2014 年 9 月
### 在美國的存在!
在與數家提供商進行了數月的討論之后,我們于 2014 年 9 月在美國東部(弗吉尼亞州)和美國西部(加利福尼亞州)與一家新提供商一起啟動了該服務。 由于更好的延遲和帶寬,第一步是改善我們在美國搜索體驗的好方法。 高可用性方面的改進并不大,但是確實有助于我們更靈活地應對加拿大和美國東部之間過去的問題。 我們使用的方法與以前的位置相同:一家提供商內的可用區域不同(不同的網絡設備和電源單元)。
## 步驟 9:2014 年 10 月
### 通過廚師進行自動化
隨著我們需要管理的計算機數量的大量增加,我們將管理遷移到了 Chef。 以前,我們使用 Shell 腳本管理計算機,但是與 Chef 進行自動化相比,修復 Heartbleed(OpenSSL 漏洞)等安全問題非常耗時。
Chef 所提供的自動化功能在配置數百臺機器時非常有用,但它也有缺點。 遷移到 Chef 幾個月后,菜譜中的錯字導致某些生產服務器崩潰。 幸運的是,我們能夠盡早發現問題。 由于推出了廚師客戶的 CRON 工作具有非侵略性,因此對生產沒有太大影響。 我們有足夠的時間來做出反應并解決問題。
我們非常幸運遇到此問題,因為該錯誤可能會破壞生產。 為了避免再次發生此類問題,我們決定將生產手冊分為兩個版本:
* 第一個版本(穩定版)已部署到所有集群的第一臺和第二臺計算機上
* 第二個版本(生產版本)已部署在所有集群的第 3 臺計算機上
對我們的菜譜進行任何修改時,我們首先將修改應用于生產版本。 經過幾天的測試,我們將修改應用于穩定的食譜版本。 高可用性需要在所有級別上應用!
## 第 10 步:2014 年 11 月
### DNS 是體系結構中的 SPoF
隨著時間的流逝,我們開始收到越來越多的用戶反饋,指出我們的服務間歇性地變慢,尤其是在亞洲。 經過調查,我們發現.io TLD 的使用是造成此問題的原因。 事實證明,.io TLD 的任意播網絡的位置少于主要 TLD(.net,.com 和.org)的位置,并且 DNS 服務器超載。 用戶有時在 DNS 解析期間會遇到超時。
我們與 CDN 提供程序討論了此問題,他們都告訴我們最佳實踐是使用.net TLD。 我們需要從.io 遷移到.net! 在準備發布分布式搜索網絡時,我們決定遷移到另一個 DNS 提供商。 該新提供商提供了鏈接域功能,這意味著它們將處理 [algolia.io](http://algolia.io) 和 [algolia 之間的同步。 net](http://algolia.net) ,這樣我們就可以輕松地保持向后兼容性。
我們從不同的位置對該遷移進行了廣泛的測試,并感到一切正常。 不幸的是,在完成遷移之后,我們發現了一些影響我們某些用戶的問題。 您可以在 [此博客文章](https://blog.algolia.com/black-thursday-dns-issue/) 中閱讀詳細的報告。 DNS 比我們意識到的要復雜得多。 DNS 提供程序有許多不同的行為,我們的測試并未涵蓋所有這些行為(例如,首先使用 IPv6 解析,在 TTL 上使用不同行為等)
這個問題也改變了我們識別 SPoF 的想法。 只有一個 DNS 提供程序是 SPoF,由于沒有回退,因此遷移非常關鍵。 我們開始制定一項計劃,以刪除架構中的任何 SPoF。
## 下一個
至此,我們已經涵蓋了本系列 15 個步驟中的 10 個。 正如您所看到的,我們推出后的頭 18 個月并非一帆風順。 我們經歷了幾次故障,不得不重新考慮基礎架構的幾個部分。 這些改進的目的是始終確保我們的基礎架構將來幾乎不可能面臨類似的問題。
本博客系列的下一部分和最后一部分將重點介紹 DSN(分布式搜索網絡),它是我們最引以為傲的功能,并提高了我們的高可用性。 兩者都有一個目標:在可靠性和性能方面滿足大型上市公司的期望。
*以下是該系列的所有三個部分:[第 1 部分](http://highscalability.com/blog/2015/7/13/algolias-fury-road-to-a-worldwide-api.html),[第 2 部分](http://highscalability.com/blog/2015/7/20/algolias-fury-road-to-a-worldwide-api-steps-part-2.html),[第 3 部分](http://highscalability.com/blog/2015/7/27/algolias-fury-road-to-a-worldwide-api-part-3.html)*
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓