# AdStage 從 Heroku 遷移到 AWS
> 原文: [http://highscalability.com/blog/2017/5/1/the-adstage-migration-from-heroku-to-aws.html](http://highscalability.com/blog/2017/5/1/the-adstage-migration-from-heroku-to-aws.html)

*這是 AdStage 網站可靠性工程負責人 [G Gordon Worley III](https://www.linkedin.com/in/gworley3/) 的來賓[重新發布](https://medium.com/adstage-engineering/migrating-from-heroku-to-aws-our-story-80084d31025e)。*
我在 2013 年秋季加入 [AdStage](https://medium.com/@adstage) 時,我們已經在 Heroku 上運行了。 這是顯而易見的選擇:超級容易上手,比全尺寸虛擬服務器便宜,并且足夠靈活以隨著我們的業務發展。 成長,我們做到了。 Heroku 讓我們僅專注于構建引人注目的產品,而不會分散管理基礎結構,因此,到 2015 年末,我們同時運行了數千個 dynos(容器)以跟上客戶的發展。
我們需要所有這些功能,因為在后端,我們看起來很像[細分](https://medium.com/@segment),并且像它們一樣,我們的許多成本[與用戶數量](https://segment.com/blog/the-million-dollar-eng-problem/)成線性比例。 以 25 美元/ dyno /月的價格計算,加上其他技術成本,到 2016 年中期,我們的年度基礎設施支出將突破 100 萬美元,而這占了 COGS 的很大比例,因此需要數年才能實現盈利。 坦率地說,這種情況是不可持續的。 工程團隊開會討論了我們的選擇,一些快速計算表明我們為 Heroku 的便利每月要支付超過 10,000 美元,而類似資源將直接在 AWS 上花費。 如果我們從 Heroku 遷移,這足以證明工程師全職從事基礎架構工作,因此我的任務是成為第一位運營負責人,并帶頭進行向 AWS 的遷移。
這也是一個很好的時機,因為 Heroku 已成為我們最大的限制。 我們的工程團隊采用了[看板](https://en.wikipedia.org/wiki/Kanban_%28development%29)方法,因此理想情況下,我們會不斷產生從構思到完成的故事。 不過,當時我們正在生成大量正在進行的工作,這些工作通常會阻塞我們的發布渠道。 進行質量檢查的工作很緩慢,并且經常被送回以進行錯誤修復。 “ [在我的計算機](https://jcooney.net/archive/2007/02/01/42999.aspx)上正常工作”的情況經常出現,但是當暴露在我們的暫存環境中時會失敗。 由于 AdStage 是寫在不同技術堆棧上的相互依賴的服務的復雜組合,因此每個開發人員都很難使其工作站與生產保持最新狀態,這也使部署到生產和生產過程很緩慢,需要大量的人工干預 。 但是,我們在此問題上別無選擇,因為我們不得不將每個服務都部署為自己的 Heroku 應用程序,從而限制了自動化的機會。 我們迫切需要找到一種替代方法,使我們能夠自動化部署并為開發人員提供更早的訪問可靠測試環境的機會。
因此,除了通過遷移 Heroku 削減成本外,我們還需要清除質量檢查約束。 否則,我可以自由地設計我們的 AWS 部署,只要它以最少的代碼更改即可運行我們所有的現有服務,但我添加了一些需求:
* **簡單的系統管理** :我以前使用過 Chef 等工具,并希望避免從頭開始頻繁重建系統的容易出錯的過程。 我想通過登錄機器并運行命令來更新機器。
* **無聊** :我想使用已知有效的“無聊”技術,而不是嘗試一些新技術來解決其問題。 我想將風險集中在業務邏輯而不是基礎架構中。
* **零停機時間** :在 Heroku 上進行部署往往會導致我們的用戶遇到“漏洞”,原因是某些用戶請求花費的運行時間比 Heroku 允許的連接耗用時間更長。 我希望能夠消除這些斑點。
* **回滾** :如果部署出現問題,我希望能夠退出部署并使用最新的已知工作版本恢復服務。
* **有限的復雜度** :我將是唯一一個專職構建和維護我們的基礎架構的人,所以我需要確定項目的范圍以適應需求。
知道 [Netflix](https://medium.com/@NetflixTechBlog) [設法通過](http://highscalability.com/blog/2015/11/9/a-360-degree-view-of-the-entire-netflix-stack.html)[在 AWS 上運行](http://techblog.netflix.com/2013/03/ami-creation-with-aminator.html)數十億美元的業務,沒有比亞馬遜的機器映像和自動縮放組更完美,我決定遵循他們的可靠方法,但絕對沒有 意味著“性感”的方法:構建機器映像,使用它在自動伸縮組中創建實例,將其放在彈性負載均衡器之后,并將負載均衡器連接到 DNS 記錄,以使我們的客戶以及彼此可以訪問它們。
因此,我著手構建我們的 AWS 部署策略。
### 成為 AWS Sumo
在對系統進行工程設計時,我喜歡花很多時間在進行設計之前先仔細考慮并測試假設。 Rich Hickey 將此稱為[吊床驅動開發](https://www.youtube.com/watch?v=f84n5oFoZBc)。
我們的辦公室沒有吊床,所以我使用了[相撲躺椅](https://www.sumolounge.com/)。

在 2016 年春季的幾個月中,我思考并思考并整理了 AWS 部署系統的基礎。 它的架構看起來像這樣:

它的核心是我們所謂的 AdStage 統一圖片。 此機器映像用于為所有環境(從開發和測試到過渡和生產)中的所有服務創建實例。 它上面是我們所有存儲庫的副本以及運行它們所需的依賴項。 根據一些實例標簽的值,實例可以以不同的方式出現以反映其用法。
例如,當一個實例以“審閱”模式出現時,所有服務及其從屬數據庫在該實例上一起運行并相互通信。 這樣,進行開發和質量檢查的工程師就可以訪問運行任意代碼版本的完整堆棧的隔離版本。 他們在這些評論框上所做的任何操作均不會影響登臺或制作,也不會與其他評論框進行交互,從而完全消除了我們以前的質量檢查/登臺限制。 另外,只要審核框通過質量檢查,就可以對它進行成像,然后將該圖像部署到生產中。
之所以可行,是因為當實例以“登臺”或“生產”模式啟動時,它還會告知其應運行的服務。 這是由實例從其自動伸縮組繼承的標簽確定的,這使我們可以啟動運行相同代碼的實例隊列,以分散客戶的負載。 對于服務于 Web 請求的自動伸縮組,它們連接到彈性負載均衡器,該均衡器在我們的服務器之間平均分配請求。 負載平衡器為我們提供了一個固定點,我們可以在該固定點上平穩地交換實例,從而實現零停機時間部署,并使回滾就像將舊版本的統一映像保留在備用數據庫中一樣容易交換。
但是,我們使用的 AWS 資源無法完全協調自身,因此我們編寫了一個使用 AWS API 做到的 Ruby [Thor](https://github.com/erikhuda/thor) 應用程序。 它負責啟動審閱框,構建映像,然后將這些映像部署到暫存和生產環境中。 它會在將負載均衡器切換到新版本之前自動驗證部署是否正常運行,如果部署完成后檢測到問題,則會建議回滾。 它還使用一些巧妙的技巧來協調多個部署并鎖定關鍵資源,以防止多個工程師破壞彼此的部署,因此任何人都可以啟動部署,盡管如果這會引起沖突,它們將被停止。
這涵蓋了我們的所有需求:成像實例使系統管理變得容易,設置無聊且被廣泛使用,部署過程固有的停機時間為零,支持回滾的部署是自動化的,并且在小于 1500 的情況下并不是很復雜 而且,由于它解決了質量保證約束,并且據我們估計將節省 10,000 美元的運營支出,因此剩下的只是計劃從 Heroku 到 AWS 的實時遷移。
### 實時遷移
2016 年 7 月是舊金山的典型節日。 大部分時間,霧氣和寒冷的空氣使我一直在里面工作,而在我們辦公室對面的街道上,準備不足的游客在 [Dragon's Gate](https://www.lonelyplanet.com/usa/san-francisco/attractions/dragons-gate/a/poi-sig/383985/361858) 上拍了自拍照時發抖。 同樣,因為一切都準備從 Heroku 遷移到 AWS,所以我們要做很多工作。
我們的客戶依靠我們來管理他們的廣告活動,自動化他們的廣告支出并報告他們的廣告效果。 當我們陷入困境時,它們又陷入了直接通過網絡界面手動創建和更新廣告的黑暗時代。 當我們切換到 AWS 時,他們負擔不起我們離線的費用,因此我們將不得不進行實時遷移。 或至少與合理生活一樣。
我們實施了 1 周的代碼凍結,并在星期六的早晨找到了 1 小時的窗口,那時我切換了數據庫和其他在運行時不易移動的服務,而 AdStage 進入維護模式。 在準備過程中,我們已經進行了登臺系統的遷移,并編寫了一部劇本,可用于停產。 我使用代碼凍結花了一周的時間來調整 AWS 部署,以匹配 Heroku 部署。 周六上午一切似乎都很好。 我們失敗了,我切斷了數據庫,然后重新啟動了 AdStage。 我花了整整一天的時間看監視器,并靠近鍵盤,以防萬一發生任何問題,但是什么也沒做。 那天晚上我睡著了,以為一切都很好。
在一個 la 懶的星期天早晨之后,我開始在下午收到一些警報,提示我們的進口商正在備份。 當我們研究這個問題時,問題很快就變得顯而易見:盡管名義上擁有更多的計算資源,但在某種程度上,我們在 AWS 上的 CPU 數量要少于 Heroku。 結果,我們無法跟上,并且每小時我們都越來越落后。 為了避免隊列溢出,我們不得不降低導入的頻率,最終我們不得不重新打開 Heroku 應用程序以與 AWS 一起運行以跟上工作量。 這與省錢相反。
我們發現,Heroku 一直在告訴我們一個幸福的謊言。 官方每個 dyno 僅獲得 2 個 [ECU](https://aws.amazon.com/ec2/faqs/#What_is_an_EC2_Compute_Unit_and_why_did_you_introduce_it) ,但實際情況是,由于我們 Heroku 上的鄰居沒有充分利用它們的全部份額,我們接近了 6 個。 這意味著我們的 AWS 實例數量太少了 3 倍,盡管 Heroku 確實便宜很多! 如果只有一種方法可以為更多實例支付更少的費用……
那就是我們開始使用競價型實例的時候。 我們曾考慮過使用它們,因為它們的價格約為按需價格的 1/10,但它們存在一定的風險,因為如果您的底價低于拍賣價,它們可以隨時終止。 幸運的是,這種情況很少發生,否則,自動伸縮組會為您管理點實例的復雜性。 另外,如果備份臨時擴展組使用按需部署的按需實例,則很容易,如果我們暫時無法獲得足夠的競價型實例來滿足我們的需求,則可以通過單個命令進行擴展。 我們最終能夠將約 80%的機隊轉換為現場實例,盡管使用的資源比原始預期多了 3 倍,但我們的成本卻降低到了預期目標之內。
### 結論
除了我們對容量的意外低估外,從 Heroku 切換到 AWS 的過程也很順利。 不過,請不要誤會我的意思:這是值得做的,因為我們已經達到了將我們的一些基礎設施運營納入內部的經濟規模才有意義。 如果我們不花費至少一名工程師的薪水來購買運營成本,而可以通過改用 AWS 來節省運營成本,并且如果基礎架構沒有成為核心能力,那么我們將堅持使用 Heroku 并讓那個人(我!)來工??作 在對我們的業務更重要的事情上。 只是由于經濟和流程的變化,從 Heroku 遷移到 AWS 成為了我們的故事的一部分。
Heroku 在 AWS 上運行,因此您不必進行過多的遷移就可以減少中間商。
...或者您雇用知道如何正確運行數據中心的人員。
感謝您的帖子。 非常有趣,只是有幾個問題:圖像如何獲得其初始配置? 您提到要避免使用 Chef / Puppet 之類的東西,但是大概您仍然需要一些可重復的過程來使用初始配置來構建 AMI。 那是雷神應用程序的功能嗎?
您應該嘗試進行性能調整,例如 JVM 調整,線程池調整等,以降低基礎架構成本。
似乎沒有這么多麻煩就節省了很多。 您節省了全職人員成本,但是在 AWS 上通常需要 DevOps 成本,在 Heroku 中,Dev 團隊可以解決。 放大/縮小測功機與 EC2 相比,哪一個更容易?
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓