# Swiftype 如何以及為何從 EC2 遷移到真實硬件
> 原文: [http://highscalability.com/blog/2015/3/16/how-and-why-swiftype-moved-from-ec2-to-real-hardware.html](http://highscalability.com/blog/2015/3/16/how-and-why-swiftype-moved-from-ec2-to-real-hardware.html)

*這是 [Oleksiy Kovyrin](https://twitter.com/kovyrin) 的來賓帖子, [Swiftype](https://swiftype.com/) 。 Swiftype 目前為超過 100,000 個網站提供搜索功能,每月提供超過 10 億個查詢。*
當 Matt 和 Quin 在 2012 年創立 Swiftype 時,他們選擇使用 Amazon Web Services 建立公司的基礎架構。 云似乎是最合適的選擇,因為它很容易在不管理硬件的情況下添加新服務器,并且沒有前期成本。
不幸的是,盡管某些服務(如 Route53 和 S3)最終對我們來說確實非常有用且非常穩定,但使用 EC2 的決定卻在我們成立的第一年困擾了團隊一些主要問題。
Swiftype 的客戶需要卓越的性能和始終可用的可用性,而我們能否提供這些功能在很大程度上取決于我們基礎架構的穩定性和可靠性。 在 Amazon 中,我們**遇到了網絡問題,VM 實例掛起,不可預測的性能下降(可能是由于嘈雜的鄰居共享我們的硬件**,但沒有辦法知道)以及許多其他問題。 無論我們遇到什么問題,亞馬遜始終有相同的解決方案:通過購買冗余或高端服務向亞馬遜支付更多錢。
我們花在解決 EC2 問題上的**時間越多,我們為客戶開發新功能**的時間就越少。 我們知道可以使我們的基礎架構在云中工作,但是要做的工作,時間和資源遠比遷移要大得多。
經過一年的云斗爭,**我們決定將 EC2 保留為真正的硬件**。 幸運的是,這不再意味著要購買您自己的服務器并將它們放在機架中。 托管主機提供商有助于物理硬件,虛擬實例和快速配置之間的良好平衡。 鑒于我們以前在托管服務提供商方面的經驗,我們決定選擇 SoftLayer。 他們出色的服務和基礎架構質量,供應速度以及客戶支持使其成為我們的最佳選擇。
經過一個多月的辛苦工作,準備進行數據中心間遷移,我們能夠以零停機時間執行遷移,并且對客戶沒有負面影響。 **從第一天開始,向真實硬件的遷移就極大地改善了服務的穩定性,為所有關鍵基礎架構組件帶來了巨大的(?2 倍)性能提升,并將每月托管費用降低了約 50%**。
本文將解釋我們如何計劃和實施遷移過程,詳細介紹在過渡后我們看到的性能改進,并為年輕的公司提供有關何時執行此操作的見解。
## 準備交換機
遷移之前,我們在 Amazon EC2 上有大約 40 個實例。 我們每周至少 2-3 次(有時每天)會遇到嚴重的生產問題(實例中斷,網絡問題等)。 一旦決定遷移到真正的硬件,我們就知道我們的工作已經完成,因為我們需要在不中斷服務的情況下切換數據中心。 準備過程涉及兩個主要步驟,每個步驟在下面的單獨部分中都有專門的解釋:
1. **連接 EC2 和 SoftLayer** 。 首先,我們在 SoftLayer 的數據中心中構建了新基礎架構的骨架(最小的服務器子集,能夠以開發級的負載運行所有關鍵的生產服務)。 一旦建立了新的數據中心,我們就會在新舊數據中心之間建立一個 VPN 隧道系統,以確保兩個數據中心中組件之間的透明網絡連接。
2. **對我們的應用程序**的架構更改。 接下來,我們需要對應用程序進行更改,以使它們既可以在云中也可以在我們的新基礎架構上運行。 一旦應用程序可以同時存在于兩個數據中心中,我們便建立了一條數據復制管道,以確保云基礎架構和 SoftLayer 部署(數據庫,搜索索引等)始終保持同步。
### 步驟 1:將 EC2 和 Softlayer 連接
為遷移做準備的第一件事之一就是弄清楚如何將 EC2 和 SoftLayer 網絡連接在一起。 不幸的是,使用 EC2 的虛擬私有云(VPC)功能將一套 EC2 服務器連接到另一個專用網絡的“正確”方法對我們來說不是一種選擇,因為如果沒有以下方法,我們無法將現有實例集轉換為 VPC 停機時間。 經過一番考慮和周密的計劃,我們意識到,真正需要能夠跨越數據中心邊界相互連接的唯一服務器是我們的 MongoDB 節點。 我們可以做的其他所有事情都可以使數據中心本地化(Redis 群集,搜索服務器,應用程序群集等)。

由于我們需要互連的實例數量相對較少,因此我們實施了一個非常簡單的解決方案,事實證明,該解決方案對于我們的需求是穩定且有效的:
* 每個數據中心中都部署了專用的 OpenVPN 服務器,該服務器將所有客戶端流量 NAT NAT 到其專用網絡地址。
* 每個需要能夠連接到另一個數據中心的節點都將在此處建立 VPN 通道并設置本地路由,以將指向另一個 DC 的所有連接正確轉發到該隧道。
以下功能使我們的配置非常方便:
* 由于我們沒有控制任何一方的網絡基礎架構,因此我們無法真正迫使任一端的所有服務器通過連接到另一個 DC 的中央路由器來集中其流量。 在我們的解決方案中,每個 VPN 服務器(在某種自動化的幫助下)決定通過隧道路由哪些流量,以確保所有客戶端的完整 DC 間連接。
* 即使 VPN 隧道崩潰了(令人驚訝的是,這僅在項目的幾周內發生了幾次),這僅意味著一臺服務器失去了與另一 DC 的傳出連接(一個節點從 MongoDB 集群中退出,有些 工作服務器將失去與中央 Resque 框的連接,等等)。 那些一次性的連接丟失不會影響我們的基礎架構,因為所有重要的基礎架構組件的兩端都具有冗余服務器。
### 步驟 2:對我們的應用程序進行架構更改
在準備遷移的幾周內,我們必須對基礎架構進行許多小的更改,但是對它的每個組成部分都有深刻的了解有助于我們做出適當的決策,從而減少了過渡期間發生災難的可能性 。 我認為,幾乎所有復雜性的基礎架構都可以通過足夠的時間和工程資源進行遷移,以仔細考慮在應用程序和后端服務之間建立的每個網絡連接。

以下是我們為確保平穩透明遷移所必須采取的主要步驟:
* 所有無狀態服務(緩存,應用程序集群,Web 層)均獨立部署在每一側。
* 對于每個有狀態后端服務(數據庫,搜索集群,異步隊列等),我們都必須考慮是否要(或可以負擔得起)將數據復制到另一端,或者是否必須引起數據中心間的延遲 對于所有連接。 一直以來,依靠 VPN 一直是最后的選擇,最終我們能夠將數據中心之間的流量減少到一些小的復制流(主要是 MongoDB)以及與無法復制的服務的主/主副本的連接 。
* 如果可以復制服務,則可以這樣做,然后使應用程序服務器始終使用或偏愛該服務的本地副本,而不是轉到另一端。
* 對于我們無法使用其內部復制功能進行復制的服務(例如我們的搜索后端),我們對應用程序進行了更改,以實現數據中心之間的復制,在此數據中心的每一側的異步工作人員都將從各自的隊列中提取數據, 總是將所有異步作業都寫入兩個數據中心的隊列中。
### 步驟 3:翻轉開關
當雙方都準備好為 100%的流量提供服務時,我們通過將 DNS TTL 降低到幾秒鐘來確保快速的流量變化,為最終的切換做好了準備。
最后,我們將流量切換到新的數據中心。 將請求切換到新基礎架構,對客戶的影響為零。 一旦流向 EC2 的流量耗盡,我們便禁用了舊數據中心,并將所有剩余的連接從舊基礎結構轉發到了新基礎結構。 DNS 更新需要時間,因此在截止時間之后至少一周的時間內,我們的舊服務器上會看到一些剩余流量。
### 明顯的改進:從 EC2 遷移到實際硬件后的結果
**穩定性提高了**。 每周我們要避免 2-3 次嚴重的故障(大多數故障對于客戶而言是不可見的,因為我們盡了最大的努力使系統能夠應對故障,但是許多故障會喚醒某人或迫使某人放棄家庭時間) 每月 1-2 次中斷,我們可以通過花費工程資源來提高系統對故障的適應性,并減少故障對我們客戶可見的可用性產生影響的機會,從而更徹底地處理故障。
**性能提高了**。 多虧了 SoftLayer 提供的現代硬件,我們看到了所有后端服務(尤其是 IO 綁定的服務,例如數據庫和搜索集群,但也有 CPU 綁定的應用程序服務器)的性能持續提高,更重要的是, 性能更可預測:沒有與我們的軟件活動無關的突然下降或上升。 這使我們可以開始進行實際容量規劃,而不必在所有性能問題上拋出更慢的實例。
**成本降低**。 最后,但同樣重要的是,對于一家年輕的初創公司而言,我們的基礎架構每月成本下降了至少 50%,這使我們能夠過度配置某些服務,從而進一步提高性能和穩定性,從而使客戶受益匪淺。
**供應靈活性提高了,但是供應時間卻增加了**。 現在,我們可以精確地指定服務器以滿足其工作量(大量磁盤并不意味著我們需要功能強大的 CPU)。 但是,我們無法再通過 API 調用在幾分鐘內啟動新服務器。 SoftLayer 通常可以在 1-2 個小時內將新服務器添加到我們的機隊中。 對于某些公司來說,這是一個很大的折衷,但是對于 Swiftype 來說,這是一個很好的選擇。
## 結論 [
自從改用真正的硬件以來,我們有了長足的發展-我們的數據和查詢量增長了 20 倍-但我們的 API 性能比以往任何時候都要好。 確切了解服務器的性能將使我們以前所未有的方式規劃增長。
根據我們的經驗,當您需要快速啟動新硬件時,云可能是個好主意,但只有在您做出巨大努力(Netflix 級)以在其中生存時,它才能很好地工作。 如果您的目標是從一開始就建立企業,而您又沒有多余的工程資源可用于支付“云稅”,那么使用真實的硬件可能是一個更好的主意。
*如果您對軟件和基礎架構交叉領域的工程技術充滿熱情,Swiftype 將聘請高級技術運營工程師。*
[關于黑客新聞](https://news.ycombinator.com/item?id=9212467)
[上 reddit](http://www.reddit.com/r/programming/comments/2z9xwp/how_and_why_swiftype_moved_from_ec2_to_real/)
很棒的文章。 我只需要添加 Google 工程師的一些明智的話即可(我忘了看到它的地方,但一定是演示文稿):不要期望在距離上同步復制數據。 編碼應用程序以解決此問題是更好的方法。 您可能會失去性能,但最終不會出現數據不一致的情況
嗨,有趣的文章,您使用的實例類型和操作系統是什么? 您使用的是原始 AMI 還是其他東西?
每當我看到公司何時離開亞馬遜并經歷成本下降時,我都會大笑和哭泣:)我來自波蘭,但是許多國家/地區都有自己的云服務提供商,因此每個人都應該檢查他們,然后再尋求更大的參與者。 我為數百個客戶和平均值進行了許多計算。 波蘭云與亞馬遜的成本比較表明,亞馬遜的價格比我選擇的提供商高 7 到 20 倍。 我知道這些提供商無法擴展到 1000Gbps 或 PB 數據,但是如果人們遇到網絡問題和性能下降,他們仍然使用如此糟糕的提供商真是可笑。
我為幾天的活動做了很多設置,并且它總是像魅力一樣發揮作用。 兩種設置工作了幾個月(一切都按計劃進行),我沒有遇到任何問題。
你們有什么特殊的原因要選擇 DigitalLacean 而不是 SoftLayer。 根據 DigitalOcean 網站的性能基準,它們便宜 90%,但性能更好。
只是好奇。
有趣的帖子,Oleksiy。 我自己廣泛使用 EC2 和 Softlayer,得出了不同的結論。
Softlayer 的后端網絡并不如我所愿穩定。 我曾嘗試在其中運行分布式文件系統(例如 glusterfs),但不得不放棄-網絡太不可靠了。 盡管值得,但 Ceph 能夠更好地應對夜晚的顛簸,但它們仍然存在。
上次我檢查(最近幾個月內)無法從 SL 獲得 10G 網絡。 它來自 EC2。 此外,如果您自己想要一臺服務器,這是相當普遍的常識,您可以在 EC2 上配置哪些實例大小。
很高興到目前為止您的客戶服務經驗非常好。 物理服務器的問題之一是發生故障,并且在租用服務器時,您會被這些位卡住。 打開故障單,嘗試更換驅動器/任何部件,希望支持技術人員能夠充分了解并進行處理,而不是嘗試進行故障排除并告訴您系統是否正常。 我建議您記住短語“請升級”,并毫不猶豫地使用它。 在云環境中,您將啟動一個新實例并恢復工作,讓其他人處理硬件問題。
也就是說,與 EC2 相比,通過電話從 SL 中找到某人要容易得多。 :)
您沒有提到的一件事是,如果您想在 SL 獲得合理的價格,則需要從銷售代表處獲取報價。 根據我的經驗,這通常會大大降低系統的價格。
我認為最重要的是,如果您要為云構建應用程序,則需要設計一個解決方案,該解決方案在 Amazon 重新啟動您所使用的系統時不會崩潰。 但是,這不是唯一的情況-實例崩潰比服務器崩潰要痛苦得多。
很高興為您解決!
眾所周知,Netflix 擁有 EC2 上所有最好的服務器。 他們引導 30,000 臺計算機并運行性能測試,然后僅保留前 5%的數據并關閉所有其他實例。 但是,請注意,您的開發團隊可能經驗不足,無法充分利用 EC2。 Netflix 和 Reddit 在 EC2 上運行沒有問題。
當您談到降低成本時,你們與 SoftLayer 達成任何特別交易,合同等嗎? 還是僅通過支付公共價格表就可以從 AWS 跳到 SoftLayer?
由于 Softlayer 確實是 IBM 的事實,他們可能確實獲得了更好的交易。
我認為對于 Netflix 和 reddit,他們肯定可以通過聯系人訪問特殊服務器。
我不確定為什么甚至可以與數字海洋進行比較,我們不要忘記 softlayer 托管了 whatsapp。
對于如此大的環境,停機率令我感到驚訝。 該基礎結構是作為現代臨時和自動伸縮堆棧實現的,還是傳統堆棧設計? 我已經管理了 AWS 中成千上萬個節點的平臺,故障率低得多。
沒有任何基礎設施是完美的。 我想知道該平臺在傳統環境中的長期故障率,尤其是 MTTR。 此外,在較慢的物理環境中進行創新的機會成本是多少?
我們在 EC2 上運行了 14K 實例。 如果僅在 40 個實例上看到 VM 掛起等問題,則不確定部署是否正確。 這種遷移對于小型環境是可行的。 除了 AWS 或自己推出自己的服務以外,沒有太多其他用于大規模操作的選項
我希望您也殺了您的主要帳戶。 :)
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓