# 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
> 原文: [http://highscalability.com/blog/2015/10/19/segment-rebuilding-our-infrastructure-with-docker-ecs-and-te.html](http://highscalability.com/blog/2015/10/19/segment-rebuilding-our-infrastructure-with-docker-ecs-and-te.html)

*這是[段](https://www.linkedin.com/in/calvinfo)的 CTO /聯合創始人 [Calvin French-Owen](https://www.linkedin.com/in/calvinfo) 的來賓[重新發布](https://segment.com/blog/rebuilding-our-infrastructure/)。*
在 Segment 成立之初,我們的基礎設施遭到了相當大的破壞。 我們通過 AWS UI 設置了實例,擁有未使用的 AMI 的墓地,并且通過三種不同的方式實現了配置。
隨著業務開始騰飛,我們擴大了 eng 團隊的規模和體系結構的復雜性。 但是,只有少數知道神秘奧秘的人才能從事生產工作。 我們一直在逐步改進流程,但是我們需要對基礎架構進行更深入的檢查,以保持快速發展。
所以幾個月前,我們坐下來問自己:*“如果今天設計基礎架構設置會是什么樣?”*
在 10 周的過程中,我們完全重新設計了基礎架構。 我們幾乎淘汰了每個實例和舊配置,將服務移至可在 Docker 容器中運行,并切換到使用新的 AWS 賬戶。
我們花了很多時間思考如何制作可審核,簡單易用的生產設置,同時仍具有擴展和增長的靈活性。
這是我們的解決方案。
## 單獨的 AWS 賬戶
我們沒有使用區域或標簽來分隔不同的暫存和生產實例,而是切換了完全獨立的 AWS 帳戶。 我們需要確保我們的配置腳本不會影響我們當前正在運行的服務,并且使用新帳戶意味著我們一開始就有空白。

`ops`帳戶用作跳轉點和集中登錄。 組織中的每個人都可以擁有一個 IAM 帳戶。
其他環境具有一組 IAM 角色,可以在它們之間進行切換。 這意味著我們的管理員帳戶只有一個登錄點,并且只有一個位置可以限制訪問。
例如,愛麗絲可能可以訪問所有三個環境,但是鮑勃只能訪問開發人員(因為他刪除了生產負載平衡器)。 但是它們都通過`ops`帳戶輸入。
無需復雜的 IAM 設置來限制訪問,我們可以輕松地按環境鎖定用戶并按*角色將其分組。* 通過界面使用每個帳戶就像切換當前活動角色一樣簡單。

不必擔心暫存盒可能不安全或會更改生產數據庫,我們免費獲得*真正隔離*。 無需額外配置。
能夠共享配置代碼的另一個好處是,我們的登臺環境實際上可以反映產品。 配置上的唯一區別是實例的大小和容器的數量。
最后,我們還啟用了各個帳戶的合并結算。 我們使用相同的發票支付每月帳單,并查看按環境劃分的費用的詳細分類。
## Docker 和 ECS
設置好帳戶后,就可以設計服務的實際運行方式了。 為此,我們轉向了 [Docker](https://docker.com/) 和 [EC2 容器服務(ECS)](https://aws.amazon.com/ecs/)。
截至今天,我們現在在 Docker 容器中運行我們的大多數服務,包括我們的 API 和數據管道。 容器每秒接收數千個請求,每月處理 500 億個事件。
Docker 最大的單一好處是在一定程度上使團隊能夠從頭開始構建服務。 我們不再需要復雜的配置腳本或 AMI,只需將生產集群交給一個映像即可運行。 不再有狀態的實例,我們保證在 staging 和 prod 上運行相同的代碼。
在將我們的服務配置為在容器中運行之后,我們選擇了 ECS 作為調度程序。
總體而言,ECS 負責在生產中實際運行我們的容器。 它負責調度服務,將它們放置在單獨的主機上,并在連接到 ELB 時重新加載零停機時間。 它甚至可以跨可用區進行調度,以提高可用性。 如果某個容器死亡,ECS 將確保將其重新安排在該群集中的新實例上。
切換到 ECS 大大簡化了服務的運行,而無需擔心新貴作業或預配實例。 就像添加一個 [Dockerfile](https://gist.github.com/calvinfo/c9ffb5c28133be525c62) ,設置任務定義并將其與集群關聯一樣簡單。
在我們的設置中,Docker 映像是由 CI 構建的,然后被推送到 Docker Hub。 服務啟動時,它將從 Docker Hub 中拉出映像,然后 ECS 在機器之間調度它。

我們會根據服務集群的關注程度和負載情況對其進行分組(例如,針對 API,CDN,App 等的不同集群)。 具有單獨的群集意味著我們可以獲得更好的可見性,并且可以決定為每個實例使用不同的實例類型(因為 ECS 沒有實例相似性的概念)。
每個服務都有一個特定的任務定義,該任務定義指示要運行哪個版本的容器,要運行多少個實例以及要選擇哪個集群。
在運行期間,服務向 ELB 進行自身注冊,并使用運行狀況檢查來確認容器實際上已準備就緒。 我們在 ELB 上指向本地 Route53 條目,以便服務可以相互通信,并僅通過 DNS 進行引用。

設置很好,因為我們不需要任何服務發現。 本地 DNS 為我們完成所有簿記工作。
ECS 運行所有服務,我們從 ELB 獲得免費的 cloudwatch 指標。 這比在啟動時向中央機構注冊服務要簡單得多。 最好的部分是我們不必自己處理國家沖突。
## 使用 Terraform 進行模板化
Docker 和 ECS 描述了如何運行我們的每個服務的地方, [Terraform](https://terraform.io/) 是將它們結合在一起的粘合劑。 從高層次上講,它是一組配置腳本,用于創建和更新我們的基礎架構。 您可以將其視為類固醇上的 Cloudformation 版本,但這并不能使您感到驚訝。
除了運行一組用于維護狀態的服務器外,還有一組描述集群的腳本。 配置在本地運行(并在將來通過 CI 運行)并致力于 git,因此我們可以連續記錄生產基礎架構的實際狀況。
這是用于設置堡壘節點的 Terraform 模塊的示例。 它創建了所有安全組,實例和 AMI,因此我們能夠輕松地為將來的環境設置新的跳轉點。
```
// Use the Ubuntu AMI
module "ami" {
source = "github.com/terraform-community-modules/tf_aws_ubuntu_ami/ebs"
region = "us-west-2"
distribution = "trusty"
instance_type = "${var.instance_type}"
}
// Set up a security group to the bastion
resource "aws_security_group" "bastion" {
name = "bastion"
description = "Allows ssh from the world"
vpc_id = "${var.vpc_id}"
ingress {
from_port = 22
to_port = 22
protocol = "tcp"
cidr_blocks = ["0.0.0.0/0"]
}
egress {
from_port = 0
to_port = 0
protocol = "-1"
cidr_blocks = ["0.0.0.0/0"]
}
tags {
Name = "bastion"
}
}
// Add our instance description
resource "aws_instance" "bastion" {
ami = "${module.ami.ami_id}"
source_dest_check = false
instance_type = "${var.instance_type}"
subnet_id = "${var.subnet_id}"
key_name = "${var.key_name}"
security_groups = ["${aws_security_group.bastion.id}"]
tags {
Name = "bastion-01"
Environment = "${var.environment}"
}
}
// Setup our elastic ip
resource "aws_eip" "bastion" {
instance = "${aws_instance.bastion.id}"
vpc = true
}
```
我們在階段和產品中使用相同的模塊來設置我們的個人堡壘。 我們唯一需要切換的是 IAM 密鑰,我們已經準備就緒。
進行更改也很輕松。 Terraform 不會總是拆除整個基礎架構,而會在可能的地方進行更新。
當我們想將 ELB 耗盡超時更改為 60 秒時,只需執行簡單的查找/替換操作即可,然后是`terraform apply`。 而且,兩分鐘后,我們對所有 ELB 進行了完全更改的生產設置。
它具有可復制性,可審核性和自我記錄性。 這里沒有黑匣子。
我們將所有配置都放在了`infrastructure`中央存儲庫中,因此很容易發現如何設置給定的服務。
不過,我們還沒有達到圣杯。 我們希望轉換更多的 Terraform 配置以利用模塊,以便可以合并單個文件并減少共享樣板的數量。
一路上,我們在`.tfstate`周圍發現了一些陷阱,因為 Terraform 始終首先從現有基礎架構中讀取數據,并抱怨狀態是否不同步。 我們最終只是將我們的`.tfstate`提交給了倉庫,并在進行了任何更改之后將其推送了,但是我們正在研究 [Atlas](https://atlas.hashicorp.com/) 或通過 CI 來解決該問題。
## 移至 Datadog
至此,我們有了基礎架構,配置和隔離。 最后剩下的是度量和監視,以跟蹤生產中正在運行的所有內容。
在我們的新環境中,我們已將所有指標和監視切換到 [Datadog](https://datadog.com/) ,這是出色的。

我們一直對 Datadog 的 UI,API 以及與 AWS 的完全集成感到非常滿意,但是要充分利用該工具,需要進行一些關鍵的設置。
我們要做的第一件事是與 AWS 和 Cloudtrail 集成。 它提供了 10,000 英尺的視圖,可了解我們在每個環境中發生的情況。 由于我們正在與 ECS 集成,因此 Datadog feed 會在每次任務定義更新時進行更新,因此最終會免費獲得部署通知。 驚人地搜索提要很容易,并且可以輕松地追溯到上一次部署或重新安排服務的時間。
接下來,我們確保將 Datadog-agent 作為容器添加到基本 AMI( [datadog / docker-dd-agent](https://hub.docker.com/r/datadog/docker-dd-agent/) )。 它不僅從主機(CPU,內存等)收集指標,而且還充當我們 statsd 指標的接收器。 我們的每項服務都會收集有關查詢,延遲和錯誤的自定義指標,以便我們可以在 Datadog 中進行瀏覽并發出警報。 我們的 go 工具包(即將開源)將自動在代碼行中收集 [`pprof`](https://golang.org/pkg/net/http/pprof/) 的輸出并將其發送,因此我們可以監視內存和 goroutine。
更酷的是,代理可以可視化環境中主機之間的實例利用率,因此我們可以對可能存在問題的實例或群集進行高層概述:

此外,我的隊友文斯(Vince)為 Datadog 創建了 [Terraform 提供程序,因此我們可以完全針對*實際生產配置*編寫警報腳本。 我們的警報將被記錄,并與產品中正在運行的警報保持同步。](https://github.com/segmentio/terraform-datadog)
```
resource "datadog_monitor_metric" "app.internal_errors" {
name = "App Internal Errors"
message = "App Internal Error Alerts"
metric = "app.5xx"
time_aggr = "avg"
time_window = "last_5m"
space_aggr = "avg"
operator = ">"
warning {
threshold = 10
notify = "@slack-team-infra"
}
critical {
threshold = 50
notify = "@slack-team-infra @pagerduty"
}
}
```
按照慣例,我們指定兩個警報級別:`warning`和`critical`。 `warning`可以讓當前在線的任何人知道某些東西看起來可疑,應在任何潛在問題發生之前就將其觸發。 `critical`警報是為嚴重的系統故障而“半夜醒來”的問題保留的。
更重要的是,一旦我們過渡到 Terraform 模塊并將 Datadog 提供程序添加到我們的服務描述中,那么所有服務最終都會獲得*免費*的警報。 數據將直接由我們的內部工具包和 Cloudwatch 指標提供動力。
## 讓好時光泊塢窗運行
一旦我們將所有這些組件準備就緒,就可以開始進行轉換了。
我們首先在新的生產環境和舊的生產環境之間建立了 [VPC 對等連接](http://docs.aws.amazon.com/AmazonVPC/latest/UserGuide/vpc-peering.html)-允許我們對數據庫進行集群并在兩者之間進行復制。
接下來,我們對新環境中的 ELB 進行了預熱,以確保它們可以處理負載。 亞馬遜不會提供自動調整大小的 ELB,因此我們不得不要求他們提前對其進行調整(或緩慢調整規模)以應對增加的負載。
從那里開始,只需要使用加權的 Route53 路由將流量從舊環境穩定地增加到我們的新環境,并不斷監視一切都看起來不錯。
如今,我們的 API 蓬勃發展,每秒處理數千個請求,并且完全在 Docker 容器內運行。
但是我們還沒有完成。 我們仍在微調我們的服務創建,并減少樣板,以便團隊中的任何人都可以通過適當的監視和警報輕松構建服務。 而且,由于服務不再與實例相關聯,因此我們希望圍繞容器的使用改進工具。
我們還計劃關注這一領域的有前途的技術。 [Convox](https://convox.com/) 團隊正在圍繞 AWS 基礎架構構建出色的工具。 [Kubernetes](http://kubernetes.io/) ,[中層](https://mesosphere.com/), [Nomad](https://nomadproject.io/) 和 [Fleet](https://github.com/coreos/fleet) 看起來像是不可思議的調度程序,盡管我們喜歡 ECS 的簡單性和集成性。 看到它們如何被淘汰將是令人興奮的,我們將繼續關注它們以了解我們可以采用什么。
在所有這些業務流程變更之后,我們比以往任何時候都更加堅信將基礎架構外包給 AWS。 他們通過將許多核心服務產品化而改變了游戲規則,同時保持了極具競爭力的價格。 它正在創建一種新型的初創公司,可以高效而廉價地生產產品,同時減少維護時間。 而且我們看好將在其生態系統之上構建的工具。
Datadog 鏈接已斷開,它顯示 SSL 錯誤。 正確的網址是 https://www.datadoghq.com/
我們是一家初創公司,我們正在嘗試從頭開始設置 evyrthing。 感謝您的帖子。
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓