# Zapier 如何自動化數十億個工作流自動化任務的旅程
> 原文: [http://highscalability.com/blog/2016/2/29/a-journey-through-how-zapier-automates-billions-of-workflow.html](http://highscalability.com/blog/2016/2/29/a-journey-through-how-zapier-automates-billions-of-workflow.html)
*這是[的來賓](http://stackshare.io/zapier/scaling-zapier-to-automate-billions-of-tasks)[轉貼了](http://stackshare.io/zapier/scaling-zapier-to-automate-billions-of-tasks) [Bryan Helmig](http://stackshare.io/bryanhelmig) ,是 [Zapier](http://stackshare.io/zapier) 的共同創始人& CTO,他可以輕松地在 Web 之間自動執行任務 應用。*

[Zapier](http://stackshare.io/zapier) 是一項 Web 服務,可自動執行 500 多個 Web 應用程序之間的數據流,其中包括 MailChimp,Salesforce,GitHub,Trello 等。
想象一下[建立一個工作流](https://zapier.com/multi-step-zaps/)(或我們稱為“ Zap”)的操作,該操作在用戶填寫您的 Typeform 表單時觸發,然后在您的 Google 日歷上自動創建事件,發送 Slack 通知并完成以下操作 在 Google 表格電子表格中添加一行。 那是扎皮爾。 即使對于非技術用戶來說,構建這樣的 Zaps 也非常容易,并且可以無限地自定義。
作為首席技術官和聯合創始人,我構建了許多原始的核心系統,如今領導工程團隊。 我想帶您**,了解我們的堆棧**,以及我們如何構建它以及如何在今天繼續改進它!
## 幕后的團隊
使 Zapier 滴答作響需要很多時間,因此我們在工程領域有四個不同的團隊:
* **前端團隊**在非常強大的工作流編輯器上工作。
* **全棧團隊**是跨功能的,但專注于工作流引擎。
* **開發人員小組**保持引擎嗡嗡作響。
* **平臺團隊**(可協助質量檢查)以及我們開發人員平臺的入門合作伙伴。
總而言之,這涉及約 15 名工程師(并且還在不斷增加!)。
## 架構
**我們的堆棧不會贏得任何新奇獎**-我們正在使用一些非常標準的(但很棒的)工具為 Zapier 提供動力。 更有趣的是我們使用它們來解決特定品牌問題的方式,但讓我們將基礎知識排除在外:
### 前端
從主干**過渡到 React** 的過程中,我們感到有些困惑。 我們使用 ES6 的 [Babel](http://stackshare.io/babel) 和 [Webpack](http://stackshare.io/webpack) + [Gulp](http://stackshare.io/gulp) 來編譯前端。 我們嚴重依賴 [CodeMirror](http://stackshare.io/codemirror) 來做一些我們需要的更復雜的輸入小部件,并使用 [React](http://stackshare.io/react) + [Redux](http://stackshare.io/reduxjs) 為超級用戶做很多繁重的工作 -強大的 Zap 編輯器。
### 后端
[Python](http://stackshare.io/python) 為我們的大部分后端提供了動力。 [Django](http://stackshare.io/django) 是 HTTP 方面的首選框架。 [Celery](http://stackshare.io/celery) 是我們分布式工作流程引擎的*大型*部分。 大部分常規 API 工作都是通過具有歷史意義的 [`requests`](https://github.com/kennethreitz/requests) 庫(帶有一堆自定義適配器和抽象)完成的。
### 數據
[MySQL](http://stackshare.io/mysql) 是我們的主要關系數據存儲-您會在 MySQL 內部找到我們的用戶,Zaps 等。 [Memcached](http://stackshare.io/memcached) 和 [McRouter](http://stackshare.io/mcrouter) 看起來像是無處不在的緩存層。 其他類型的數據將進入其他更有意義的數據存儲中。 例如,在 [Redis](http://stackshare.io/redis) 中發現了用于計費和節流的飛行中任務計數,而 [Elasticsearch](http://stackshare.io/elasticsearch) 存儲了 Zaps 的歷史活動提要。 對于數據分析,我們喜歡一些 [AWS Redshift](http://stackshare.io/amazon-redshift) 。
### 該平臺
我們的大多數平臺都位于我們相當**的整體式核心 Python 代碼庫**中,但是有許多有趣的分支提供了專門的功能。 最好的例子可能是我們如何利用 [AWS Lambda](http://stackshare.io/aws-lambda) 運行合作伙伴/用戶提供的代碼來自定義應用程序行為和 API 通信。
### 基礎設施
由于 Zapier **在 AWS** 上運行,因此我們觸手可及。 [EC2](http://stackshare.io/amazon-ec2) 和 [VPC](http://stackshare.io/amazon-vpc) 是此處的中心,盡管我們會盡可能使用 [RDS](http://stackshare.io/amazon-rds) 以及大量的自動伸縮組,以確保服務器池處于最佳狀態。 頂部形狀。 [Jenkins](http://stackshare.io/jenkins) , [Terraform](http://stackshare.io/terraform) , [Puppet](http://stackshare.io/puppet) 和 [Ansible](http://stackshare.io/ansible) 都是開發團隊的日常工具。 為了監視,我們對 [Statsd](http://stackshare.io/statsd) , [Graylog](http://stackshare.io/graylog) 和 [Sentry](http://stackshare.io/sentry) (他們*很好*)不夠滿意。
## 一些粗糙的數字
這些數字代表一個大概的最小值,以幫助讀者了解 Zapier 體系結構的總體大小和尺寸:
* 每天約有超過 800 萬個任務自動化
* 每天超過約 6000 萬次 API 調用
* 每天有超過 1000 萬個入站 Webhooks
* 在 [ELB](http://stackshare.io/aws-elastic-load-balancing) 之后運行 HTTP 的?12 個 c3.2xlarge 框
* 運行 [Celery](http://stackshare.io/celery) 的大約 100 個 m3.2xlarge 后臺工作者(在輪詢,掛鉤,電子郵件,雜項中分隔)
* 集群中約 3 m3.medium [RabbitMQ](http://stackshare.io/rabbitmq) 節點
* ?4 個 r3.2xlarge [Redis](http://stackshare.io/redis) 實例-一個熱,兩個故障轉移,一個備份/映像
* ?6 個 c3.xlarge McRouter 實例之后的?12 m2.xlarge [Memcached](http://stackshare.io/memcached) 實例
* ?3 m3.xlarge 無數據 ElasticSearch 實例之后的?10 m3.xlarge [ElasticSearch](http://stackshare.io/elasticsearch) 實例
* ?1 個 c3.2xlarge Graylog 服務器后面的?6 m3.xlarge ElasticSearch 實例
* 集群中約 10 個 dc1.large [Redshift](http://stackshare.io/amazon-redshift) 節點
* 1 個主 db.m2.2xlarge [RDS MySQL](http://stackshare.io/amazon-rds) 實例,帶有?2 個以上的副本,可用于生產讀取和分析
* 少數支持 RDS MySQL 實例(下面有更多詳細信息)
* ...以及大量的微服務和雜項專業服務
## 改善架構
雖然架構的主要內容保持不變-我們僅執行了幾次大規模遷移-但為將產品分為兩類進行了大量工作:
1. 支持重大新產品功能
2. 為更多用戶擴展應用程序
讓我們深入研究每個示例,盡可能多地獲取細節,而不會陷入困境!
#### 大型功能,例如多步 Zaps
當我們在 Startup 周末啟動 Zapier(有趣的事實:它首先被稱為 Snapier!)時,我們在不到 54 個小時的時間內布置了基本架構(由大量的咖啡和更多的啤酒推動)。 總的來說,這是體面的。 **我們保持設計非常非常簡單**,這在當時是正確的選擇。
除了**之外,*也是*簡單**。 具體來說,我們將 Zaps 分為兩步:將觸發器與一個動作配對,一個句號。
我們很快就意識到了錯過的機會,但是過渡將非常復雜。 我們必須實現一個有向樹,并支持任意數量的步驟(節點),但要對現有 Zaps(其中已有數十萬個)保持 1 對 1 的支持。 我們必須做到這一點,同時還要保留對數百個獨立合作伙伴 API 的支持。
從數據模型開始,我們在 MySQL 中構建了一個非常簡單的有向樹結構。 想象一下一個表,其中每行都有一個自引用`parent_id`外鍵,再加上一個額外的`root_id`外鍵以簡化查詢,您幾乎就可以了。 我們討論了切換到適當的圖形數據庫(例如 neo4j)的決定,但由于我們進行的查詢種類簡單且遍歷較小的孤立圖形(大約 2 至 50 個節點),因此決定拒絕這樣做。
進行此工作的一個關鍵方面是步驟間的獨立性。 每一步都必須消耗一些數據(例如,要讀取哪個文件夾或要添加到哪個列表 ID),做一些 API 魔術操作并返回一些數據(例如,創建的新文件或添加到列表的新卡) ,但不知道其在工作流程中的位置。 每個獨立的步驟都是愚蠢的。
中間是**全知的工作流引擎,該引擎通過將步驟作為任務串在一起來協調獨立的 Celery 任務**-一步是由 Zap 的有根樹定義的。 這個無所不知的引擎還包含所有其他優點,例如錯誤&重試處理,報告,日志記錄,節流等。
即使在獲得后端支持之后,我們仍然遇到另一個巨大的問題:**您如何為該對象構建 UI?**
首先,確保團隊中有一些*出色的*設計師和 Javascript 工程師。 然后,您將在嵌套的 Backbone 視圖中工作一段時間,然后再進入 React。 :-)認真地說: [React](/react) 是我們正在構建的各種復雜接口的天賜之物。
React 的獨特之處之一是性能特性對開發人員很友好,但前提是您必須弄清楚數據。 如果您不使用不可變的數據結構,則應使用一些結構共享庫來進行所有突變,以及正在開發的深層`Object.freeze()`來捕捉直接嘗試突變的地方。
構建如此復雜的 UI 面臨許多挑戰,其中大部分圍繞測試和反饋,但要花費大量時間才能從不同的 API 中獲取長尾數據,以使其優雅地適合于相同位置。 幾乎每種奇怪的數據形狀都必須考慮在內。
最后,我們的任務是讓新編輯器在用戶面前進行 alpha 和 beta 測試。 為此,我們同時發布了兩個版本的編輯器,并使用功能開關選擇了加入用戶。在對結果感到滿意之前,我們進行了數月的測試和調整,您可以查看 [Multi-Step Zap 發布 頁](https://zapier.com/multi-step-zaps/)了解其最終結果。

## 擴展應用程序
如果服務無法正常啟動并可靠運行,那將是徒勞的。 因此,我們的大部分注意力集中在支持水平可伸縮性*和*冗余基礎結構以確保可用性的應用程序設計上。
到目前為止,我們做出的一些更明智的決策是**,使我們對**感到滿意的技術倍增,而**遇到瓶頸**時,則會分離出隔離的功能。 關鍵是**重用完全相同的解決方案,然后將其移動到另一個可以自由漫游 CPU 和 RAM 新鮮牧場的盒子**。
例如,在過去一年左右的時間里,我們注意到會話數據耗盡了主數據庫的 IO 和存儲量。 由于會話數據實際上是具有較弱一致性要求的鍵/值排列,因此我們對諸如 [Cassandra](http://stackshare.io/cassandra) 或 [Riak](http://stackshare.io/riak) (甚至是 Redis!)之類的方案進行了激烈的辯論,但最終決定站起來 具有單個會話表的 MySQL 實例。
作為工程師,我們的本能是找到最適合該工作的工具,但是**作為實際問題**,該工作并不能保證額外的操作復雜性。 我們知道 MySQL,它可以進行簡單的鍵/值存儲,我們的應用程序已經支持它。 暢所欲言。
此外,仔細設計應用程序可以使水平縮放同樣簡單。 長期運行的后臺任務(例如我們的多步驟 Zaps)不受**輕寫模式**的嚴格一致性要求的約束,因此**使用 MySQL 讀操作是微不足道的(而且很安全!)。 僅將**復制為*主要*接觸點。 即使我們偶爾在幾分鐘內得到了可怕的復制品延遲,但 99.9%的 Zaps 并沒有改變-并且肯定不會很快改變-因此它們繼續嗡嗡作響。
另一個好的做法是**假設最壞的**。 從一開始就設計失敗。 盡管通常說起來容易做起來難,但如今實際上卻很容易做到。 對于初學者:**將自動縮放組與自動替換**一起使用。 一個常見的誤解是,ASG 僅用于擴展以適應波動的負載。 **錯誤!** **ASG + ELB 組合可以成為可靠性的骨干**,它使您可以隨意殺死實例,而不必擔心,因為它們會迅速被替換。
不知何故,我們不斷地學習到,系統越簡單,您的睡眠就越好。
## 日常
在本地,我們的工程師享受 [Docker](http://stackshare.io/docker) 提供的功能全面的環境。 `[docker-machine](http://stackshare.io/docker-machine)`和 [`docker-compose`](http://stackshare.io/docker-compose) 一起構成了 MySQL,Memcached,Redis,Elasticsearch 以及所有 Web 和后臺工作人員的正確版本。 我們通常建議在本地運行 [`npm`](/npm) 甚至是`runserver`,因為 VirtualBox 會破壞文件監視功能。
規范的 [GitHub](http://stackshare.io/github) “拉動請求模型”驅動了我們的大部分工程重點項目,其中記錄了日常工作,并在合并之前進行了最終代碼審查。 [Hackpad](http://stackshare.io/hackpad) 包含了我們的大部分文檔,其中包括大量的入門文檔。
Zapier 的一大優勢是[所有人都支持](https://zapier.com/blog/everyone-on-support/)。 每四到五周,每位工程師都會花費整整一周的支持來幫助調試和解決棘手的客戶問題。 這對我們非常重要,因為它為了解客戶的痛苦提供了基線(此外,您可能必須處理所運送的錯誤!)。
對于 CI 和部署,我們使用 [Jenkins](http://stackshare.io/jenkins) 對每個 PR 中的每個提交運行測試,并提供公司任何人都可以按下的“一鍵式部署”。 新工程師在工作的第一周點擊部署按鈕的情況并不少見!
我們在獨立的 VPC 中擁有一個**完整的登臺環境,以及一些非常適合測試長期拉動請求的獨立 Web 框。 金絲雀部署到生產中很常見-完整記錄所有錯誤,由 Graylog 提供。**
## 你也可以扎皮爾!
開發人員可以使用 Zapier 來做一些很棒的事情。
除了多步驟 Zaps,我們還啟用了將 [Python](https://zapier.com/help/code-python/) 和 [Javascript](https://zapier.com/help/code/) 編寫為工作流中的代碼步驟的功能。 無需自己托管和運行腳本-我們會處理所有這些。 我們還提供了綁定以調用網絡(`requests`和`fetch`),甚至在兩次運行之間存儲一些狀態!
我們的用戶正在采用代碼步驟來構建 [Slack](http://stackshare.io/slack) 機器人(以及游戲!),以替換一次性腳本以及更多其他內容。 我個人使用代碼步驟來編寫機器人和工具,以將代碼&錯誤度量標準跟蹤到電子表格中,轉換格式奇怪的數據,并替換*噸* crontabs。
或者,如果您具有希望非開發人員能夠使用的 API,那么我們也將擁有一個史詩般的[開發人員平臺](https://zapier.com/developer/)。 只需定義觸發器,搜索和操作,任何用戶都可以將您的 API 混合到他們的工作流中,并將您的應用程序與 GitHub,Salesforce,Google Docs 等 500 多種應用程序集成。
而且,我們經常在招聘,因此,如果您想幫助我們幫助人們更快地工作并自動執行最繁瑣的任務,請關注我們的[工作頁面](https://zapier.com/jobs/)!
[關于 HackerNews](https://news.ycombinator.com/item?id=11082359)
鏈接已斷開...
感謝抓住 Gigi!
為什么使用 MySQL? Postgres 不是它的超集嗎?
您能否評論一下如何在芹菜上實現編排? 以我的經驗,很難做到這一點,因為很多邏輯是在任務級別定義的,例如,很難在運行時修改任務的行為,因為它的定義是靜態的,并且在將模塊加載到工作程序時變成靜態的。
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓