# 每天可處理數百萬個請求的圖像優化技術
> 原文: [http://highscalability.com/blog/2016/6/15/the-image-optimization-technology-that-serves-millions-of-re.html](http://highscalability.com/blog/2016/6/15/the-image-optimization-technology-that-serves-millions-of-re.html)

本文將介紹 [Kraken.io](https://kraken.io/) 如何構建和擴展每天可處理數百萬個請求的圖像優化平臺,以保持 始終保持高性能,同時保持盡可能低的成本。 在撰寫本文時,我們將介紹當前的基礎結構,并介紹一些我們學到的有趣的知識,以便將其運用于此處。
### 讓我們制作一個圖像優化器
您想開始在 CDN 帳單上省錢,并且通常通過將較少的字節通過網絡推送到用戶的瀏覽器來加快網站速度。 很有可能超過 [的流量有 60%](http://httparchive.org/interesting.php) 僅是圖像。
使用 ImageMagick(您確實讀過 [ImageTragick](https://imagetragick.com/) ,對嗎?),您可以使用以下簡單命令降低 JPEG 文件的質量:
$ convert -quality 70 original.jpg Optimized.jpg
$ ls -la
-rw-r--r-- 1 matylla 職員 5897 5 月 16 日 14:24 original.jpg
-rw-r--r-- 1 matylla 職員 2995 May 16 14:25 Optimized.jpg
恭喜。 通過屠宰 JPEG 的質量,您剛剛將其壓縮了約 50%。 圖像現在看起來像 Minecraft。 它看起來不是這樣-它可以銷售您的產品和服務。 理想情況下,Web 上的圖像應具有出色的質量,并且不會以過高的質量或 EXIF 元數據的形式出現不必要的膨脹。
現在,您打開自己喜歡的圖像編輯軟件并開始以 Q 級播放,同時將 JPEG 保存為 Web。 事實證明,您測試的這張特定圖片在 Q76 看上去很棒。 您開始以質量設置為 76 保存所有 JPEG。但是請稍等片刻...有些圖像即使在 Q80 情況下也看起來很糟糕,而有些圖像甚至在 Q60 時也很好。
好的。 您決定以某種方式使其自動化-誰想要手動測試您擁有維護“特權”的數百萬張圖像的質量。 因此,您創建了一個腳本,該腳本可以生成不同 Q 級別的輸入圖像的數十個副本。 現在,您需要一個度量標準,該度量標準將告訴您哪個 Q 級適合特定圖像。 MSE? SSIM? MS-SSIM? PSNR? 您如此絕望,甚至開始計算和比較輸入圖像不同版本的 [感知哈希](https://en.wikipedia.org/wiki/Perceptual_hashing) 。
有些指標的效果要好于其他指標。 對于某些類型的圖像,有些效果很好。 有些非常快,而另一些則需要很長時間才能完成。 您可以通過減少處理每個圖像的循環次數來逃脫現實,但是很可能您錯過了理想的 Q 級別,并且圖像要么重于原來的水平,要么質量下降過高。
那么在白色背景下的商品圖片呢? 您真的想減少對象周圍的振鈴/暈影。 基于每個圖像的自定義色度二次采樣設置如何? 如今,白色背景下的那件紅色連衣裙看上去已經被洗掉了。 您已經了解到,剝離 EXIF 元數據將使文件大小變小一點,但是您還移除了 Orientation 標簽,現在圖像旋轉不正確。
那只是 JPEG 格式。 對于您的 PNG,您可能想重新壓縮 7-Zip 或 Deflate 壓縮后的圖像,例如 Google 的 [Zopfli](https://github.com/google/zopfli) 。 您啟動腳本并觀看 CPU 上的風扇開始熔化。
您可能需要一個可靠的工具,該工具可以優化所有圖像,無論格式如何。 [Kraken.io](https://kraken.io/) 是一種這樣的工具。
### 關于 Kraken.io
Kraken.io 是圖像優化和壓縮 SaaS 平臺,具有其他操作功能,例如圖像大小調整。 我們的目標是盡可能自動縮小圖像的字節大小,同時保持視覺信息的完整性和始終如一的高質量,從而無需手動檢查結果的保真度。
### 軟件
除了基于 PHP 的 Kraken.io 前端外,幾乎我們所有的軟件都是在 [節點](https://nodejs.org/en/) 中編寫的。 我們大量使用節點流,因為我們的優化管道可以使用二進制數據流。
當圖片首次出現在我們的平臺上時,首先會通過“ kraken-identify”過程進行抽簽,以可靠地檢測出最重要的功能-圖像格式(JPEG,PNG,GIF,SVG 等),圖像類型(逐行/ 基線 JPEG,動畫/靜態 GIF 等),以及嵌入的顏色配置文件和 EXIF 元數據的存在。
我們只需要讀取幾個字節,就不需要解壓縮整個圖像,也不需要將解壓縮的數據加載到內存中。
確定我們剛收到的文件確實是圖像后,我們將對其進行進一步處理。 對于某些特定的圖像,我們還計算了獨特顏色的數量。 唯一色計數是一種直方圖類型的操作,它固有的速度很慢,無法對壓縮數據進行處理,因此我們僅在非常特定的圖像子集上使用它。
然后,圖片會通過 HTTP 通過我們的優化管道傳遞。 這使我們可以將二進制數據(圖像本身)與優化設置(作為字段或標頭)一起抽取。 與我們的優化集群的 HTTP 連接保持打開狀態,直到該過程完成,并且來自集群的 HTTP 響應被流回磁盤(直接流回 GlusterFS 目標位置),因此我們不會經常接觸磁盤。 當我們從群集中流回整個響應時,任何優化后的數據都會通過 HTTP 標頭傳輸。
(可選),如果 API 用戶請求,我們可以將優化的資產存儲在他或她選擇的外部存儲中- [S3](https://kraken.io/docs/storage-s3) , [Azure](https://kraken.io/docs/storage-azure) , [云文件](https://kraken.io/docs/storage-cloudfiles) 或 [SoftLayer [](https://kraken.io/docs/storage-softlayer) 。
最后一個任務(用于 API)是終止與 API 客戶端的 HTTP 連接,并以優化結果作為響應,例如:
{
“ file_name”:“ sku126933.jpg”,
“ original_size”:35761,
“ kraked_size”:10799,
“ saved_bytes”:22462,
“ kraked_url”:“ https://dl.kraken.io/api/3e/db/24/08e20232a13c35fc1a72356537/sku126933.jpg”,
“ original_width”:600,
“ original_height”:600,
“成功”:是
}
對立即解析響應正文不感興趣的用戶可以使用我們的 [Webhook 傳遞系統](https://kraken.io/docs/wait-callback) 。 通過在請求中指定 callback_url,用戶將指示 API 應用程序將優化結果 POST 到其自己的端點。 在這種情況下,我們排隊一個 Webhook 任務(使用 Redis 作為代理)。 僅用于 Webhook 交付的其他計算機從隊列中使用,POST 優化結果并將一些數據保存在 MongoDB 中。

在 Kraken.io 帳戶中交付了 Webhooks 視圖
### 硬件
圖像優化和重新壓縮具有巨大的處理要求。 由于我們一直在努力降低總擁有成本,因此對我們而言,云決不是一個選擇。 通過與我們的數據中心簽訂相當長的合同,我們可以將托管費用減少 30%。
一小會兒,在投資購買自己的硬件之前,我們一直在租用專用機器。 那沒有按預期工作。 當時,我們的提供商阻止了 OS 的重新部署,我們不得不采用痛苦而費時的電子郵件通信路徑來重新部署系統。 另外,您不知道之前有誰在使用機器,機器的整體運行狀況如何,以及內部“確實”安裝了哪些組件。 有一天,我們發現,即使所有 API 機器都安裝了相同的 CPU,但每臺機器都有不同的 CPU 固件,并且 sysbench 的結果因機器而異。
幸運的是,這段時間已經過去很久了,我們在自己的硬件上運行,我們可以根據需要微調所有設置(嘗試對租用設備進行 CPU 頻率縮放)。
所有單插槽計算機(API,Web,負載均衡器,Webhook Delivery)當前正在運行 Xeon E3-1280 v5(Skylake)。 對于完成所有艱苦工作的 Optimization Cluster,我們每臺計算機使用 2 個 Xeon E5-2697 v3,具有 128 GB RAM 和 RAID-1 設置中的四個 SSD 硬盤進行鏡像。 在啟用 HT 的情況下,上述設置使我們可以在每個群集計算機上訪問 28 個物理核心和 56 個線程。

我們的優化人員之一(Xeon E5-2697)
英特爾最近為 [E5-2600 產品線](http://ark.intel.com/products/family/91287/Intel-Xeon-Processor-E5-v4-Family#@All) 推出了 v4(Haswell),我們正在對此進行研究,但并不急于將群集升級到 v4 。
Kraken.io 的平臺占用大量 CPU 和 I / O,對大量文件進行繁重的處理。 為了在 I / O 級別獲得更高的性能,我們將在接下來的幾個月中為 API,集群和存儲計算機推出 PCIe-SSD 驅動器。

API,存儲和優化集群
自己的硬件需要一定的價格。 而且這個價格是,即使在高峰時期,您也需要比實際需要的容量多很多。 訂購,壓力測試和部署新機器最多需要 7 天的時間。 我們提供了一個定制的 AWS 集成,它將為我們提供計算優化的實例并擴展優化集群。 幸運的是,即使我們發現集群計算機上的負載高達 60(每個線程 1.07),我們也從未使用過它。 該解決方案的缺點是,我們不僅必須為 AWS 實例支付額外費用,而且還必須為數據中心與 AWS 之間的額外流量支付額外費用。
### 供應,發現和軟件部署
我們安裝的每臺新計算機都由 [工頭](http://theforeman.org/) 管理和配置。 我們將所有配置都保留在 [Puppet](https://puppet.com/) 中,因此只需單擊幾下即可使新機器進入生產就緒狀態。 在 Puppet 中維護健康的代碼庫是另一個需要討論的主題,尤其是在談論定制軟件包時。
通過 [Capistrano](http://capistranorb.com/) 進行軟件部署。 因為所有應用程序都是用 Node 編寫的,所以幾乎所有應用程序都使用類似的配方。 當我們需要查明過去發生的特定部署并將其與 [中的可用數據關聯時,與](https://www.serverdensity.com/) [Slack](https://slack.com/) 集成非常有用 ] ServerDensity 或 [ElasticSearch](https://www.elastic.co/) 。

Capistrano 的松弛集成
### 數據存儲
我們在三臺獨立的機器上使用 [副本](https://docs.mongodb.com/manual/replication/) 設置中的 [MongoDB](https://www.mongodb.com/) 作為我們的主要數據存儲。 由于我們的數據集相對較小,并且我們對所有時間序列數據都使用了封頂集合,因此我們從未真正考慮過 DB 分片。 當然,看著三分之二的 DB 機器幾乎什么也不做,只是等待 Master 失敗,這不是我喜歡的事情,但是當時間到來時(而且會這樣),我們會睡得很好。
第二個數據存儲是 [前哨](http://redis.io/topics/sentinel) 設置中的 [Redis](http://redis.io/) 出于與上述相同的原因)。 主要用作 Kraken.io 前端上的任務隊列和會話管理的消息代理。
### 文件存儲
在上一代 Kraken.io 中,我們曾經將優化的資產直接存儲在執行優化工作的同一臺計算機上。 在將角色(API,Web,處理群集和存儲)分離之后,我們發現自己迫切需要可擴展的網絡文件系統。 [GlusterFS](http://www.gluster.org/) 易于設置且易于維護。
從應用程序服務器到 GlusterFS 計算機,我們有數百萬個圖像通過網絡傳輸。 對于我們而言,非常重要的一點是不要經常移動這些文件。 一旦保存在 Gluster 中,圖像將停留在該位置,直到其自動刪除為止。
說到-清理作業。 通過 API 優化的圖像會在 1 小時后自動刪除,而通過 Web Interface 處理的圖像會在我們的系統中保留 12 個小時。 在存儲計算機上運行的清除腳本需要首先統計所有目錄,并選擇 mtime > 1hr(或 mtime > 12hr 的 Web Interface)。 當您擁有數百萬個目錄時,對其進行簡單的統計可能會花費大量時間,并且我們希望清理腳本能夠快速運行。 可行的簡單補救措施是將具有優化映像的目錄放入另外三個級別的兩字符目錄中。
用作目標目錄的原始文件 ID,例如 dd7322caa1a2aeb24109a3c61ba970d4 變為 dd / 73/22 / caa1a2aeb24109a3c61ba970d4
這樣,我們最多可以在第一,第二和第三層上遍歷 255 個目錄。
### 負載均衡器
外部和內部負載平衡器都是 [Nginx](http://nginx.org/) -基于 [Keepalived](http://www.keepalived.org/) 。 即使我們的兩個外部環境都出現問題,內部的環境也會自動提升自己,也為公共交通服務。 這也有助于我們晚上入睡,并給我們時間用新機器從柏林到法蘭克福旅行(飛行 1 小時)。
我們在內部計算機上未使用任何 HTTP 服務器。 所有內部流量都從負載均衡器直接反向代理到 Node 應用程序。 要記住的一件事-Nginx 默認使用 HTTP 協議 1.0 作為 HTTP 代理。 將 proxy_http_version 標志設置為 1.1 可以節省很多麻煩,并且通常可以提高性能,尤其是對于長時間運行的保持活動連接。
### 聯網
由于我們在上行鏈路級別(兩個獨立的 10 Gbps 上行鏈路)上也很冗余,因此每個機架至少需要兩個交換機,每臺機器至少需要兩個以太網控制器。 隨著機架的增長,每臺計算機占用交換機上的五個端口(BMC,到控制器 1 的上行鏈路 A 和 B 和到控制器 2 的上行鏈路 A 和 B),當前我們在每個機架上運行四個 HP ProCurve 交換機。

Kraken.io Architecture,2016 年 5 月
### 監視和警報
在上一代 Kraken.io 中,我們使用了 Sensu,Graphite 和 InfluxDB。 由于我們想將全部注意力轉移到產品本身,而不是維護和監視監視工具(誰在監視正在監視它們的監視工具?),因此我們需要一種 SaaS 來減輕這種痛苦。 在測試了幾項服務之后,我們最終選擇了 [ServerDensity](https://www.serverdensity.com/) 作為我們所有機器的主要監視和警報工具,并且到目前為止,它仍然可以正常工作。

ServerDensity 指標始終顯示在我們的辦公室中
作為一項附加措施,我們使用 [Pingdom](https://www.pingdom.com/) 進行正常運行時間和實時用戶監視。 我們已經從 Pingdom 看到了一些誤報,而解決之道只是增加警報失敗所需的檢查數量。
### 數據挖掘
當我們嘗試將支持的技術數量保持在最低限度時,我們使用了外部 ElasticSearch 提供程序。 平均每天,我們會發送 2GB 的日志以進行進一步處理和數據挖掘。 可以這樣查詢 ES 非常方便:
“為我提供 800 Kb 以下的 JPEG 文件的優化結果,該文件具有嵌入式 ICC 配置文件,唯一顏色計數大于 10.000,用戶 X 在 3 天前進行了無損優化”。
在我們不斷努力改進優化堆棧時,我們需要能夠立即跟蹤我們的部署結果。 在峰值負載下,只需在“優化群集”中進行一些細微調整即可,然后在幾分鐘內獲得有意義的數據。
### 摘要
如果您到目前為止做的不錯,那將涵蓋 Kraken.io 基礎結構工程的有趣部分。 我們確信,隨著我們的發展和訂戶數量的增長,我們將繼續學習更多,希望您喜歡本文。
[關于 HackerNews](https://news.ycombinator.com/item?id=11910151)
我總是喜歡閱讀有關圖像優化的文章。
但是在本文之后,我檢查了 kraken.io 網站,以及所有可用的信息... :(
總體來說不錯。 盡管看到整條文章中散布著大量的“流行語”,這似乎是一種絕技。 不過,請欣賞本文的坦率。
對于正在為其 Web 應用程序尋求圖像優化服務的人的旁注-現代 CDN 已經將此作為其產品的核心部分。 Instart Logic 特別提供了出色的圖像優化服務,您可以利用專有算法利用它來轉換圖像,調整圖像大小并降低圖像質量。
您可以在構建時壓縮和縮小映像,然后可以由您選擇的任何 CDN 進行選擇。 這個過程已經使用了數十年。
這是我們今天在 [CircleHD](https://circlehd.com "CircleHD") 使用的一些工具
gifsicle-壓縮 GIF 圖像
jpegtran-壓縮 JPEG 圖像
optipng-壓縮 PNG 圖像
svgo-壓縮 SVG 圖像
@AgnivaDeSarker:我很好奇您在上一篇文章中有什么資格成為“流行語”?
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓