# Twitter 計劃分析 1000 億條推文
> 原文: [http://highscalability.com/blog/2010/2/19/twitters-plan-to-analyze-100-billion-tweets.html](http://highscalability.com/blog/2010/2/19/twitters-plan-to-analyze-100-billion-tweets.html)
如果 Twitter 是某些人認為的“網絡神經系統”,那么從神經系統來的所有這些信號(推文)的大腦究竟是什么呢? 大腦就是 Twitter 分析系統,而 Twitter 的分析負責人 Kevin Weil 是負責計算超過 1000 億條 Tweet(約等于人腦中神經元數量)含義的單元。
目前,Twitter 僅占預期的 1000 億條推文的 10%,但始終要做好計劃。 Kevin 在 [Hadoop Meetup](http://www.meetup.com/hadoop/) 上的 Twitter 上發表了 [Hadoop 和協議緩沖區的演講,解釋了 Twitter 如何計劃使用所有數據來回答關鍵業務問題。](http://www.slideshare.net/kevinweil/protocol-buffers-and-hadoop-at-twitter)
Twitter 有興趣回答哪種類型的問題? 幫助他們更好地了解 Twitter 的問題。 像這樣的問題:
1. 一天我們要處理多少個請求?
2. 平均延遲時間是多少?
3. 一天有多少次搜索?
4. 多少個唯一查詢,多少個唯一用戶,他們的地理分布是什么?
5. 作為用戶的推文,我們能告訴我們什么?
6. 誰轉發了更多?
7. 移動用戶的用法有何不同?
8. 同時出了什么問題?
9. 哪些功能使用戶著迷?
10. 用戶的聲譽是什么?
11. 轉推的深度有多深?
12. 哪些新功能有效?
還有更多。 這些問題可以幫助他們理解 Twitter,其分析系統可以幫助他們更快地獲得答案。
## Hadoop 和 Pig 用于分析
您能想到的任何問題都需要分析大數據來尋找答案。 1000 億是很多推文。 這就是 Twitter 使用 [Hadoop 和 Pig](http://www.slideshare.net/kevinweil/hadoop-pig-and-twitter-nosql-east-2009) 作為其分析平臺的原因。 Hadoop 提供:在分布式文件系統上的鍵值存儲,水平可伸縮性,容錯性以及用于計算的 map-reduce。 Pig 是一種查詢機制,可以在 Hadoop 之上編寫復雜的查詢。
說您正在使用 Hadoop 僅僅是故事的開始。 故事的其余部分是使用 Hadoop 的最佳方法是什么? 例如,如何在 Hadoop 中存儲數據?
這似乎是一個奇怪的問題,但答案卻有很大的后果。 在關系數據庫中,您不存儲數據,數據庫存儲您,或者,它為您存儲數據。 API 以行格式移動數據。
Hadoop 并非如此。 Hadoop 的鍵值模型意味著由您決定如何存儲數據。 您的選擇與性能,可以存儲多少數據以及對將來的變化做出反應的敏捷程度有很大關系。
每個推文都有 12 個字段,其中 3 個具有子結構,并且隨著新功能的添加,這些字段可以并且會隨著時間而變化。 存儲此數據的最佳方法是什么?
## 數據存儲在協議緩沖區中以保持數據的高效和靈活
Twitter 認為 CSV,XML,JSON 和協議緩沖區是可能的存儲格式。 協議緩沖區*是一種以有效但可擴展的格式對結構化數據進行編碼的方法。 Google 幾乎所有內部??RPC 協議和文件格式*都使用協議緩沖區。 BSON(二進制 JSON)尚未進行評估,但可能因為它沒有 IDL(接口定義語言)而無法使用。 [Avro](http://hadoop.apache.org/avro/) 是他們將來會考慮的一種潛在選擇。
創建了一個評估矩陣,該矩陣宣布 Protocol Buffers 為獲勝者。 贏得協議緩沖區是因為它允許將數據拆分到不同的節點上。 它不僅可用于推文(日志,文件存儲,RPC 等),還可用于其他數據; 它有效地解析; 可以添加,更改和刪除字段,而無需更改已部署的代碼; 編碼很小; 它支持層次關系。 所有其他選項均未通過這些條件中的一個或多個。
## IDL 用于 Codegen
出乎意料的是,效率,靈活性和其他神圣的怪胎指標并不是 Twitter 喜歡協議緩沖區的唯一原因。 通常被視為弱點的是,協議緩沖區使用 IDL 來描述數據結構,實際上被 Twitter 視為大贏家。 必須定義數據結構 IDL 通常被視為浪費時間。 但是作為構建過程的一部分,它們從 IDL 中生成所有與 Hadoop 相關的代碼:協議緩沖區 InoutFOrmats,OutputFormats,Writables,Pig LoadFuncs,Pig StoreFuncs 等。
以前為每個新數據結構手動編寫的所有代碼現在都可以從 IDL 中自動自動生成。 這樣可以節省大量精力,并且代碼的錯誤少得多。 IDL 實際上節省了時間。
某一時刻,模型驅動的自動生成是許多項目的通用策略。 然后,時尚開始產生一切。 Codegen 似乎還不夠敏捷。 一旦生成了所有內容,您就開始真正擔心語言的冗長性,這使每個人都轉向了更加動態的語言,具有諷刺意味的是,DSL 仍然經常被列為 Ruby 之類的語言的優勢。 手編碼的另一個后果是周炎的框架。 框架有助于平息認為必須從頭開始編寫所有內容而造成的損害。
很高興看到代碼生成再次流行。 使用聲明性規范,然后編寫高效的,特定于系統的代碼生成器,功能非常強大。 數據結構是低掛的果實,但是也可以自動化更大,更復雜的過程。
總體而言,這是一次非常有趣和有益的演講。 我喜歡看到基于想要的內容和原因對不同選項進行的仔細評估。 令人耳目一新的是,這些明智的選擇如何協同作用,并構成了一個更好,更穩定的系統。
## 相關文章
1. [Twitter 上的 Hadoop 和協議緩沖區](http://www.slideshare.net/kevinweil/protocol-buffers-and-hadoop-at-twitter)
2. [Twitter 背后的窺視](http://borasky-research.net/2010/02/17/a-peek-under-twitters-hood)-Twitter 的開源頁面上線了。
3. [Hadoop](http://hadoop.apache.org/)
4. [協議緩沖區](http://code.google.com/p/protobuf/)
5. [Hadoop 灣區用戶組-2 月 17 日在 Yahoo! -RECAP](http://developer.yahoo.net/blogs/hadoop/2010/02/hadoop_bay_area_user_group_feb.html)
6. [Twitter 說](http://blog.twitter.com/2010/02/measuring-tweets.html)“今天,我們每天看到 5000 萬條推文,平均每秒 600 條推文。”
> 這就是為什么 Twitter 使用 Hadoop 和 Pig 作為分析平臺的原因
has a broken url
謝謝。 似乎所有 URL 由于某種原因都被轉義。 現在應該修復。
所有這些推文中有 99%是垃圾。 他們究竟將如何分析其中的任何內容?
從理論上講,每條推文都是一種人類思想或一種交流意識。 分析大量數據將意味著識別人腦在各個方面的功能-例如給定的時間,星期幾,地理位置,文化,趨勢等-因此,了解這種人類行為就構成了識別人的大腦。 在線大眾。 (僅限于 Twitter)。
最后,它是所有統計信息-一定比例的網絡將為這種現象數據做出貢獻。
希望我們能更多地了解人的思想鏈是如何運作的,并希望這有助于神經科學家作為研究工具。
我的$ 0.02
?Vj
幾個月前,奇怪的 Twitter Twitter Tweet ID 泛濫成災,他們怎么可能擁有 1000 億條 Tweet?
我會用“神經系統”代替“神經系統”,“神經系統”將這些信號/推文發送給我們的外行賄賂者,改為“突觸發射”,其中指出推文更恰當地是*大腦*內部的信號。 它是對信號觸發或重推的分析,我們發現了模式,并且在這些模式中有意義。
有關 Synaptic 網站的更多信息,請訪問:
http://synapticweb.pbworks.com/
@khrisloux
我要說的是 [Vivisimo 的 Velocity 搜索引擎](http://vivisimo.com/)可以為他們提供很多幫助。
有趣的帖子,托德。
您的帖子中有一些復制錯誤:
“ 5.作為用戶,我們可以從他們的推特中獲得什么?” | 可能應該是:我們能告訴用戶什么...
“ 8.如果同時出錯怎么辦?” | 怎么了...
“ 11.轉發的深度有多深?” | 有多深...
不是要分析什么,而是要服務于什么業務目的。
無論如何,tweet 中的 URI 可以為用戶分析提供更多的價值。
“ Protocol Buffers 之所以獲獎,是因為它允許將數據拆分到不同的節點上;它不僅可以用于推文(日志,文件存儲,RPC 等),而且還可以重用;它可以高效地解析;可以添加,更改和刪除字段而無需 更改已部署的代碼;編碼很小;它支持層次關系。所有其他選項都無法通過其中一個或多個條件。”
只需用純文本替換 Protocol Buffer 并享受相同的方法即可:)嚴重的是,我沒有得到 PB 選擇背后的基本原理,但最終還是要隨心所欲。 除非您在 hdfs 的頂部構建 HBase 之類的東西,否則當您運行冗長的批處理作業時,內部存儲格式并不重要。
“今天,我們每天看到 5000 萬條推文,平均每秒 600 條推文。”
什么!?
每秒 600 條推文!?
...
哇...我真是令人難以置信地不知所措...我的意思是我覺得 Twitter 可以解決所有這些可擴展性問題,因為它們每秒有成千上萬甚至數十萬條推文。
天哪,如果他們用 C 編寫 Twitter 系統,就可以輕松地通過單個服務器處理“所有”流量。
無論哪種方式,我仍然認為 Twitter 是一個好主意,他們應該得到應有的榮譽,他們在 Twitter 的整個軟件包和聲譽方面都做得很好。 但是,為什么不聘請 C 程序員來重寫他們的堆棧并降低成百上千的成本呢?
@羅伯特·古爾德(Robert Gould):我也為如此低的數量感到驚訝。 雖然據我了解,問題不在于處理傳入的 tweet,而是將它們發送給所有訂戶。 請記住,某些用戶有數千個(或數百萬個)關注者。
用 C 重寫對可伸縮性沒有多大幫助。 它將使系統稍微快一些,但不超過一個數量級,以可維護性,穩定性和開發速度為代價。
我認為經過大量分析,并從大型 Twitter 數據庫中獲取了大量數據之后,我們會發現我們的邏輯性不如我們想像的那樣,而且實際上是可預測的。
模式將得出結論,就像地球上所有其他生物一樣,我們受到重力,季節,夜晚和白天的影響,x 類型的人更有可能鳴叫 x 等。我認為這一實驗肯定會證實人類是 習慣的生物。
- LiveJournal 體系結構
- mixi.jp 體系結構
- 友誼建筑
- FeedBurner 體系結構
- GoogleTalk 架構
- ThemBid 架構
- 使用 Amazon 服務以 100 美元的價格構建無限可擴展的基礎架構
- TypePad 建筑
- 維基媒體架構
- Joost 網絡架構
- 亞馬遜建筑
- Fotolog 擴展成功的秘訣
- 普恩斯的教訓-早期
- 論文:Wikipedia 的站點內部,配置,代碼示例和管理問題
- 擴大早期創業規模
- Feedblendr 架構-使用 EC2 進行擴展
- Slashdot Architecture-互聯網的老人如何學會擴展
- Flickr 架構
- Tailrank 架構-了解如何在整個徽標范圍內跟蹤模因
- Ruby on Rails 如何在 550k 網頁瀏覽中幸存
- Mailinator 架構
- Rackspace 現在如何使用 MapReduce 和 Hadoop 查詢 TB 的數據
- Yandex 架構
- YouTube 架構
- Skype 計劃 PostgreSQL 擴展到 10 億用戶
- 易趣建筑
- FaceStat 的禍根與智慧贏得了勝利
- Flickr 的聯合會:每天進行數十億次查詢
- EVE 在線架構
- Notify.me 體系結構-同步性
- Google 架構
- 第二人生架構-網格
- MySpace 體系結構
- 擴展 Digg 和其他 Web 應用程序
- Digg 建筑
- 在 Amazon EC2 中部署大規模基礎架構的六個經驗教訓
- Wolfram | Alpha 建筑
- 為什么 Facebook,Digg 和 Twitter 很難擴展?
- 全球范圍擴展的 10 個 eBay 秘密
- BuddyPoke 如何使用 Google App Engine 在 Facebook 上擴展
- 《 FarmVille》如何擴展以每月收獲 7500 萬玩家
- Twitter 計劃分析 1000 億條推文
- MySpace 如何與 100 萬個并發用戶一起測試其實時站點
- FarmVille 如何擴展-后續
- Justin.tv 的實時視頻廣播架構
- 策略:緩存 404 在服務器時間上節省了洋蔥 66%
- Poppen.de 建筑
- MocoSpace Architecture-一個月有 30 億個移動頁面瀏覽量
- Sify.com 體系結構-每秒 3900 個請求的門戶
- 每月將 Reddit 打造為 2.7 億頁面瀏覽量時汲取的 7 個教訓
- Playfish 的社交游戲架構-每月有 5000 萬用戶并且不斷增長
- 擴展 BBC iPlayer 的 6 種策略
- Facebook 的新實時消息系統:HBase 每月可存儲 135 億條消息
- Pinboard.in Architecture-付費玩以保持系統小巧
- BankSimple 迷你架構-使用下一代工具鏈
- Riak 的 Bitcask-用于快速鍵/值數據的日志結構哈希表
- Mollom 體系結構-每秒以 100 個請求殺死超過 3.73 億個垃圾郵件
- Wordnik-MongoDB 和 Scala 上每天有 1000 萬個 API 請求
- Node.js 成為堆棧的一部分了嗎? SimpleGeo 說是的。
- 堆棧溢出體系結構更新-現在每月有 9500 萬頁面瀏覽量
- Medialets 體系結構-擊敗艱巨的移動設備數據
- Facebook 的新實時分析系統:HBase 每天處理 200 億個事件
- Microsoft Stack 是否殺死了 MySpace?
- Viddler Architecture-每天嵌入 700 萬個和 1500 Req / Sec 高峰
- Facebook:用于擴展數十億條消息的示例規范架構
- Evernote Architecture-每天有 900 萬用戶和 1.5 億個請求
- TripAdvisor 的短
- TripAdvisor 架構-4,000 萬訪客,200M 動態頁面瀏覽,30TB 數據
- ATMCash 利用虛擬化實現安全性-不變性和還原
- Google+是使用您也可以使用的工具構建的:閉包,Java Servlet,JavaScript,BigTable,Colossus,快速周轉
- 新的文物建筑-每天收集 20 億多個指標
- Peecho Architecture-鞋帶上的可擴展性
- 標記式架構-擴展到 1 億用戶,1000 臺服務器和 50 億個頁面視圖
- 論文:Akamai 網絡-70 個國家/地區的 61,000 臺服務器,1,000 個網絡
- 策略:在 S3 或 GitHub 上運行可擴展,可用且廉價的靜態站點
- Pud 是反堆棧-Windows,CFML,Dropbox,Xeround,JungleDisk,ELB
- 用于擴展 Turntable.fm 和 Labmeeting 的數百萬用戶的 17 種技術
- StackExchange 體系結構更新-平穩運行,Amazon 4x 更昂貴
- DataSift 體系結構:每秒進行 120,000 條推文的實時數據挖掘
- Instagram 架構:1400 萬用戶,1 TB 的照片,數百個實例,數十種技術
- PlentyOfFish 更新-每月 60 億次瀏覽量和 320 億張圖片
- Etsy Saga:從筒倉到開心到一個月的瀏覽量達到數十億
- 數據范圍項目-6PB 存儲,500GBytes / sec 順序 IO,20M IOPS,130TFlops
- 99designs 的設計-數以千萬計的綜合瀏覽量
- Tumblr Architecture-150 億頁面瀏覽量一個月,比 Twitter 更難擴展
- Berkeley DB 體系結構-NoSQL 很酷之前的 NoSQL
- Pixable Architecture-每天對 2000 萬張照片進行爬網,分析和排名
- LinkedIn:使用 Databus 創建低延遲更改數據捕獲系統
- 在 30 分鐘內進行 7 年的 YouTube 可擴展性課程
- YouPorn-每天定位 2 億次觀看
- Instagram 架構更新:Instagram 有何新功能?
- 搜索技術剖析:blekko 的 NoSQL 數據庫
- Pinterest 體系結構更新-1800 萬訪問者,增長 10 倍,擁有 12 名員工,410 TB 數據
- 搜索技術剖析:使用組合器爬行
- iDoneThis-從頭開始擴展基于電子郵件的應用程序
- StubHub 體系結構:全球最大的票務市場背后的驚人復雜性
- FictionPress:在網絡上發布 600 萬本小說
- Cinchcast 體系結構-每天產生 1,500 小時的音頻
- 棱柱架構-使用社交網絡上的機器學習來弄清您應該在網絡上閱讀的內容
- 棱鏡更新:基于文檔和用戶的機器學習
- Zoosk-實時通信背后的工程
- WordPress.com 使用 NGINX 服務 70,000 req / sec 和超過 15 Gbit / sec 的流量
- 史詩般的 TripAdvisor 更新:為什么不在云上運行? 盛大的實驗
- UltraDNS 如何處理數十萬個區域和數千萬條記錄
- 更簡單,更便宜,更快:Playtomic 從.NET 遷移到 Node 和 Heroku
- Spanner-關于程序員使用 NoSQL 規模的 SQL 語義構建應用程序
- BigData 使用 Erlang,C 和 Lisp 對抗移動數據海嘯
- 分析數十億筆信用卡交易并在云中提供低延遲的見解
- MongoDB 和 GridFS 用于內部和內部數據中心數據復制
- 每天處理 1 億個像素-少量競爭會導致大規模問題
- DuckDuckGo 體系結構-每天進行 100 萬次深度搜索并不斷增長
- SongPop 在 GAE 上可擴展至 100 萬活躍用戶,表明 PaaS 未通過
- Iron.io 從 Ruby 遷移到 Go:減少了 28 臺服務器并避免了巨大的 Clusterf ** ks
- 可汗學院支票簿每月在 GAE 上擴展至 600 萬用戶
- 在破壞之前先檢查自己-鱷梨的建筑演進的 5 個早期階段
- 縮放 Pinterest-兩年內每月從 0 到十億的頁面瀏覽量
- Facebook 的網絡秘密
- 神話:埃里克·布魯爾(Eric Brewer)談銀行為什么不是堿-可用性就是收入
- 一千萬個并發連接的秘密-內核是問題,而不是解決方案
- GOV.UK-不是你父親的書庫
- 縮放郵箱-在 6 周內從 0 到 100 萬用戶,每天 1 億條消息
- 在 Yelp 上利用云計算-每月訪問量為 1.02 億,評論量為 3900 萬
- 每臺服務器將 PHP 擴展到 30,000 個并發用戶的 5 條 Rockin'Tips
- Twitter 的架構用于在 5 秒內處理 1.5 億活躍用戶,300K QPS,22 MB / S Firehose 以及發送推文
- Salesforce Architecture-他們每天如何處理 13 億筆交易
- 擴大流量的設計決策
- ESPN 的架構規模-每秒以 100,000 Duh Nuh Nuhs 運行
- 如何制作無限可擴展的關系數據庫管理系統(RDBMS)
- Bazaarvoice 的架構每月發展到 500M 唯一用戶
- HipChat 如何使用 ElasticSearch 和 Redis 存儲和索引數十億條消息
- NYTimes 架構:無頭,無主控,無單點故障
- 接下來的大型聲音如何使用 Hadoop 數據版本控制系統跟蹤萬億首歌曲的播放,喜歡和更多內容
- Google 如何備份 Internet 和數十億字節的其他數據
- 從 HackerEarth 用 Apache 擴展 Python 和 Django 的 13 個簡單技巧
- AOL.com 體系結構如何發展到 99.999%的可用性,每天 800 萬的訪問者和每秒 200,000 個請求
- Facebook 以 190 億美元的價格收購了 WhatsApp 體系結構
- 使用 AWS,Scala,Akka,Play,MongoDB 和 Elasticsearch 構建社交音樂服務
- 大,小,熱還是冷-條帶,Tapad,Etsy 和 Square 的健壯數據管道示例
- WhatsApp 如何每秒吸引近 5 億用戶,11,000 內核和 7,000 萬條消息
- Disqus 如何以每秒 165K 的消息和小于 0.2 秒的延遲進行實時處理
- 關于 Disqus 的更新:它仍然是實時的,但是 Go 摧毀了 Python
- 關于 Wayback 機器如何在銀河系中存儲比明星更多的頁面的簡短說明
- 在 PagerDuty 遷移到 EC2 中的 XtraDB 群集
- 擴展世界杯-Gambify 如何與 2 人組成的團隊一起運行大型移動投注應用程序
- 一點點:建立一個可處理每月 60 億次點擊的分布式系統的經驗教訓
- StackOverflow 更新:一個月有 5.6 億次網頁瀏覽,25 臺服務器,而這一切都與性能有關
- Tumblr:哈希處理每秒 23,000 個博客請求的方式
- 使用 HAProxy,PHP,Redis 和 MySQL 處理 10 億個請求的簡便方法來構建成長型啟動架構
- MixRadio 體系結構-兼顧各種服務
- Twitter 如何使用 Redis 進行擴展-105TB RAM,39MM QPS,10,000 多個實例
- 正確處理事情:通過即時重放查看集中式系統與分散式系統
- Instagram 提高了其應用程序的性能。 這是如何做。
- Clay.io 如何使用 AWS,Docker,HAProxy 和 Lots 建立其 10 倍架構
- 英雄聯盟如何將聊天擴大到 7000 萬玩家-需要很多小兵。
- Wix 的 Nifty Architecture 技巧-大規模構建發布平臺
- Aeron:我們真的需要另一個消息傳遞系統嗎?
- 機器:惠普基于憶阻器的新型數據中心規模計算機-一切仍在變化
- AWS 的驚人規模及其對云的未來意味著什么
- Vinted 體系結構:每天部署數百次,以保持繁忙的門戶穩定
- 將 Kim Kardashian 擴展到 1 億個頁面
- HappyPancake:建立簡單可擴展基金會的回顧
- 阿爾及利亞分布式搜索網絡的體系結構
- AppLovin:通過每天處理 300 億個請求向全球移動消費者進行營銷
- Swiftype 如何以及為何從 EC2 遷移到真實硬件
- 我們如何擴展 VividCortex 的后端系統
- Appknox 架構-從 AWS 切換到 Google Cloud
- 阿爾及利亞通往全球 API 的憤怒之路
- 阿爾及利亞通往全球 API 步驟的憤怒之路第 2 部分
- 為社交產品設計后端
- 阿爾及利亞通往全球 API 第 3 部分的憤怒之路
- Google 如何創造只有他們才能創造的驚人的數據中心網絡
- Autodesk 如何在 Mesos 上實施可擴展事件
- 構建全球分布式,關鍵任務應用程序:Trenches 部分的經驗教訓 1
- 構建全球分布式,關鍵任務應用程序:Trenches 第 2 部分的經驗教訓
- 需要物聯網嗎? 這是美國一家主要公用事業公司從 550 萬米以上收集電力數據的方式
- Uber 如何擴展其實時市場平臺
- 優步變得非常規:使用司機電話作為備份數據中心
- 在不到五分鐘的時間里,Facebook 如何告訴您的朋友您在災難中很安全
- Zappos 的網站與 Amazon 集成后凍結了兩年
- 為在現代時代構建可擴展的有狀態服務提供依據
- 細分:使用 Docker,ECS 和 Terraform 重建基礎架構
- 十年 IT 失敗的五個教訓
- Shopify 如何擴展以處理來自 Kanye West 和 Superbowl 的 Flash 銷售
- 整個 Netflix 堆棧的 360 度視圖
- Wistia 如何每小時處理數百萬個請求并處理豐富的視頻分析
- Google 和 eBay 關于構建微服務生態系統的深刻教訓
- 無服務器啟動-服務器崩潰!
- 在 Amazon AWS 上擴展至 1100 萬以上用戶的入門指南
- 為 David Guetta 建立無限可擴展的在線錄制活動
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億個通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓
- 縮放原理
- TripleLift 如何建立 Adtech 數據管道每天處理數十億個事件
- Tinder:最大的推薦引擎之一如何決定您接下來會看到誰?
- 如何使用微服務建立財產管理系統集成
- Egnyte 體系結構:構建和擴展多 PB 分布式系統的經驗教訓
- Zapier 如何自動化數十億個工作流自動化任務的旅程
- Jeff Dean 在 Google 進行大規模深度學習
- 如今 Etsy 的架構是什么樣的?
- 我們如何在 Mail.Ru Cloud 中實現視頻播放器
- Twitter 如何每秒處理 3,000 張圖像
- 每天可處理數百萬個請求的圖像優化技術
- Facebook 如何向 80 萬同時觀看者直播
- Google 如何針對行星級基礎設施進行行星級工程設計?
- 為 Mail.Ru Group 的電子郵件服務實施反垃圾郵件的貓捉老鼠的故事,以及 Tarantool 與此相關的內容
- The Dollar Shave Club Architecture Unilever 以 10 億美元的價格被收購
- Uber 如何使用 Mesos 和 Cassandra 跨多個數據中心每秒管理一百萬個寫入
- 從將 Uber 擴展到 2000 名工程師,1000 個服務和 8000 個 Git 存儲庫獲得的經驗教訓
- QuickBooks 平臺
- 美國大選期間城市飛艇如何擴展到 25 億條通知
- Probot 的體系結構-我的 Slack 和 Messenger Bot 用于回答問題
- AdStage 從 Heroku 遷移到 AWS
- 為何將 Morningstar 遷移到云端:降低 97%的成本
- ButterCMS 體系結構:關鍵任務 API 每月可處理數百萬個請求
- Netflix:按下 Play 會發生什么?
- ipdata 如何以每月 150 美元的價格為來自 10 個無限擴展的全球端點的 2500 萬個 API 調用提供服務
- 每天為 1000 億個事件賦予意義-Teads 的 Analytics(分析)管道
- Auth0 體系結構:在多個云提供商和地區中運行
- 從裸機到 Kubernetes
- Egnyte Architecture:構建和擴展多 PB 內容平臺的經驗教訓