## 一、storm簡介
Storm是Twitter開源的一個分布式的實時計算系統,用于數據實時分析,持續計算,分布式RPC等等
## 二、storm指標
低延遲:都說了是實時計算系統了,延遲是一定要低的
高性能:可以使用幾臺普通的服務器建立環境,結余成本。
分布式:storm 非常適合于分布式場景,大數據的實時計算,你的數據和計算單機就能搞定,那么
不用考慮復雜的問題了。我們所說的單機搞定的情況
可擴展:
容錯
可靠性
快速
本地模式
## 三、storm
首先我們拿Hadoop和Storm進行一個簡單的對比
Hadoop Storm
系統角色 JobTracker Nimbus
TaskTracker Supervisor
Child Worker
應用名稱 Job Topology
組件接口 Mapper/Reducer Spout/Bolt
storm是一個開源的分布式實時計算系統,可以簡單、可靠的處理大量的數據流。
storm有很多使用場景:如實時分析,在線機器學習,持續計算,分布式RPC,ETL
等等。storm支持水平擴展,具有高容錯性,保證每個消息都會得到處理,而且處理速度
很快(在一個小集群,每個節點每秒可以處理數以百萬計的消息)。Storm的部署和運維
都很快捷。
## 四、Storm集群環境搭建
1、關閉防火墻,修改/etc/host/配置(3臺機器的ip可以互相通信)
2、下載jdk
3、搭建zk集群
4、安裝python(最好是2.6.6版本以上)
地址:wget
解壓:tar zxvf
進行:cd
命令:./configure --prefix =/usr/local/Python2.6.6
命令:make
命令:sudo make install
5、下載并解壓Storm發布版本
config
6、修改storm.yaml配置文件
添加zookeeper的節點
storm.zookeeper.server:
- "ip"
- "ip"
- "ip"
nimbus.host: 主節點
storm.local.dir: 存放的目錄 data文件夾
ui.port: 18080 端口號 storm 管控臺
supervisor.slots.ports:
- 6700
- 6701
- 6702
- 6703
7、啟動storm各位后臺進程、
8、最后分別進行 source /etc/profile
9、首先啟動zookeeper集群,然后分別啟動運行storm
主機器 (nimbus運行) storm nimbus &
從機器supervisor運行 storm supervisor &
主機器 ui運行 storm ui & 查看ui
主機器 logviewer運行 storm logviewer & (查看工作日志)
然后在中輸入主機器的ip,端口默認8080 這樣可以看到storm的一些集群配置
10、