安裝 · 大數據

[TOC] # 下載安裝包 ~~~ wget ? ?http://124.202.164.6/files/1139000006794ECA/apache.fayea.com/storm/apache-storm-0.9.5/apache-storm-0.9.5.tar.gz ~~~ 解壓 ~~~ tar -zxvf apache-storm-0.9.5.tar.gz ~~~ # 修改配置文件 ~~~ #指定storm使用的zk集群 storm.zookeeper.servers: - "master" - "slave" #指定storm集群中的nimbus節點所在的服務器 nimbus.host: "master" #指定nimbus啟動JVM最大可用內存大小 nimbus.childopts: "-Xmx1024m" #指定supervisor啟動JVM最大可用內存大小 supervisor.childopts: "-Xmx1024m" #指定supervisor節點上，每個worker啟動JVM最大可用內存大小 worker.childopts: "-Xmx768m" #指定ui啟動JVM最大可用內存大小，ui服務一般與nimbus同在一個節點上。 ui.childopts: "-Xmx768m" #指定supervisor節點上，啟動worker時對應的端口號，每個端口對應槽，每個槽位對應一個worker supervisor.slots.ports: - 6700 - 6701 - 6702 - 6703 ~~~ # 分發安裝包 ~~~ scp -r /export/servers/apache-storm-0.9.5 master:/root/ ~~~ # 啟動集群在nimbus.host所屬的機器上啟動 nimbus服務 ~~~ cd /root/storm/bin/ nohup ./storm nimbus & ~~~ 在nimbus.host所屬的機器上啟動ui服務 ~~~ cd /root/storm/bin/ nohup ./storm ui & ~~~ 在其它個點擊上啟動supervisor服務 ~~~ cd /root/storm/bin/ nohup ./storm supervisor & ~~~ 查看集群訪問`master:8080`，即可看到storm的ui界面 ![](https://box.kancloud.cn/d342eae1cd404b0561ca7e7bb7b155af_1908x1274.png) # 常用操作命令有許多簡單且有用的命令可以用來管理拓撲，它們可以提交、殺死、禁用、再平衡拓撲。 * 提交任務命令格式：`storm jar 【jar路徑】【拓撲包名.拓撲類名】【拓撲名稱】` ~~~ bin/storm jar examples/storm-starter/storm-starter-topologies-0.10.0.jar storm.starter.WordCountTopology wordcount ~~~ * 殺死任務命令格式：`storm kill 【拓撲名稱】 -w 10（執行kill命令時可以通過-w [等待秒數]指定拓撲停用以后的等待時間)` ~~~ storm kill topology-name -w 10 ~~~ * 停用任務命令格式：`storm deactivte 【拓撲名稱】` ~~~ storm deactivte topology-name ~~~ 我們能夠掛起或停用運行中的拓撲。當停用拓撲時，所有已分發的元組都會得到處理，但是spouts的nextTuple方法不會被調用。銷毀一個拓撲，可以使用kill命令。它會以一種安全的方式銷毀一個拓撲，首先停用拓撲，在等待拓撲消息的時間段內允許拓撲完成當前的數據流。 * 啟用任務命令格式：storm activate【拓撲名稱】 ~~~ storm activate topology-name ~~~ * 重新部署任務命令格式：storm rebalance 【拓撲名稱】 ~~~ storm rebalance topology-name ~~~ 再平衡使你重分配集群任務。這是個很強大的命令。比如，你向一個運行中的集群增加了節點。再平衡命令將會停用拓撲，然后在相應超時時間之后重分配worker，并重啟拓撲。 # 分析 ![](https://box.kancloud.cn/24beb2efe8b0aafc138cc8aab3f71755_1578x741.png)