<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                企業??AI智能體構建引擎,智能編排和調試,一鍵部署,支持知識庫和私有化部署方案 廣告
                [TOC] # 集群簡介 HADOOP集群具體來說包含兩個集群:HDFS集群和YARN集群,兩者邏輯上分離,但物理上常在一起 HDFS集群: 負責海量數據的存儲,集群中的角色主要有 NameNode / DataNode YARN集群: 負責海量數據運算時的資源調度,集群中的角色主要有 ResourceManager /NodeManager (那mapreduce是什么呢?它其實是一個應用程序開發包) 本集群搭建案例,以5節點為例進行搭建,角色分配如下 ~~~ hdp-node-01 NameNode SecondaryNameNode hdp-node-02 ResourceManager hdp-node-03 DataNode NodeManager hdp-node-04 DataNode NodeManager hdp-node-05 DataNode NodeManager ~~~ ![](https://box.kancloud.cn/c4002fd6a8c9058d35a516e45edf35fb_2080x880.png) # 安裝 安裝jdk,至少1.8 下載hadoop ~~~ wget https://archive.apache.org/dist/hadoop/common/hadoop-3.0.0/hadoop-3.0.0.tar.gz ~~~ # 注意 把下面的有關ip配置成`/etc/hosts`下面的別名對應ip,不然會報錯 還有hostname不能搞錯 時間同步 # 配置文件 1. 在hadoop-env.sh hadoop下的`/etc/hadoop/` 里面有個`hadoop-env.sh` 把`export JAVA_HOME=/usr/local/jdk8`這個改下,原來是沒有值的 2. 在core-site.xml中寫 ~~~ <configuration> <!-- 指定hadoop所使用的文件系統schema(URI),HDFS老大(NameNode)的地址 --> <property> <name>fs.defaultFS</name> <value>hdfs://192.168.33.12:9000</value> </property> <!-- 指定hadoop運行時產生文件的存儲目錄 --> <property> <name>hadoop.tmp.dir</name> <value>/root/hadoop3/tmp/hadoop</value> </property> </configuration> ~~~ 3. 在hdfs-site.xml中寫 ~~~ <configuration> <property> <name>dfs.namenode.name.dir</name> <value>/root/hadoop3/tmp/namenode</value> </property> <!--路徑可以配置多個,掛了的話有多個目錄可以恢復,號隔開--> <property> <name>dfs.datanode.data.dir</name> <value>/root/hadoop3/tmp/datanode</value> </property> <!--指定hdfs副本數量,默認是5個,這邊設置為1個--> <property> <name>dfs.replication</name> <value>1</value> </property> <!--保證數據備份和管理機制--> <property> <name>dfs.secondary.http.address</name> <value>192.168.33.12:50090</value> </property> </configuration> ~~~ 4. 在mapred-site.xml中寫 如果沒有這個文件`cp mapred-site.xml.template mapred-site.xml` ~~~ <configuration> <!--指定mr運行在yarn上--> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> ~~~ 5. 在yarn-site.xml中寫 ~~~ <configuration> <!-- Site specific YARN configuration properties --> <!--指定yarn的老大(ResourceManager)的地址--> <property> <name>yarn.resourcemanager.hostname</name> <value>192.168.33.12</value> </property> <!--reducer獲取數據的方式--> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration> ~~~ 6. 將hadoop添加到環境變量`/etc/profile` ~~~ # hadoop export HADOOP_HOME=/root/hadoop3 export PATH=$PATH:$HADOOP_HOME/sbin ~~~ source下 注意這些文件夾要提前創建 如果報一些錯誤 ~~~ file:///data ~~~ 試下加`file:///`這種的 # 啟動 首先要namenode格式下,前面是1版本,后面是2版本 ~~~ hdfs namenode -format(hadoop namenode -format) ~~~ 然后顯示 ![](https://box.kancloud.cn/a0876298c71900b1214b7c462b3b0fde_3222x562.png) 表示目錄已經被成功初始化了 ~~~ [root@12 current]# pwd /root/hadoop3/tmp/namenode/current [root@12 current]# ls -lah total 16K drwxr-xr-x 2 root root 112 Apr 7 12:31 . drwxr-xr-x 3 root root 21 Apr 7 12:31 .. -rw-r--r-- 1 root root 389 Apr 7 12:31 fsimage_0000000000000000000 -rw-r--r-- 1 root root 62 Apr 7 12:31 fsimage_0000000000000000000.md5 -rw-r--r-- 1 root root 2 Apr 7 12:31 seen_txid -rw-r--r-- 1 root root 212 Apr 7 12:31 VERSION ~~~ 里面fsi什么的是鏡像文件 seen_txid是迭代的版本號 然后我們查看下版本號 ~~~ [root@12 current]# cat VERSION #Sat Apr 07 12:31:09 UTC 2018 namespaceID=1413563114 clusterID=CID-6208de96-1ce0-4eea-b3df-f7a81c25f6b3 cTime=1523104269939 storageType=NAME_NODE blockpoolID=BP-871390616-0.0.0.12-1523104269939 layoutVersion=-64 ~~~ 比如我namenode的clusterID是這個,其他的datanode的clusterID也是這個值表示是一個集群 ## 方式一:每個守護線程逐一啟動 啟動順序如下: NameNode,DateNode,SecondaryNameNode,JobTracker,TaskTracker Hadoop-daemon.sh:用于啟動當前節點的進程 例如Hadoop-daemon.sh start namenode 用于啟動當前的名稱節點 Hadoop-daemons.sh:用于啟動所有節點的進程 例如:Hadoop-daemons.sh start datanode 用于啟動所有節點的數據節點 ~~~ [root@12 sbin]# hadoop-daemon.sh start namenode ~~~ ~~~ [root@12 sbin]# hadoop-daemon.sh start datanode WARNING: Use of this script to start HDFS daemons is deprecated. WARNING: Attempting to execute replacement "hdfs --daemon start" instead. ~~~ 這種警告意思就是hadoop這個命令被hdfs替代了 這個命令在各個datanode都要執行 ~~~ [root@12 sbin]# hadoop-daemon.sh start secondarynamenode ~~~ 查看下進程 ~~~ [root@12 sbin]# jps 3856 DataNode 4019 Jps 3988 SecondaryNameNode 3515 NameNode ~~~ 注意最大文件數打開,不然一啟動就可能等會就退出了 ~~~ yarn-daemon.sh start resourcemanager yarn-daemon.sh start nodemanager ~~~ ## 前提 **文件最大打開數限制** **ssh免密登錄** 注意authorized_keys這個文件里面的東西不要寫錯,前面ssh不要寫成sh,后面也不要少 還有.ssh權限問題 ~~~ # mkdir /root/.ssh # chown -R root:root /home/ansible # chmod 700 /root # chmod 700 /root/.ssh # chmod 644 /root/.ssh/authorized_keys //公鑰文件的所有權限 # chmod 600 /root/.ssh/id_rsa //私鑰文件的所有權限 ~~~ 其中這兩項`PubkeyAuthentication yes` 和`PasswordAuthentication no`的值都要為yes,即公鑰認證和密碼認證都要為yes,因為我連接的方式是通過這兩種方式來連接的, 重啟sshd服務 `systemctl restart sshd.service` mac要注意共享設置,允許遠程登錄 ## 方法二:全部啟動或者全部停止 **啟動** ~~~ start-all.sh ~~~ 啟動順序:`NameNode,DateNode,SecondaryNameNode,JobTracker,TaskTracker` **停止** ~~~ stop-all.sh ~~~ 關閉順序性:`JobTracker,TaskTracker,NameNode,DateNode,SecondaryNameNode` ## 方法三:分別啟動 首先創建slaves這個文件,在hadoop的配置文件 ~~~ 192.168.33.12 192.169.33.22 192.168.33.3 ~~~ 把這個slaves這個文件放到其他機器上,寫完最好檢查下 如果是hadoop3的話,這邊是workers,不是slaves 啟動:分別啟動HDFS和yarn ~~~ start-dfs.sh start-yarn.sh ~~~ 這個需要 ### 問題 **問題1** ~~~ Starting namenodes on [localhost] ERROR: Attempting to launch hdfs namenode as root ERROR: but there is no HDFS_NAMENODE_USER defined. Aborting launch. ~~~ 解決: 是因為缺少用戶定義造成的,所以分別編輯開始和關閉腳本 ~~~ $ vim sbin/start-dfs.sh $ vim sbin/stop-dfs.sh ~~~ 在空白處添加內容: ~~~ HDFS_DATANODE_USER=root HDFS_SECURE_DN_USER=hdfs HDFS_NAMENODE_USER=root HDFS_SECONDARYNAMENODE_USER=root ~~~ **問題2** ~~~ Starting resourcemanager ERROR: Attempting to launch yarn resourcemanager as root ERROR: but there is no YARN_RESOURCEMANAGER_USER defined. Aborting launch. Starting nodemanagers ERROR: Attempting to launch yarn nodemanager as root ERROR: but there is no YARN_NODEMANAGER_USER defined. Aborting launch. ~~~ ~~~ 解決: 是因為缺少用戶定義造成的,所以分別編輯開始和關閉腳本 $ vim sbin/start-yarn.sh $ vim sbin/stop-yarn.sh ~~~ 在空白處添加內容: ~~~ YARN_RESOURCEMANAGER_USER=root HADOOP_SECURE_DN_USER=yarn YARN_NODEMANAGER_USER=root ~~~ # web端查看 訪問 `http://192.168.33.12:8088/` ![](https://box.kancloud.cn/84b8aa8ae31b2cd64aab81fea3d63d2f_3130x586.png) 訪問 `http://192.168.33.12:9870`,注意,這里是9870,不是50070了: ![](https://box.kancloud.cn/29c80130766c95e6a755245266870df2_1418x534.png) ![](https://box.kancloud.cn/d9f8b6bb844109f5caa022be892a9f3c_1586x558.png) ![](https://box.kancloud.cn/57019a19ac4a2e5dbdaf11f239179542_918x452.png) ![](https://box.kancloud.cn/47b6eaf7244912a3f5519e1fb002a5c8_2000x338.png) ![](https://box.kancloud.cn/c06d638251641aea7dc5364d2274693c_2296x1712.png) ![](https://box.kancloud.cn/46655623abf027c99d60fe9707bd55a4_670x344.png) ## 試用 把這個文件放到文件系統的/下 ~~~ hdfs dfs -put anaconda-ks.cfg / ~~~ 從本地上傳一個文本文件到hdfs的/wordcount/input目錄下 ~~~ [HADOOP@hdp-node-01 ~]$ HADOOP fs -mkdir -p /wordcount/input [HADOOP@hdp-node-01 ~]$ HADOOP fs -put /home/HADOOP/somewords.txt /wordcount/input ~~~ 查看集群狀態 ~~~ hdfs dfsadmin –report ~~~ 查看HDFS中的目錄信息 ~~~ hadoop fs –ls / ~~~ 從HDFS下載文件 ~~~ hadoop fs -get /yarn-site.xml ~~~ # 例子 ~~~ cd /root/hadoop2/share/hadoop/mapreduce ~~~ 然后我們計算下圓周率 ~~~ hadoop jar hadoop-mapreduce-examples-2.6.4.jar pi 4 8 ~~~ 任務 ![](https://box.kancloud.cn/47911a976a98b29261c5adafd678fe30_453x243.png)
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看