偽分布式環境搭建 · Hadoop2.x

**一：虛擬機準備** 已安裝jdk、mysql、hadoop偽分布式或hadoop集群（完全分布式）。 ```shell [root@hadoop101 /]# mysql --version mysql Ver 14.14 Distrib 5.5.40, for Linux (x86_64) using readline 5.1 [root@hadoop101 /]# java -version java version "1.8.0_171" Java(TM) SE Runtime Environment (build 1.8.0_171-b11) Java HotSpot(TM) 64-Bit Server VM (build 25.171-b11, mixed mode) [root@hadoop101 /]# hadoop version Hadoop 2.6.0-cdh5.14.2 ``` **二：偽分布式安裝** 下載地址 http://archive.cloudera.com/cdh5/cdh/5/ 或者安裝apache版本，下載地址 http://archive.apache.org/dist/hive/ <br/> 這里演示安裝版本為hive-1.1.0(cdh版)。雖然版本有點舊，但和cdh5.14.2版本的hadoop2.6.0相對應的即為該版本，結合使用，可以避免出現意外的環境沖突。目前最新版本2.x為2.3.7。 3.x版本是結合hadoop3.x使用。本章附錄有hive2.3.7的安裝教程，有興趣可以自行安裝。） <br/> 需要的軟件包：hive-1.1.0-cdh5.14.2.tar.gz <br/> 1、將軟件包上傳到Linux系統指定目錄下： /opt/software 2、解壓到指定的目錄：/opt/install ```sql [root@hadoop101 software]$ tar -zxvf hive-1.1.0-cdh5.14.2.tar.gz -C /opt/install -- 嫌棄解壓后的名字太長，創建一個軟鏈接 [root@hadoop101 software]$ cd /opt/install/ [root@hadoop101 install]$ ln -s /opt/install/hive-1.1.0-cdh5.14.2/ hive ``` 3、配置環境變量 ```sql [root@hadoop101 ~]# vim /etc/profile -- 添加如下兩行 export HIVE_HOME=/opt/install/hive export PATH=$PATH:$HIVE_HOME/bin -- 使環境變量生效 [root@hadoop101 ~]# source /etc/profile ``` 4、在 {hive_home}/conf/hive-site.xml 指定hdfs文件系統和MySQL數據庫。{hive_home}表示hive的安裝目錄 ```xml [root@hadoop101 ~]# cd /opt/install/hive/conf/ [root@hadoop101 ~]# vim hive-site.xml <configuration>  <property> <name>hive.metastore.warehouse.dir</name> <value>/home/hadoop/hive/warehouse</value> </property>   <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://hadoop101:3306/hive?createDatabaseIfNotExist=true</value> </property> <property> 　　<name>javax.jdo.option.ConnectionDriverName</name> 　　<value>com.mysql.jdbc.Driver</value> </property>  <property> 　　<name>javax.jdo.option.ConnectionUserName</name> 　　<value>hive</value> </property>  <property> 　　<name>javax.jdo.option.ConnectionPassword</name> 　　<value>hive</value> </property>  <property> <name>hive.exec.scratchdir</name> <value>/home/hadoop/hive/data/hive-${user.name}</value> <description>Scratch space for Hive jobs</description> </property> <property> <name>hive.exec.local.scratchdir</name> <value>/home/hadoop/hive/data/${user.name}</value> <description>Local scratch space for Hive jobs</description> </property> </configuration> ``` 5、創建hdfs系統文件并修改權限 ```sql -- 記得開啟hdfs [root@hadoop101 ~]# hdfs dfs -mkdir /tmp [root@hadoop101 ~]# hdfs dfs -mkdir -p /home/hadoop/hive/warehouse -- 企業生產環境一般權限設置如下 [root@hadoop101 ~]# hdfs dfs -chmod g+w /tmp [root@hadoop101 ~]# hdfs dfs -chmod g+w /home/hadoop/hive/warehouse -- 我是學習的，是測試環境，可以如下設置 [root@hadoop101 ~]# hdfs dfs -chmod -R 777 /tmp [root@hadoop101 ~]# hdfs dfs -chmod -R 777 /home/hadoop/hive/warehouse ``` 6、在{hive_home}/conf/hive-env.sh 修改如下配置 ```sql [root@hadoop101 conf]$ mv hive-env.sh.template hive-env.sh [root@hadoop101 conf]$ vim hive-env.sh -- 修改如下配置 # Set HADOOP_HOME to point to a specific hadoop install directory HADOOP_HOME=/opt/install/hadoop # Hive Configuration Directory can be controlled by: export HIVE_CONF_DIR=/opt/install/hive/conf # Folder containing extra ibraries required for hive compilation/execution can be controlled by: export HIVE_AUX_JARS_PATH=/opt/install/hive/lib ``` 7、修改{hive_home}/conf/hive-log4j.properties ```shell [root@hadoop101 conf]$ mkdir -p /opt/install/hive/logs [root@hadoop101 conf]$ chown -R hadoop:hadoop /opt/install/hive/logs -- 重命名hive-log4j.properties (去掉.template) [root@hadoop101 conf]$ mv hive-log4j.properties.template hive-log4j.properties [root@hadoop101 conf]$ vim hive-log4j.properties --修改hive-log4j.properties以下內容： hive.log.dir=/opt/install/hive/logs ``` 8、上傳mysql JDBC的jar到hive的lib下 ```shell -- 上傳mysql jdbc驅動包到hive/lib/目錄下 -- mysql-connector-java-5.1.44-bin.jar [root@hadoop101 conf]$ cp mysql-connector-java-5.1.44-bin.jar /opt/install/hive/lib/ ``` 9、進入mysql為hive創建一個mysql用戶并且賦予權限 ```sql [root@hadoop101 conf]$ mysql -u root -p -- 已經在{hive_home}/conf/hive-site.xml配置了用戶名為hive，密碼為hive mysql> create user 'hive'@'%' identified by 'hive'; mysql> grant all on *.* to 'hive'@'hadoop101' identified by 'hive'; mysql> set password for hive@hadoop101=password('hive'); mysql> flush privileges; ``` 10、退出mysql，啟動hive ```shell （1）啟動hive前必須確保已經啟動mysql -- 查看MySQL是否開啟 [root@hadoop101 rovt]# service mysql status SUCCESS! MySQL running (1597) -- 如果沒有開啟則開啟 [root@hadoop101 rovt]# service mysql start （2）啟動Hive前必須啟動hdfs和yarn [root@hadoop101 hadoop]# sbin/start-dfs.sh [root@hadoop101 hadoop]# sbin/start-yarn.sh [root@hadoop101 hadoop]# jps 2739 NameNode 2868 DataNode 3926 Jps 3032 SecondaryNameNode 3192 ResourceManager 3322 NodeManager -- 啟動hive [root@hadoop101 rovt]# hive ``` 11、驗證元數據是否可用 ```shell hive> show databases; OK default Time taken: 8.651 seconds, Fetched: 1 row(s) ``` 出現上面的信息表示啟動成功！