數據導出 · 大數據

[TOC] # 數據導出將數據從HDFS導出到RDBMS數據庫 **導出前,目標表必須存在于目標數據庫中** * 默認操作是從將文件中的數據使用INSERT語句插入到表中 * 更新模式下，是生成UPDATE語句更新表數據 # 語法以下是export命令語法 ~~~ $ sqoop export (generic-args) (export-args) ~~~ # 示例數據是在HDFS 中`“/user/root/emp_conn”`目錄下存在part-m-00000文件中。所述part-m-00000如下： ~~~ 1201,2356742,gopal@tp.com 1202,1661663,manisha@tp.com 1203,8887776,khalil@ac.com 1204,9988774,prasanth@ac.com 1205,1231231,kranthi@tp.com ~~~ 1. 首先需要手動創建mysql中的目標表 ~~~ $ mysql mysql> use userdb; mysql> CREATE TABLE emp_conn_from_hdfs( id INT, phno VARCHAR(20), email VARCHAR(20)); ~~~ 2. 然后執行導出命令 ~~~ sqoop export \ --connect jdbc:mysql://localhost:3306/userdb \ --username root \ --password root \ --table emp_conn_from_hdfs \ --export-dir /user/root/emp_conn \ --m 1 ~~~ 3. 驗證表mysql命令行 ~~~ mysql>select * from emp_conn_from_hdfs; ~~~ 如果給定的數據存儲成功，那么可以找到數據在如下的emp_conn_from_hdfs表。