增量導入 · 大數據

[TOC] # 增量導入增量導入是僅導入新添加的表中的行的技術。它需要添加`‘incremental’, ‘check-column’, `和` ‘last-value’`選項來執行增量導入。下面的語法用于Sqoop導入命令增量選項。 ~~~ --incremental <mode> --check-column <column name> --last value <last check column value> ~~~ 假設新添加的數據轉換成emp表如下： `1206, satish p, grp des, 20000, GR` 下面的命令用于在emp表執行增量導入。 ~~~ bin/sqoop import \ --connect jdbc:mysql://localhost:3306/userdb \ --username root \ --password root \ --table emp --m 1 \ --target-dir /emp_append \ --incremental append \ --check-column id \ --last-value 1203 ~~~ `--incremental append`表示要增量導入 `--check-column id`表示要按照那一列增量導入 `--last-value 1203`上一列的值是1203,表示這次是從這個往后面以下命令用于從emp表導入HDFS?emp/?目錄的數據驗證。 ~~~ $ $HADOOP_HOME/bin/hadoop fs -cat /user/root/emp/part-m-* ~~~ 它用逗號(,)分隔 emp_add表數據和字段。 ~~~ 1201, gopal, manager, 50000, TP 1202, manisha, preader, 50000, TP 1203, kalil, php dev, 30000, AC 1204, prasanth, php dev, 30000, AC 1205, kranthi, admin, 20000, TP 1206, satish p, grp des, 20000, GR ~~~ 下面的命令是從表emp 用來查看修改或新添加的行 ~~~ $ $HADOOP_HOME/bin/hadoop fs -cat /emp_append/part-m-*1 ~~~ 這表示新添加的行用逗號（，）分隔emp表的字段。 ~~~ 1206, satish p, grp des, 20000, GR ~~~