开启Sqoop
Sqoop是一个具有以下结构的命令行工具
sqoop TOOL PROPERTY_ARGS SQOOP_ARGS [-- EXTRA_ARGS]
- TOOL指示操作,例如:”import”,”export”。
- PROPERTY_ARGS是以”-Dname=value”格式表示的Java属性。
- SQOOP_ARGS提及了各种Sqoop参数。
- EXTRA_ARGS是用于特定连接器的,与SQOOP_ARGS用”–“分隔开。
示例:
% sqoop import --connect jdbc:mysql://localhost/hadoopguide --table widgets -m 1
输入”sqoop help”以获取所有可用的工具:
后端发生了什么
当你决定将数据从关系型数据库移动到HDFS时,第一个要使用的产品是Apache Sqoop。当你请求将数据传输到HDFS时,以下事情会发生。
- Sqoop从关系型数据库请求元数据信息。
- 关系型数据库返回所需的请求。
- 根据元数据信息,Sqoop生成Java类。
- 根据主键分区在表中进行分区,因为多个映射器将同时导入数据。