[英]Sqoop - Import all tables from mysql to hive
我的mysql数据库中有三个表:
具有两个parent_table
表的parent_table
: foo
, bar
,其中parent_table
具有许多foo
和bar
以及foo
, bar
属于parent_table
。
如何使用sqoop或另一种方法将这些表导入要查询的配置单元中。
这是示例:
sqoop import-all-tables \
--connect "jdbc:mysql://quickstart.cloudera:3306/retail_db" \
--username=retail_dba \
--password=cloudera \
--warehouse-dir=/user/hive/warehouse/retail_stage.db
--connect子句中的retail_db是mysql数据库–username子句中的mysql_retail_dba是有权访问retail_db下的表的mysql用户–password子句中的mysqldatabase cloudera是mysql用户的密码retail_dba /user/hive/warehouse/retail_stage.db --warehouse-dir中的hadoop目录(在本例中为hive数据库,可以有任何有效的hadoop目录)。 上面的脚本将在/user/hive/warehouse/retail_stage.db下为每个mysql表创建目录。
您可以像在Cloudera Quickstart VM中一样运行此脚本。
您可以先阅读《 Sqoop用户指南》 ,其中介绍了如何使用Sqoop或更多面向用例的书Apache Sqoop Cookbook 。 两种资源都应该能够帮助您了解这种情况下需要做什么。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.