[英]Sqoop - Import all tables from mysql to hive
我的mysql數據庫中有三個表:
具有兩個parent_table
表的parent_table
: foo
, bar
,其中parent_table
具有許多foo
和bar
以及foo
, bar
屬於parent_table
。
如何使用sqoop或另一種方法將這些表導入要查詢的配置單元中。
這是示例:
sqoop import-all-tables \
--connect "jdbc:mysql://quickstart.cloudera:3306/retail_db" \
--username=retail_dba \
--password=cloudera \
--warehouse-dir=/user/hive/warehouse/retail_stage.db
--connect子句中的retail_db是mysql數據庫–username子句中的mysql_retail_dba是有權訪問retail_db下的表的mysql用戶–password子句中的mysqldatabase cloudera是mysql用戶的密碼retail_dba /user/hive/warehouse/retail_stage.db --warehouse-dir中的hadoop目錄(在本例中為hive數據庫,可以有任何有效的hadoop目錄)。 上面的腳本將在/user/hive/warehouse/retail_stage.db下為每個mysql表創建目錄。
您可以像在Cloudera Quickstart VM中一樣運行此腳本。
您可以先閱讀《 Sqoop用戶指南》 ,其中介紹了如何使用Sqoop或更多面向用例的書Apache Sqoop Cookbook 。 兩種資源都應該能夠幫助您了解這種情況下需要做什么。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.