[英]How to upload data into Hive inside HDInsight?
我正在尝试将Azure Blob存储中的Blob数据上传到Hive表,该表具有以下格式,并保存在名为myblob_test.csv的.csv文件中:
以下脚本用于创建表:
CREATE TABLE IF NOT EXISTS AzureData.Events(
Day STRING,
Event_Type STRING,
Time_Stamp STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n'
STORED AS TEXTFILE LOCATION '/bigdatapoc1/azure-data-2/myblob_test.csv';
当我运行table create命令时,它会正确完成。 但是当我查询:
select * from AzureData.Events;
我什么都没有。 因此,我尝试使用以下命令上传blob文件:
LOAD DATA INPATH 'wasb://azure-data-2@bigdatapoc1.blob.core.windows.net/myblob_test.csv' INTO TABLE AzureData.Events;
我收到以下错误:
要么
LOAD DATA INPATH '/bigdatapoc1/azure-data-2/myblob_test.csv' INTO TABLE AzureData.Events;
给出以下错误:
我不确定自己在做什么错。 有人可以指出我在哪里缺少一步吗?
首先,您需要了解Blob容器具有私有和公共访问权限。 如果是公共的,您的集群可以评估该容器。 否则,您将需要在供应过程中将Azure存储帐户添加为其他存储帐户。 设置过程将把存储帐户访问密钥写到站点配置文件中。 使群集可以访问容器。 有关添加其他存储帐户的信息,请参见https://azure.microsoft.com/zh-cn/documentation/articles/hdinsight-provision-clusters/ 。
要访问Blob容器,请使用以下语法:wasb [s]://@.blob.core.windows.net/有关更多信息,请参见https://azure.microsoft.com/zh-cn/documentation/文章/ hdinsight-hadoop-use-blob存储/
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.