繁体   English   中英

如何在HDInsight内部将数据上传到Hive?

[英]How to upload data into Hive inside HDInsight?

我正在尝试将Azure Blob存储中的Blob数据上传到Hive表,该表具有以下格式,并保存在名为myblob_test.csv的.csv文件中:

在此处输入图片说明

以下脚本用于创建表:

CREATE TABLE IF NOT EXISTS AzureData.Events(
Day STRING,
Event_Type STRING,
Time_Stamp STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n'
STORED AS TEXTFILE LOCATION '/bigdatapoc1/azure-data-2/myblob_test.csv';

我的文件保存在以下位置 在此处输入图片说明

当我运行table create命令时,它会正确完成。 但是当我查询:

select * from AzureData.Events; 

我什么都没有。 因此,我尝试使用以下命令上传blob文件:

LOAD DATA INPATH 'wasb://azure-data-2@bigdatapoc1.blob.core.windows.net/myblob_test.csv' INTO TABLE AzureData.Events;

我收到以下错误:

在此处输入图片说明

要么

LOAD DATA INPATH '/bigdatapoc1/azure-data-2/myblob_test.csv' INTO TABLE AzureData.Events;

给出以下错误:

在此处输入图片说明

我不确定自己在做什么错。 有人可以指出我在哪里缺少一步吗?

首先,您需要了解Blob容器具有私有和公共访问权限。 如果是公共的,您的集群可以评估该容器。 否则,您将需要在供应过程中将Azure存储帐户添加为其他存储帐户。 设置过程将把存储帐户访问密钥写到站点配置文件中。 使群集可以访问容器。 有关添加其他存储帐户的信息,请参见https://azure.microsoft.com/zh-cn/documentation/articles/hdinsight-provision-clusters/

要访问Blob容器,请使用以下语法:wasb [s]://@.blob.core.windows.net/有关更多信息,请参见https://azure.microsoft.com/zh-cn/documentation/文章/ hdinsight-hadoop-use-blob存储/

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM