繁体   English   中英

在hive表中插入的值,带有来自csv文件的字符串的双引号

[英]Values inserted in hive table with double quotes for string from csv file

我正在将csv文件导出到hive表中。 关于csv文件:列值用双引号括起来,用逗号分隔。

来自csv的样本记录

"4","good"
"3","not bad"
"1","very worst"

我用以下语句创建了一个hive表,

创建外部表currys(review_rating字符串,review_comment字符串)由','分隔的行格式字段;

表创建。

现在我使用命令load data local inpath加载数据并且它成功了。 当我查询表格时,

select * from currys;

结果是:

"4"  "good"
"3"  "not bad"
"1"   "very worst"

代替

4  good
3  not bad
1  very worst

记录插入双引号,不应该。

请让我知道如何摆脱这个双重报价..任何帮助或指导是高度赞赏...

先谢谢!

你在使用任何serde吗? 如果是这样,那么您可以在SERDE PROPERTIES编写一个regex命令来删除引号。

或者您可以从此处使用csv-serde并定义quote character

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM