繁体   English   中英

Hive:当插入分区表时,在大多数行中,hive double url-encode分区键列

[英]Hive: When insert into partitioned table, in most of the rows, hive double url-encode the partition key column

我创建了一个分区表:

create table  t1 ( amount double) partitioned by ( events_partition_key string) stored as paquet;

向tmp_table添加了一些数据,其中'events_partition_key'列包含以下格式的时间戳(字符串类型):“2018-02-25 00:00:00”

然后我将一些数据插入到分区表中。

insert into table t1 partition (events_partition_key)
select amount, events_partition_key
from tmp_table

当从新的分区表t1中选择时,在某些情况下,events_partition_key列定期呈现与tmp_table中出现的相同,即“2018-02-25 00:00:00”,但在大多数情况下,它看起来是URL编码的,即“ 2018-02-25 00%3A00%3A00“

这是选择不同的events_partition_key时的样子

在任何情况下,原始列partition_key在URL编码与否的情况下没有区别,

显示新表的分区时:

show partitions t1;

我得到了两次URL编码的两次(即“2018-02-25 00%253A00%253A00”),但有些情况只有一次(即“2018-02-25 00%3A00%3A00”)

在此输入图像描述

只有在成为分区键之后,原始值才会出错。

这个Jira HIVE-3679hive.decode.partition.name属性添加到版本0.10.0中的HiveConf.java

尝试将其设置为true。

set hive.decode.partition.name=true;

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM