[英]Is it possible to create an external hive table on a parquet file with a different schema?
我的镶木地板文件的结构如下:
+------+------------------+------------------+
| col1 | col2 | col3 |
+------+------------------+------------------+
| v0 | { k1:v1, k2:v2 } | { k3:v3, k4:v4 } |
+------+------------------+------------------+
col2和col3是映射列。 我希望创建一个带有以下架构的配置单元表,其基础如下:
+-------+-----+-----+-----+-----+
| col1 | k1 | k2 | k3 | k4 |
+-------+-----+-----+-----+-----+
| v0 | v1 | v2 | v3 | v4 |
+-------+-----+-----+-----+-----+
是否可以创建上述映射? 我熟悉在hbase表上创建外部表的类似过程。
您可以执行以下步骤:
1.创建一个临时表并按原样存储文件(具有地图列类型);
2.使用所需的最终结构创建第二个表;
3.从临时表插入第二个表。 插入时,您需要使用一些功能,例如:修剪,分割等。您可以使用此示例 。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.