[英]Spark sql queries on partitioned table with removed partitions files fails
以下是按顺序尝试的内容,
对这种行为的任何见解都会有很大的帮助。
是的, MSCK REPAIR TABLE
将仅发现新分区,而不删除“旧”分区。
使用删除了HDFS文件夹的外部配置单元表,我看到了两种解决方案
MSCK REPAIR TABLE
。 这是我的首选解决方案。 ALTER TABLE <table> DROP PARTITION <partition>
删除所有删除的ALTER TABLE <table> DROP PARTITION <partition>
您在案例中观察到的内容可能与以下内容有关: https : //issues.apache.org/jira/browse/SPARK-15044和https://issues.apache.org/jira/browse/SPARK-19187
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.