[英]Spark sql queries on partitioned table with removed partitions files fails
以下是按順序嘗試的內容,
對這種行為的任何見解都會有很大的幫助。
是的, MSCK REPAIR TABLE
將僅發現新分區,而不刪除“舊”分區。
使用刪除了HDFS文件夾的外部配置單元表,我看到了兩種解決方案
MSCK REPAIR TABLE
。 這是我的首選解決方案。 ALTER TABLE <table> DROP PARTITION <partition>
刪除所有刪除的ALTER TABLE <table> DROP PARTITION <partition>
您在案例中觀察到的內容可能與以下內容有關: https : //issues.apache.org/jira/browse/SPARK-15044和https://issues.apache.org/jira/browse/SPARK-19187
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.