![](/img/trans.png)
[英]Overwrite in to same partition files after transformation based on the filename using spark
[英]Spark avoid partition overwrite
我正在編寫一個將日志數據保存到目錄/logroot
的Spark應用程序。
我的代碼是
myDF.mode('overwrite').partitionBy('date','site').save('logroot')
我想使用overwrite
模式,以便每周一次多次重新處理所有每日數據。
我擔心的是, overwrite
清除所有logroot
目錄,而不僅是所涉及的分區。
我怎么解決這個問題?
在撰寫本文時,最好的解決方案似乎是:
append mode
保存數據框 感謝所有人的幫助,並希望Spark伙計們將提供一個更優雅的解決方案選項。
羅伯托
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.