[英]Renaming a csv file placed in Azure Blob Storage
我正在使用 Databricks(Pyspark) 在 Azure Blob 存儲中寫入一個 csv 文件,使用:
file_location = "/mnt/ndemo/nsalman/curation/movies/"
df.repartition(1).write.format("com.databricks.spark.csv").option("header", "true").save(file_location)
創建的文件命名為: part-00000-tid-3921235530521294160-fb002878-253d-44f5-a773-7bda908c7178-13-1-c000.csv
現在我使用這個將它重命名為“movies.csv”:
filePath = "/mnt/ndemo/nsalman/curation/movies/"
fs.rename(spark._jvm.org.apache.hadoop.fs.Path(filePath+"part*"), spark._jvm.org.apache.hadoop.fs.Path(filePath+"movies.csv"))
運行后它給了我這個輸出:
由於我是 Pyspark 的新手,我不確定為什么我的文件沒有被重命名? 誰能讓我知道我哪里出錯了
嘗試這個
old_file_name = "test1.csv"
new_file_name = "test2.csv"
dbutils.fs.mv(old_file_name,new_file_name)
為我工作。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.