重命名放置在 Azure Blob 存儲中的 csv 文件

Question

我正在使用 Databricks(Pyspark) 在 Azure Blob 存儲中寫入一個 csv 文件，使用：

file_location = "/mnt/ndemo/nsalman/curation/movies/"
df.repartition(1).write.format("com.databricks.spark.csv").option("header", "true").save(file_location)

創建的文件命名為： part-00000-tid-3921235530521294160-fb002878-253d-44f5-a773-7bda908c7178-13-1-c000.csv

現在我使用這個將它重命名為“movies.csv”：

filePath = "/mnt/ndemo/nsalman/curation/movies/"
fs.rename(spark._jvm.org.apache.hadoop.fs.Path(filePath+"part*"), spark._jvm.org.apache.hadoop.fs.Path(filePath+"movies.csv"))

運行后它給了我這個輸出：

由於我是 Pyspark 的新手，我不確定為什么我的文件沒有被重命名？ 誰能讓我知道我哪里出錯了

Answer 1

嘗試這個

old_file_name = "test1.csv"
new_file_name = "test2.csv"

dbutils.fs.mv(old_file_name,new_file_name)

為我工作。

Answer 2

如果要更改文件夾名稱，可以使用以下命令，

dbutils.fs.mv("dbfs:/tmp/test", "dbfs:/tmp/test2", recurse=True)

如果您想更改單個文件名，

dbutils.fs.mv("dbfs:/mnt/all_tables.txt", "dbfs:/mnt/all_tables.txt_newname")

例子，

重命名放置在 Azure Blob 存儲中的 csv 文件

問題描述

2 個解決方案

解決方案1
0 2021-12-08 17:17:44

解決方案2
0 2021-12-08 17:46:50

重命名放置在 Azure Blob 存儲中的 csv 文件

問題描述

2 個解決方案

解決方案1 0 2021-12-08 17:17:44

解決方案2 0 2021-12-08 17:46:50

解決方案1
0 2021-12-08 17:17:44

解決方案2
0 2021-12-08 17:46:50