簡體   English   中英

無法將文件從 DBFS 復制到 Databricks 中的本地桌面

[英]Not able to copy file from DBFS to local desktop in Databricks

我想將我的文件從 dbfs 保存或復制到我的桌面(本地)。 我使用這個命令但得到一個錯誤:

dbutils.fs.cp('/dbfs/username/test.txt', 'C:\Users\username\Desktop') 
Error: SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape

當我為我的案例查找 dbutils.fs.help() 時,我按照說明進行操作:

dbutils.fs provides utilities for working with FileSystems. Most methods in this package can take either a DBFS path (e.g., "/foo" or "dbfs:/foo"), or another FileSystem URI. For more info about a method, use dbutils.fs.help("methodName"). In notebooks, you can also use the %fs shorthand to access DBFS. The %fs shorthand maps straightforwardly onto dbutils calls. For example, "%fs head --maxBytes=10000 /file/path" translates into "dbutils.fs.head("/file/path", maxBytes = 10000)".

fsutils
cp(from: String, to: String, recurse: boolean = false): boolean -> Copies a file or directory, possibly across FileSystems

要將文件從 DBFS 下載到本地計算機,您可以按照以下步驟操作。

使用 cmd 安裝和配置 Azure Databricks CLI 的步驟:

Step1: Install Python, you'll need Python version 2.7.9 and above if you're using Python 2 or Python 3.6 and above if you're using Python 3.

步驟 2:運行pip install databricks-cli使用 pip 的適當版本為您的 Python 安裝。 如果您使用的是 Python 3,請運行pip3 install databricks-cli

3 步:設置身份驗證 => 要驗證和訪問 Databricks REST API,您需要使用個人訪問令牌。 令牌類似於密碼; 你應該小心對待他們。 令牌過期並且可以撤銷。

  • 單擊 Azure Databricks 工作區右上角的用戶配置文件圖標用戶配置文件。

  • 單擊用戶設置。

  • Go 到訪問令牌選項卡。

在此處輸入圖像描述

  • 單擊生成新令牌按鈕。
  • (可選)輸入描述(評論)和有效期。

在此處輸入圖像描述

  • 單擊生成按鈕。
  • 確保“復制”生成的令牌並存儲在安全位置。

Step4:復制databricks主機"https://centralus.azuredatabricks.net/"的URL和之前創建的token。

Step5:在cmd中運行“dbfs configure --token”,如下圖:

dbfs configure --token
Databricks Host (should begin with https://): https://centralus.azuredatabricks.net
Token: dapi72026dsfsdfsh987hjfiu431

Step6:使用 CMD 成功配置 Databricks CLI。

要驗證嘗試運行“databricks fs ls”,請檢查您是否能夠看到 DBFS。

在此處輸入圖像描述

參考: Databricks CLI

您可以使用 databricks cli 將文件從 databricks 文件系統下載到本地機器,如下所示;

dbfs cp dbfs:/myfolder/BRK4024.pptx A:DataSet\

示例:由於我在 dbfs 上的 myfolder 中有一個示例 BRK4024.pptx 文件,因此我使用 databricks cli 命令復制到本地計算機文件夾名稱(A:Dataset)

在此處輸入圖像描述

希望這可以幫助。


如果這回答了您的問題,請單擊“標記為答案”和“投票”。 而且,如果您有任何進一步的疑問,請告訴我們。

您需要使用 Databricks CLI 來執行此任務。

在本地計算機上安裝 CLI 並運行databricks configure進行身份驗證。 使用在用戶設置下生成的訪問令牌作為密碼。

將 CLI 安裝並配置到工作區后,您可以將文件復制到 DBFS 和從 DBFS 復制文件,如下所示:

databricks fs cp dbfs:/path_to_file/my_file /path_to_local_file/my_file

您也可以使用速記

dbfs cp dbfs:/path_to_file /path_to_local_file

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM