簡體   English   中英

數據塊筆記本中的多個單元格

[英]Multiple cells in databricks notebook

我是數據塊的新手。 問題是為什么筆記本中有多個單元格,而我們什么時候可以在一個單元格中編寫整套指令/程序?

問候,

使用多個單元的優點是您可以將大代碼分成小部分(在每個單元中),並且可以單獨執行該單元,而無需執行完整代碼,因為大分析、大型數據集、探索性數據可能需要很長時間分析、轉換等

換句話說,我們可以說,由於 Databricks 是一個大數據分析工具,涉及大型數據集(數百萬行)的攝取、數據集的清理、轉換,然后實現數據分析和機器學習算法。 如果您在單個單元中運行,所有這些任務都需要大量計算資源。 因此,您可以在 Databricks Notebook 的每個單元格中划分上述任務並單獨運行它們。

例如:如果您正在從 Azure Data Lake Storage 帳戶 (ADLS) 攝取數據,您可以在一個單元中為所需的存儲資源和路徑創建一個掛載點,然后單獨運行該單元。 現在您的 ADLS 容器已安裝,您可以使用另一個單元來准備數據。 這樣,您就不需要再次掛載資源,因為它已經在之前的單元格中完成了。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM