繁体   English   中英

数据块笔记本中的多个单元格

[英]Multiple cells in databricks notebook

我是数据块的新手。 问题是为什么笔记本中有多个单元格,而我们什么时候可以在一个单元格中编写整套指令/程序?

问候,

使用多个单元的优点是您可以将大代码分成小部分(在每个单元中),并且可以单独执行该单元,而无需执行完整代码,因为大分析、大型数据集、探索性数据可能需要很长时间分析、转换等

换句话说,我们可以说,由于 Databricks 是一个大数据分析工具,涉及大型数据集(数百万行)的摄取、数据集的清理、转换,然后实现数据分析和机器学习算法。 如果您在单个单元中运行,所有这些任务都需要大量计算资源。 因此,您可以在 Databricks Notebook 的每个单元格中划分上述任务并单独运行它们。

例如:如果您正在从 Azure Data Lake Storage 帐户 (ADLS) 摄取数据,您可以在一个单元中为所需的存储资源和路径创建一个挂载点,然后单独运行该单元。 现在您的 ADLS 容器已安装,您可以使用另一个单元来准备数据。 这样,您就不需要再次挂载资源,因为它已经在之前的单元格中完成了。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM