繁体   English   中英

运行Spark群集的Azure Databricks中需要Azure Blob存储

[英]Need for Azure Blob Storage in Azure Databricks running Spark clusters

我正在使用与Azure Blob存储关联的Azure Databricks生态系统上的Spark群集。 另外,还有与Databricks相关的Databricks文件系统(DBFS)。 我想知道是否需要一个Azure Blob存储来存储数据? DBFS是否不足以存储文件/数据?

根据我的知识和文档, Azure Databricks通过DBFS使用Azure Blob存储。 回答您的问题-不需要,那就足够了。 您的数据仍然会保留。 如果您打算将存储的数据与笔记本以外的其他应用程序一起使用,例如在HDInsight群集顶部执行spark作业,则建议设置一个额外的(明确命名的)blob存储帐户。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM