
[英]How do I add the Databricks spark-csv package to a Python Jupyter notebook on IBM Bluemix
[英]How do I share Databricks Spark Notebook report/dashboard with customers?
我已经使用齐柏林飞艇几个月了。 它是内部数据分析的绝佳工具。 我正在寻找与客户共享报告的更多功能。 我需要将每周/每月/每季度的报告发送给客户。 寻找一种自动执行此过程的方法。 请让我知道Databricks Spark Notebook或任何其他工具是否具有帮助我完成此任务的功能。
您可以为此使用数据块仪表板。 拥有仪表板后,您可以对仪表板进行HTML导出并将HTML文件共享给公众。
如果您对自动化报告流程感兴趣,则可能需要研究databricks REST API: https ://docs.databricks.com/api/latest/jobs.html#runs-export。 你需要通过run_id
笔记本工作和所需views_to_export
(此值应为DASHBOARD
)作为查询参数。 请注意,此运行导出仅仅支持笔记本作业导出,这是因为通常cos仪表板通常是由笔记本作业生成的。
如果您的数据块HTML仪表板导出成功,您将获得"views"
JSON响应,该响应由键值对对象列表组成,您的HTML字符串将在每个对象的"content"
键下可用。 然后,您可以使用此HTML字符串执行任何操作,可以将其直接发送到电子邮件/备用邮件以进行自动报告。
为了生成run_id
,您首先需要创建一个笔记本作业,您可以通过databricks UI来完成该作业。 然后,您可以通过触发笔记本作业来运行run_id
,方法是:
我更喜欢使用第二方法,并通过REST API编程运行工作,因为我总能找到run_id
当我运行的工作,不像我在每次作业计划运行时间看databricks UI第一种方法。 无论哪种方式,您都必须等待笔记本作业运行完成才能运行笔记本作业导出,以便成功获取HTML中完整的数据块仪表板。
您是否可以尝试通过互联网托管实例?
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.