[英]Get Pyspark Job Output on NodeJS
我成功提交了 Pyspark 作業,我想 output 作業的結果。
我從以下代碼中得到了工作的結果:
const output = await storage
.bucket(clusterResp.config.configBucket)
.file(
`google-cloud-dataproc-metainfo/${clusterResp.clusterUuid}/` +
`jobs/${jobId}/driveroutput.000000000`
)
.download();
但是,結果還包括作業中的所有日志。
有什么方法可以讓我的 pyspark 文件打印的 output 沒有任何日志記錄信息?
根據在此處輸入的文檔,您可以設置 --driver-log-levels 以查看驅動程序/控制台 output 的作業。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.