繁体   English   中英

如何在 Apache Spark 中记录延迟评估的数据帧?

[英]How to log a lazy evaluated dataframe in Apache Spark?

如何在不触发记录器语句中的操作的情况下登录 Spark 应用程序?

我希望能够执行以下操作:

df = df
  .logInfo("value is " + col("xyz));

在Java中可能吗?

当我阅读您的伪代码时,我读到您将记录列中的某些元素(5?10?)……您希望该元素如何在日志文件中呈现? show()这样的 Visual ASCII 数组?

我在类似情况下所做的是调用第一条记录并简单地将其显示在控制台上,如下所示:

df.show(1);

它不会评估 DAG 中的整个数据。 如果您需要访问值本身,请使用:

Row r = df.first();
log.debug(r.mkString());

看: https : //spark.apache.org/docs/latest/api/java/org/apache/spark/sql/Row.html#mkString-java.lang.String-

我假设 df 是Dataset<Row>一个实例。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM