繁体   English   中英

如何使用 Cloud Data Fusion 构建多行公式

[英]How to build multi row formula using Cloud Data Fusion

我正在尝试构建一个新列,其中包含特定列的运行总数。 是否有可用于执行此操作的指令? 关于如何做到这一点的任何建议?

对于此特定场景,CDF(Wrangler) 中不提供多行指令。 可以通过window聚合插件, https://cdap.atlassian.net/wiki/spaces/DOCS/pages/760381517/Window+Aggregation+Analytics+Spark实现特定列的运行总计

例如。 new_col:Accumulate(specific_col, 1, false) 作为聚合 function。

如果您需要为一组行滚动总和,请确保定义正确的分区列,如果不创建一个虚拟列以将整个表视为一个分区。 在后一种情况下,还要确保表不是很大。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM