[英]Aggregate function over a given time interval spark
通常,您可以每次提取5分钟时段(例如,将时间戳记作为数字,除以5分钟,然后得出结果)。
然后,您只需执行以下操作:
df.groupBy("bucket").avg($"value")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.