[英]Union of RDD IN SPARK
在这里,我正在从运动学中读取数据,并将其存储在流rdd中。
在处理该流rdd之前,我希望从kinesis中读取另一堆数据并与上一个rdd合并。
像这样我想做rdd的联合4-5次,然后我想进一步处理它。
下面是我的代码
JavaReceiverInputDStream<byte[]> stream = KinesisUtils.createStream(sc, "speng-batch-ss", "SparkStreaming",
"https://kinesis.us-west-2.amazonaws.com", "us-west-2",
InitialPositionInStream.TRIM_HORIZON, Durations.seconds(batchIntervalSeconds),
StorageLevel.MEMORY_AND_DISK_2(), ak, sk);
听起来像是要stream.Window(duration * 4/5)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.