cost 97 ms
Spark:如何迭代 TransformedDStream、DataFrame、RDD、DStream? - Spark: How iterate through TransformedDStream, DataFrames, RDDs, DStreams?

我从 TCP 端口获取数据流,其中包括日期时间戳 info1 info2。 数据在一行中,我想拆分它。 我试图遍历 DStream。 我收到以下错误: 类型错误:'DStream' object 不可迭代然后我尝试拆分并创建 dataframe。 我收到以下错误: 类型错误:'Transforme ...

Spark的socket文本stream为空 - Spark's socket text stream is empty

我正在关注 Spark 的流媒体指南。 我没有使用nc -lk 9999 ,而是创建了自己的简单 Python 服务器,如下所示。 从下面的代码可以看出,它会随机生成字母a到z 。 我用客户端代码测试了这个服务器,如下所示。 但是,我的 Spark 流代码似乎没有收到任何数据,或者它没有打印任何内容 ...

无法在 kafka 直接 stream 中手动提交偏移量,Spark 流 - Unable to manually commit offset in kafka direct stream, Spark streaming

我正在尝试验证手动偏移提交的工作。 当我尝试通过使用 thread.sleep()/jssc.stop()/ 在 while 循环中抛出异常来退出作业时,我看到正在提交偏移量。 我只是发送几条消息以进行测试,但是一旦作业开始处理批处理,我就会看到 0 滞后。 spark 何时实际提交偏移量?Jav ...

Kafka-Spark Streaming集成:DStream和任务重用 - Kafka - Spark Streaming Integration: DStreams and Task reuse

我正在尝试了解Spark Streaming(而非结构化流)的内部,特别是任务查看DStream的方式。 我在这里查看 scala中Spark的源代码。 我了解调用堆栈: 我了解DStream实际上是RDD的哈希图,但是我试图了解任务查看DStream的方式。 我知道Kafka S ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM