[英]Spark: How iterate through TransformedDStream, DataFrames, RDDs, DStreams?
我从 TCP 端口获取数据流,其中包括日期时间戳 info1 info2。 数据在一行中,我想拆分它。
我试图遍历 DStream。 我收到以下错误:
类型错误:'DStream' object 不可迭代
然后我尝试拆分并创建 dataframe。 我收到以下错误:
类型错误:'TransformedDStream' object 不可迭代
我还尝试将数据的 stream 直接存储在 dataframe 中,但出现错误:
'DataFrame' object 不是'可迭代'
我想要的最终结果是获取一列日期,一列时间戳,一列 info1,一列 info2,并对数据执行 SQL 查询。
我非常感谢您的帮助。
我从 TCP 端口获取数据流,其中包括日期时间戳 info1 info2。 数据在一行中,我想拆分它。
我试图遍历 DStream。 我收到以下错误:
类型错误:'DStream' object 不可迭代
然后我尝试拆分并创建 dataframe。 我收到以下错误:
类型错误:'TransformedDStream' object 不可迭代
我还尝试将数据的 stream 直接存储在 dataframe 中,但出现错误:
'DataFrame' object 不是'可迭代'
我想要的最终结果是获取一列日期,一列时间戳,一列 info1,一列 info2,并对数据执行 SQL 查询。
我非常感谢您的帮助。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.