繁体   English   中英

Python Spark:“GroupedData”对象没有属性“orderBy”

[英]Python Spark: 'GroupedData' object has no attribute 'orderBy'

从包含动漫信息的数据框中,我想查看每个流派的平均分数,但出现了这个我不明白的错误。

问题

我期待每个类型的平均得分(using.avg)的数据框:浪漫 - 9.1 恐怖 - 7.8 幻想 - 7.1

在调用.orderBy()之前,您必须以某种方式聚合分组数据。 .groupBy()返回一个GroupedData对象。

这应该工作:

from pyspark.sql.functions import col

origin_table \
    .groupBy('Genres') \
    .avg(col('Score').alias('Score')) \
    .orderBy('Score')

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM