[英]Pyspark dataframe filter using occurrence based on column
尝试以下操作:
df = ... # The dataframe
N = 5 # The value to test
df_b = df.filter(df['A'] >= N).select('B')
这将首先过滤仅包含A> = N及其相应的“ B”值的行的数据框。 应用过滤器后,仅选择B列即可获得最终结果。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.