简体   繁体   English

pivot groupby 和 sum pandas dataframe

[英]pivot groupby and sum pandas dataframe

This should be simple, but i'm new to working in python.这应该很简单,但我是在 python 工作的新手。 Any suggestions please?请问有什么建议吗?

#original dataframe
df = pd.DataFrame({'year':[1,1,1,1,1],
                   'month':[4,4,4,4,4],
                   'mode': ['a','b','a','a','b']},
                  columns=['year','month','mode'])

#pivot/groupby etc
# df2=df.pivot(columns=('year','month'), values=('mode')).count()

#create this dataframe
df2 = pd.DataFrame({'year':[1],
                   'month':[4],
                   'a': [3],
                   'b':[2]},
                  columns=['year','month','a','b'])

I'm working in Koalas Apache Spark environment ( documentation ), so solution should work on it.我在 Koalas Apache Spark 环境(文档)中工作,所以解决方案应该可以解决。

df.pivot_table(index=['year','month'], aggfunc='size', columns='mode')

Alternatively You can use pd.get_dummies() :或者,您可以使用pd.get_dummies()

pd.get_dummies(df).groupby(['year','month']).sum()

result:结果:

            mode_a  mode_b
year month                
1    4           3       2

Note: I'm not sure that works in Koalas Apache Spark environment.注意:我不确定它是否适用于 Koalas Apache Spark 环境。

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM