繁体   English   中英

如何在Pandas中的一组空列上进行groupby?

[英]How to do a groupby on an empty set of columns in Pandas?

我在大熊猫的一个角落里打。 我试图使用agg fn但没有做groupby。 假设我想在整个dataframe上进行聚合,即

from pandas import *
DF = DataFrame( randn(5,3), index = list( "ABCDE"), columns = list("abc") )
DF.groupby([]).agg({'a' : np.sum, 'b' : np.mean } ) # <--- does not work

DF.agg( {'a' ... } )也不起作用。

我的解决方法是做DF['Total'] = 'Total'然后做一个DF.groupby(['Total'])但这看起来有点人为。

有没有人有更清洁的解决方案?

它也不是那么好,但对于这种情况,如果你传递一个返回True的函数,至少它不需要改变df

>>> from pandas import *
>>> df = DataFrame( np.random.randn(5,3), index = list( "ABCDE"), columns = list("abc") )
>>> df.groupby(lambda x: True).agg({'a' : np.sum, 'b' : np.mean } )
             a         b
True  1.836649 -0.692655
>>> 
>>> df['total'] = 'total'
>>> df.groupby(['total']).agg({'a' : np.sum, 'b' : np.mean } ) 
              a         b
total                    
total  1.836649 -0.692655

您可以使用各种内置而不是lambda x: True但它们不那么明确,只是偶然工作。

使用类似的DataFrame.aggregate方法是个好主意。 在这里创建一个问题:

https://github.com/pydata/pandas/issues/1623

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM