簡體   English   中英

Pandas Groupby 最多多列

[英]Pandas Groupby Max of Multiple Columns

給定這個數據框:

import pandas as pd
df = pd.DataFrame({'group':['a','a','b','c','c'],'strings':['ab','   ','   ','12','  '],'floats':[7.0,8.0,9.0,10.0,11.0]})

    group strings  floats
0     a      ab     7.0
1     a             8.0
2     b             9.0
3     c      12    10.0
4     c            11.0

我想按“組”分組並獲得字符串和浮點數的最大值。

期望的結果:

      strings  floats
group                
a          ab     8.0
b                 9.0
c          12    11.0

我知道我可以這樣做:

df.groupby(['group'], sort=False)['strings','floats'].max()

但實際上,我有很多列,所以我想引用一個 go 中的所有列(“組”除外)。

我希望我可以這樣做:

df.groupby(['group'], sort=False)[x for x in df.columns if x != 'group'].max()

但是,唉,“無效的語法”。

如果需要沒有group的所有列的max ,可以使用:

df = df.groupby('group', sort=False).max()
print (df)
      strings  floats
group                
a          ab     8.0
b                 9.0
c          12    11.0

如果添加 next [] ,您的第二個解決方案將起作用:

df = df.groupby(['group'], sort=False)[[x for x in df.columns if x != 'group']].max()
print (df)
      strings  floats
group                
a          ab     8.0
b                 9.0
c          12    11.0

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM