繁体   English   中英

用户自定义 function 为 pandas groupby

[英]user-defined function for pandas groupby

def integration(*arg):
    try:
        return np.sum(arg)
    except:
        name = arg
        return name

嗨~这是我的 function 我想像这样将这个 function 应用到 DataFrame

   k  g  r
0  dd cc hh
1  bb  1  9
2  dd aa ll
3  bb  4  6

我得到的结果是

     g    r
k  
bb   5    15
dd  ccaa  hhll

我想要'cc'而不是'ccaa'和'hh'而不是'hhll'。 当用户定义函数的输入长度超过2或更多时,我只想反映上一个。

就像是:

def integration(*arg):
    try:
        if type(np.sum(arg))==string:
            return np.sum(arg)[0:2]
        else:
            return np.sum(arg)
    except:
        name = arg
        return name

您可以执行以下操作,这更方便:

# Set the 'k' columns as index
df.set_index('k', inplace=True)

#Then you need to separate numbers from strings so you can change them to integers
df_numeric = df.apply(lambda x: x[x.str.contains(r'^\d+')]).astype(int).groupby(level=0).sum()
df_object = df.apply(lambda x:x[~(x.str.contains(r'^\d+'))])

df = pd.concat([df_numeric, df_object]).reset_index().drop_duplicates('k', keep='first')

Output:

    k   g   r
0   bb  5   15
1   dd  cc  hh

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM