[英]How many function calls when I use pandas DataFrame groupby and then apply user-defined function?
[英]user-defined function for pandas groupby
def integration(*arg):
try:
return np.sum(arg)
except:
name = arg
return name
嗨~这是我的 function 我想像这样将这个 function 应用到 DataFrame
k g r
0 dd cc hh
1 bb 1 9
2 dd aa ll
3 bb 4 6
我得到的结果是
g r
k
bb 5 15
dd ccaa hhll
我想要'cc'而不是'ccaa'和'hh'而不是'hhll'。 当用户定义函数的输入长度超过2或更多时,我只想反映上一个。
就像是:
def integration(*arg):
try:
if type(np.sum(arg))==string:
return np.sum(arg)[0:2]
else:
return np.sum(arg)
except:
name = arg
return name
您可以执行以下操作,这更方便:
# Set the 'k' columns as index
df.set_index('k', inplace=True)
#Then you need to separate numbers from strings so you can change them to integers
df_numeric = df.apply(lambda x: x[x.str.contains(r'^\d+')]).astype(int).groupby(level=0).sum()
df_object = df.apply(lambda x:x[~(x.str.contains(r'^\d+'))])
df = pd.concat([df_numeric, df_object]).reset_index().drop_duplicates('k', keep='first')
Output:
k g r
0 bb 5 15
1 dd cc hh
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.