[英]User defined function on pandas dataframe
这是我的代码:
dfnew=pd.DataFrame({ 'year': [2015,2016],
'month': [10, 12],
'day': [25,31]})
print(dfnew)
def calc(yy,n):
if yy==2016:
return yy*2*n
else:
return yy
dfnew['nv']=map(calc, dfnew['year'],2)
print(dfnew['nv'])
我怎样才能让这段代码无误地运行? 我希望该函数仅应用于所有行的数据框的“年份”列,并将输出存储在同一数据框的名为“nv”的新列上。
需要apply
自定义功能:
dfnew['nv']= dfnew['year'].apply(lambda x: calc(x, 2))
print (dfnew)
day month year nv
0 25 10 2015 2015
1 31 12 2016 8064
更好的是使用mask
按条件更改值:
dfnew['nv']= dfnew['year'].mask(dfnew['year'] == 2016, dfnew['year'] * 2 * 2)
print (dfnew)
day month year nv
0 25 10 2015 2015
1 31 12 2016 8064
细节:
print (dfnew['year'] == 2016)
0 False
1 True
Name: year, dtype: bool
非常感谢您的及时回复。 你对我的问题的回答非常有帮助。
除此之外,我还需要将多个列名传递给函数,这就是我所做的。
def yearCalc(year,month,n):
if year == 2016:
print("year:{} month:{}".format(year, month))
return year * month * n
else:
return year
df['nv']= df[['year' ,'month']].apply(lambda x: yearCalc(x['year'],x['month'],2),axis=1)
非常感谢。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.