繁体   English   中英

如何将自定义函数应用于每行的pandas数据框

[英]How to apply custom function to pandas data frame for each row

我想应用自定义函数并创建一个名为population2050的派生列,该列基于我的数据框中已存在的两列。

import pandas as pd
import sqlite3
conn = sqlite3.connect('factbook.db')
query = "select * from facts where area_land =0;"
facts = pd.read_sql_query(query,conn)
print(list(facts.columns.values))

def final_pop(initial_pop,growth_rate):
    final = initial_pop*math.e**(growth_rate*35)
    return(final)

facts['pop2050'] = facts['population','population_growth'].apply(final_pop,axis=1)

当我运行上面的代码时,我收到一个错误。 我没有正确使用'apply'功能吗?

Apply将沿着整个行传递,轴= 1。 假设您的两列名为initial_popgrowth_rate ,请growth_rate

def final_pop(row):
    return row.initial_pop*math.e**(row.growth_rate*35)

你几乎在那里:

facts['pop2050'] = facts.apply(lambda row: final_pop(row['population'],row['population_growth']),axis=1)

使用lambda允许您保留函数中列出的特定(有趣)参数,而不是将它们捆绑在“行”中。

无需DataFrame.apply()即可获得相同的结果。 Pandas系列(或数据帧列)可以用作NumPy函数的直接参数,甚至是内置的Python运算符,它们是按元素应用的。 在您的情况下,它就像以下一样简单:

import numpy as np

facts['pop2050'] = facts['population'] * np.exp(35 * facts['population_growth'])

这会将列population_growth中的每个元素相乘,将numpy的exp()函数应用于该新列( 35 * population_growth ),然后将结果与population一起添加。

你的功能,

def function(x):
  // your operation
  return x

把你的职能称为,

df['column']=df['column'].apply(function)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM