通过对每一行进行操作，在数据框中创建列的“pandas”方法是什么？

Question

我有一个apply函数，可以在我的数据帧中的每一行上运行。 该apply函数的结果是一个新值。 此新值旨在进入该行的新列。

因此，在将此函数应用于数据框中的所有行之后，该数据框中将有一个全新的列。

我怎么在pandas这样做？

Answer 1

主要有两种方式：

df['new_column'] = df.apply(my_fxn, axis=1)

要么

df = df.assign(new_column=df.apply(my_fxn, axis=1))

如果你需要使用其他参数，你可以将它们传递给apply函数，但有时候（对我来说）使用lambda更容易：

df['new_column'] = df.apply(lambda row: my_fxn(row, global_dict), axis=1)

此外，如果您的函数可以以矢量化方式在数组上运行，您可以这样做：

df['new_column'] = my_fxn(df['col1'], df['col2'])