如何正确使用带有apply功能的pandas groupby来解决副作用？（第一组申请两次）

Question

我正在使用 Pandas 对数据框中的某些列进行分组，并将自定义函数应用于这些组。 应用函数利用副作用并作用于函数内的全局数据对象。

pandas、groupby 和 apply 的一个记录警告是，按照设计，它在第一组上应用两次调用的函数来决定它是否可以采用快速或慢速的代码路径。 这在此处记录： http : //pandas.pydata.org/pandas-docs/stable/groupby.html#flexible-apply

在这里演示：

In [144]: d = pd.DataFrame({"a":["x", "y"], "b":[1,2]})

In [145]: def identity(df):
   .....:     print(df)
   .....:     return df
   .....: 

In [146]: d.groupby("a").apply(identity)
   a  b
0  x  1
   a  b
0  x  1
   a  b
1  y  2
Out[146]: 
   a  b
0  x  1
1  y  2

在此处的其他一些 stackoverflow 帖子中提到：

Python Pandas groupby 对象应用方法复制第一组

Pandas 0.16.1 groupby().apply() 方法是否对同一组多次应用函数？

在 GitHub 上提到：

https://github.com/pandas-dev/pandas/issues/7739

https://github.com/pandas-dev/pandas/issues/19167

这意味着我的副作用在第一组中被调用两次并导致不需要的更改。

我的问题是如何使用 pandas、groupby 和 apply 而不会在第一组（或任何组）上应用两次副作用，并保证它只在每个组上调用一次？

我想在 DataFrame 的顶部创建一个虚拟/假组，但我想将我的问题扩展到 stackoverflow 社区，以获得更好的解决方案并造福他人。

感谢您的帮助。

编辑：

根据评论中的要求，关于自定义功能和副作用的更多详细信息。