在鏈中的 pandas 中添加組屬性（類似於 dplyr group_by - R 中的變異）

Question

我想將一些組屬性作為新列添加到 pandas dataframe 但不破壞鏈。 我知道這在 R 中使用 dplyr 是可能的，但我無法讓它在 pandas 中工作。

dplyr 代碼將是（用於在 A 列中每組添加最大 B 列）：

df %>%
   group_by(A) %>%
   mutate(max = max(B)) %>%
   ungroup() %>%
   ... more operations

我可以讓它在 pandas 中工作的唯一方法是：

df['max'] = df.groupby('A')['B'].transform('max')

但這需要單獨的行來分配新列，而我想在鏈中執行它。 任何幫助，將不勝感激。

Answer 1

df.assign(max=df.groupby('A')['B'].transform('max'))....more operations

Answer 2

現在您可以使用datar順利完成

from datar import f
from datar.base import max
from datar.dplyr import group_by, mutate, ungroup

df >> \
   group_by(f.A) >> \
   mutate(max = max(f.B)) >> \
   ungroup() # >> 
   # ... more operations

我是 package 的作者。 如果您有任何問題，請隨時提交問題。

在鏈中的 pandas 中添加組屬性（類似於 dplyr group_by - R 中的變異）

問題描述

2 個解決方案

解決方案1
1 已采納 2020-08-10 13:30:04

解決方案2
1 2021-05-24 18:28:27

在鏈中的 pandas 中添加組屬性（類似於 dplyr group_by - R 中的變異）

問題描述

2 個解決方案

解決方案1 1 已采納 2020-08-10 13:30:04

解決方案2 1 2021-05-24 18:28:27

解決方案1
1 已采納 2020-08-10 13:30:04

解決方案2
1 2021-05-24 18:28:27