如何將新列添加到現有的 DataFrame 中？

Question

我正在嘗試將合成數據列添加到現有的電影數據集中。 這個新列是演員最近第二部電影的總收入。

例如：

電影	演員	收入	*新專欄**
一種	尼克凱奇	7美元	5美元
乙	尼克凱奇	6美元	4美元
C	尼克凱奇	5美元	-
丁	尼克凱奇	4美元	-
乙	艾爾·帕西諾	3美元	1美元
F	艾爾·帕西諾	$2	-
G	艾爾·帕西諾	1美元	-

在 python 中對此進行編碼的最有效方法是什么？

Answer 1

假設電影已排序，請使用groupby.shift

df['New Column'] = df.groupby('Actor')['Revenue'].shift(-2, fill_value='-')

Output：

  Movie      Actor Revenue New Column
0     A   Nic Cage      $7         $5
1     B   Nic Cage      $6         $4
2     C   Nic Cage      $5          -
3     D   Nic Cage      $4          -
4     E  Al Pacino      $3         $1
5     F  Al Pacino      $2          -
6     G  Al Pacino      $1          -

如何將新列添加到現有的 DataFrame 中？

問題描述

1 個解決方案

解決方案1
1 已采納 2022-11-16 03:06:40

如何將新列添加到現有的 DataFrame 中？

問題描述

1 個解決方案

解決方案1 1 已采納 2022-11-16 03:06:40

解決方案1
1 已采納 2022-11-16 03:06:40