如何将新列添加到现有的 DataFrame 中？

Question

我正在尝试将合成数据列添加到现有的电影数据集中。 这个新列是演员最近第二部电影的总收入。

例如：

电影	演员	收入	*新专栏**
一种	尼克凯奇	7美元	5美元
乙	尼克凯奇	6美元	4美元
C	尼克凯奇	5美元	-
丁	尼克凯奇	4美元	-
乙	艾尔·帕西诺	3美元	1美元
F	艾尔·帕西诺	$2	-
G	艾尔·帕西诺	1美元	-

在 python 中对此进行编码的最有效方法是什么？

Answer 1

假设电影已排序，请使用groupby.shift

df['New Column'] = df.groupby('Actor')['Revenue'].shift(-2, fill_value='-')

Output：

  Movie      Actor Revenue New Column
0     A   Nic Cage      $7         $5
1     B   Nic Cage      $6         $4
2     C   Nic Cage      $5          -
3     D   Nic Cage      $4          -
4     E  Al Pacino      $3         $1
5     F  Al Pacino      $2          -
6     G  Al Pacino      $1          -

如何将新列添加到现有的 DataFrame 中？

问题描述

1 个解决方案

解决方案1
1 已采纳 2022-11-16 03:06:40

如何将新列添加到现有的 DataFrame 中？

问题描述

1 个解决方案

解决方案1 1 已采纳 2022-11-16 03:06:40

解决方案1
1 已采纳 2022-11-16 03:06:40