[英]How to add a new column into an existing DataFrame?
我正在尝试将合成数据列添加到现有的电影数据集中。 这个新列是演员最近第二部电影的总收入。
例如:
电影 | 演员 | 收入 | 新专栏* |
---|---|---|---|
一种 | 尼克凯奇 | 7美元 | 5美元 |
乙 | 尼克凯奇 | 6美元 | 4美元 |
C | 尼克凯奇 | 5美元 | - |
丁 | 尼克凯奇 | 4美元 | - |
乙 | 艾尔·帕西诺 | 3美元 | 1美元 |
F | 艾尔·帕西诺 | $2 | - |
G | 艾尔·帕西诺 | 1美元 | - |
在 python 中对此进行编码的最有效方法是什么?
假设电影已排序,请使用groupby.shift
df['New Column'] = df.groupby('Actor')['Revenue'].shift(-2, fill_value='-')
Output:
Movie Actor Revenue New Column
0 A Nic Cage $7 $5
1 B Nic Cage $6 $4
2 C Nic Cage $5 -
3 D Nic Cage $4 -
4 E Al Pacino $3 $1
5 F Al Pacino $2 -
6 G Al Pacino $1 -
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.