[英]How to add a new column into an existing DataFrame?
我正在嘗試將合成數據列添加到現有的電影數據集中。 這個新列是演員最近第二部電影的總收入。
例如:
電影 | 演員 | 收入 | 新專欄* |
---|---|---|---|
一種 | 尼克凱奇 | 7美元 | 5美元 |
乙 | 尼克凱奇 | 6美元 | 4美元 |
C | 尼克凱奇 | 5美元 | - |
丁 | 尼克凱奇 | 4美元 | - |
乙 | 艾爾·帕西諾 | 3美元 | 1美元 |
F | 艾爾·帕西諾 | $2 | - |
G | 艾爾·帕西諾 | 1美元 | - |
在 python 中對此進行編碼的最有效方法是什么?
假設電影已排序,請使用groupby.shift
df['New Column'] = df.groupby('Actor')['Revenue'].shift(-2, fill_value='-')
Output:
Movie Actor Revenue New Column
0 A Nic Cage $7 $5
1 B Nic Cage $6 $4
2 C Nic Cage $5 -
3 D Nic Cage $4 -
4 E Al Pacino $3 $1
5 F Al Pacino $2 -
6 G Al Pacino $1 -
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.