使用来自不同行的值在 DataFrame 中创建新列

Question

我正在尝试在 pandas dataframe 中创建一个新列，这是明年相同 ID 的分数。 请参阅下面的示例原始数据：

Year  ID    Score
2018  785   8.4 
2018  770   -1.2
2017  733   3.2
2017  785   7.9
2018  733   3.9

如果没有下一年的数据，则应填写 NA。 所以我正在寻找的 output 将是：

Year  ID    Score col
2018  785   8.4   NA
2018  770   -1.2  NA
2017  733   3.2   3.9
2017  785   7.9   8.4
2018  733   3.9   NA

数据当前未排序。

Answer 1

如果您的数据对于所有 ID 都有连续年份（没有2016 2018的 ID），那么您可以执行以下操作：

 df['col'] = df.sort_values('Year').groupby('ID').Score.shift(-1)

Output：

   Year   ID  Score  col
0  2018  785    8.4  NaN
1  2018  770   -1.2  NaN
2  2017  733    3.2  3.9
3  2017  785    7.9  8.4
4  2018  733    3.9  NaN

如果不能保证年份是连续的，则进行合并：

df.merge(df.assign(Year=lambda x: x.Year - 1),
         on=['Year', 'ID'],
         suffixes = ['','_new'],
         how='left')

Output：

   Year   ID  Score  Score_new
0  2018  785    8.4        NaN
1  2018  770   -1.2        NaN
2  2017  733    3.2        3.9
3  2017  785    7.9        8.4
4  2018  733    3.9        NaN

使用来自不同行的值在 DataFrame 中创建新列

问题描述

1 个解决方案

解决方案1
3 已采纳 2019-10-17 20:41:40

使用来自不同行的值在 DataFrame 中创建新列

问题描述

1 个解决方案

解决方案1 3 已采纳 2019-10-17 20:41:40

解决方案1
3 已采纳 2019-10-17 20:41:40