将pandas数据框附加到列

Question

我被困住了，需要一些帮助。 我有以下数据帧：

+-----+---+---+--+--+
|     | A | B |  |  |
+-----+---+---+--+--+
| 288 | 1 | 4 |  |  |
+-----+---+---+--+--+
| 245 | 2 | 3 |  |  |
+-----+---+---+--+--+
| 543 | 3 | 6 |  |  |
+-----+---+---+--+--+
| 867 | 1 | 9 |  |  |
+-----+---+---+--+--+
| 345 | 2 | 7 |  |  |
+-----+---+---+--+--+
| 122 | 3 | 8 |  |  |
+-----+---+---+--+--+
| 233 | 1 | 1 |  |  |
+-----+---+---+--+--+
| 346 | 2 | 6 |  |  |
+-----+---+---+--+--+
| 765 | 3 | 3 |  |  |
+-----+---+---+--+--+

列A具有重复值，如图所示。 我想要做的是每当我看到列AI中的重复值想要附加一个新列时，列B中的相应值作为列C，如下所示：

+-----+---+---+-----+
|     | A | B | C   |
+-----+---+---+-----+
| 288 | 1 | 4 | 9   |
+-----+---+---+-----+
| 245 | 2 | 3 | 7   |
+-----+---+---+-----+
| 543 | 3 | 6 | 8   |
+-----+---+---+-----+
| 867 | 1 | 9 | 1   |
+-----+---+---+-----+
| 345 | 2 | 7 | 6   |
+-----+---+---+-----+
| 122 | 3 | 8 | 3   |
+-----+---+---+-----+
| 233 | 1 | 1 | NaN |
+-----+---+---+-----+
| 346 | 2 | 6 | NaN |
+-----+---+---+-----+
| 765 | 3 | 3 | NaN |
+-----+---+---+-----+

谢谢。

Answer 1

假设val是重复值之一，

slice = df.loc[df.A == val, 'B'].shift(-1)

将创建一个单列数据框，并将值重新编入其新位置。

由于重新分配的索引值都不应该是冗余的，因此您可以使用pandas.concat将不同的切片拼接在一起，而不必担心会丢失数据。 然后将它们作为新列附加：

df['C'] = pd.concat([df.loc[df['A'] == x, 'B'].shift(-1) for x in [1, 2, 3]])

分配列后，索引值将使所有内容对齐：

A  B    C
0  1  4  9.0
1  2  3  7.0
2  3  6  8.0
3  1  9  1.0
4  2  7  6.0
5  3  8  3.0
6  1  1  NaN
7  2  6  NaN
8  3  3  NaN

Answer 2

反转数据帧顺序，groupby将其转换为shift函数，然后将其反转：

df = df[::-1]
df['C'] = df.groupby(df.columns[0]).transform('shift')
df = df[::-1]
df

    A    B     C
0    1    4  9.0
1    2    3  7.0
2    3    6  8.0
3    1    9  1.0
4    2    7  6.0
5    3    8  3.0
6    1    1  NaN
7    2    6  NaN
8    3    3  NaN

将pandas数据框附加到列

问题描述

2 个解决方案

解决方案1
0 2017-03-03 21:01:06

解决方案2
0 2017-03-03 22:33:14

将pandas数据框附加到列

问题描述

2 个解决方案

解决方案1 0 2017-03-03 21:01:06

解决方案2 0 2017-03-03 22:33:14

解决方案1
0 2017-03-03 21:01:06

解决方案2
0 2017-03-03 22:33:14