使用Pandas / Python在2列上合并数据帧和系列

Question

我正在使用Python / Pandas并在下面有数据框（1）。 我按ID对其进行了分组，然后根据每个ID对每组修订中的修订号进行了最大化，以生成下面的系列（2）。

我现在想要将（1）合并到（2）中，以便将（1）的前2列与（2）的相应列匹配，适当地拉入（2）中的另一列[实际上]数据集（1），'id'，'revision'和'color'不一定是连续的列，还有其他列]。

我基本上将（2）作为关键并从（1）中提取适当的数据。

我如何使用熊猫这样做？

提前致谢。

最大。

（1）数据帧

ID         Revision Colour
14446   0   red
14446   0   red
14446   0   red
14466   1   red
14466   1   red
14466   0   red
14466   1   red
14466   1   red
14466   0   red
14466   2   red
14466   0   red
14466   1   red
14466   0   red
14471   0   green
14471   0   green
14471   0   green
14471   0   green
14473   0   blue
14473   1   blue
14473   0   blue

（2）系列

ID                   Revision
13125                 1
13213                 0
13266                 0
13276                 0
13277                 1
13278                 0
13280                 2
13285                 0
13287                 1
13288                 0
13291                 1
13292                 1

Answer 1

按修订排序，然后按ID分组，并从每个组中取出最后一个元素。

In [2]: df.sort('Revision').groupby(level=0).last()
Out[2]: 
       Revision Colour
ID                    
14446         0    red
14466         2    red
14471         0  green
14473         1   blue

我假设ID是一个索引。 如果它是一列，则使用groupby('ID') 。

使用Pandas / Python在2列上合并数据帧和系列

问题描述

1 个解决方案

解决方案1
2 已采纳 2013-08-12 19:27:24

使用Pandas / Python在2列上合并数据帧和系列

问题描述

1 个解决方案

解决方案1 2 已采纳 2013-08-12 19:27:24

解决方案1
2 已采纳 2013-08-12 19:27:24