Pandas迭代索引并附加剩余的行

Question

我有以下框架：

df = pd.DataFrame(data={'id':[1,2,3],'x':[3,2,1]}).set_index('id')
print df
    x
id   
1   3
2   2
3   1

我需要迭代行，这样对于每个id，我们追加剩余的行，例如输出应该是：

理想情况下， O（n）解决方案推广到m列。

Answer 1

使用列表理解与切片的位置与iloc list of DataFrame然后concat连接在一起，最后删除第二级MultiIndex ：

comp = [df.iloc[i:] for i in range(len(df.index))]
df = pd.concat(comp, keys=df.index).reset_index(level=1, drop=True)

print (df)
    x
id   
1   3
1   2
1   1
2   2
2   1
3   1

如果需要两个level rename_axis以为set MultiIndex name添加rename_axis ：

df = pd.concat(comp, keys=df.index).rename_axis(('a','b'))
print (df)
     x
a b   
1 1  3
  2  2
  3  1
2 2  2
  3  1
3 3  1

编辑：

第一级不显示重复值，但不会丢失任何值：

#change default option multi_sparse=True
with pd.option_context('display.multi_sparse', False):
    print (df)

     x
a b   
1 1  3
1 2  2
1 3  1
2 2  2
2 3  1
3 3  1

Answer 2

就像是

df.groupby(level=0).x.apply(lambda y : (np.arange(y)+1)[::-1]).apply(pd.Series).stack()
Out[320]: 
id   
1   0    3.0
    1    2.0
    2    1.0
2   0    2.0
    1    1.0
3   0    1.0
dtype: float64

Pandas迭代索引并附加剩余的行

问题描述

2 个解决方案

解决方案1
2 已采纳 2018-03-13 13:13:17

解决方案2
1 2018-03-13 12:46:30

Pandas迭代索引并附加剩余的行

问题描述

2 个解决方案

解决方案1 2 已采纳 2018-03-13 13:13:17

解决方案2 1 2018-03-13 12:46:30

解决方案1
2 已采纳 2018-03-13 13:13:17

解决方案2
1 2018-03-13 12:46:30