[英]Slice MultiIndex pandas DataFrame by position
我目前正在尝试切片MuliIndex DataFrame,它有三个级别的位置。 我正在使用熊猫19.1
Level0 Level1 Level2 Value
03-00368 A Item111 6.9
03-00368 A Item333 19.2
03-00368 B Item111 9.7
03-00368 B Item222 17.4
04-00176 C Item110 17.4
04-00176 C Item111 9.7
04-00246 D Item46 12.5
04-00246 D Item66 5.6
04-00246 D Item99 11.2
04-00247 E Item23 12.5
04-00247 E Item24 5.6
04-00247 E Item111 11.2
04-00247 F Item23 7.9
04-00247 F Item24 9.7
04-00247 F Item111 12.5
04-00247 G Item46 11.2
04-00247 G Item66 9.7
04-00247 G Item999 9.7
04-00247 H Item23 11.2
04-00247 H Item94 7.9
04-00247 H Item111 11.2
04-00247 I Item46 5.6
04-00247 I Item66 12.5
04-00247 I Item888 11.2
04-00353 J Item66 12.5
04-00353 J Item99 12.5
04-00354 K Item43 12.5
04-00354 K Item94 12.5
04-00355 L Item54 50
04-00355 L Item99 50
目前我可以实现:
df.loc[(slice('03-00368', '04-00361'), slice(None), slice(None)), :]
但实际上我不知道标签是什么。 我只想选择前十级0,所以我尝试了这个(还有很多类似的东西):
>>> df.iloc[(slice(0, 10), slice(None), slice(None)), :]
TypeError: unorderable types: int() >= NoneType()
最终目标是限制显示的最终行数, 而不会破坏Level0索引
>>>df.iloc[(0,1,), :]
Level0 Level1 Level2 Value
03-00368 A Item111 6.9
03-00368 A Item333 19.2
请注意,它只返回前两行,我希望结果如下:
Level0 Level1 Level2 Value
03-00368 A Item111 6.9
03-00368 A Item333 19.2
03-00368 B Item111 9.7
03-00368 B Item222 17.4
04-00176 C Item110 17.4
04-00176 C Item111 9.7
有一些hacky方法来完成这个,但我发布是因为我想知道我做错了什么,或者为什么我不能指望能够以这种方式切片MultiIndexes。
方法1
groupby
+ head
df.groupby(level=0).head(10)
方法2
不必要的冗长
IndexSlice
df.sort_index().loc[pd.IndexSlice[df.index.levels[0][:10], :, :], :]
方法3
loc
df.loc[df.index.levels[0][:10].tolist()]
你可以组合级别并以这种方式取得前两名
df.groupby(level=0).head(2)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.