[英]pandas, how to access multiIndex dataframe?
显示我的代码
>>> df = pd.DataFrame({'key1': ['a', 'a', 'b', 'b', 'a'], \
'key2': ['one', 'two', 'one', 'two', 'one'], \
'data1': np.random.randn(5), \
'data2': np.random.randn(5)})
>>> new_df = df.groupby(['key1', 'key2']).mean().unstack()
>>> print new_df
data1 data2
key2 one two one two
key1
a -0.070742 -0.598649 -0.349283 -1.272043
b -0.109347 -0.097627 -0.641455 1.135560
>>> print new_df.columns
MultiIndex(levels=[[u'data1', u'data2'], [u'one', u'two']],
labels=[[0, 0, 1, 1], [0, 1, 0, 1]],
names=[None, u'key2'])
如您所见, MultiIndex数据帧与普通数据帧不同,那么如何访问MultiIndex数据帧中的数据。
访问多索引数据框中的数据与通用数据框中的方式类似。 例如,如果你想读取(a,data1.two)的数据,你可以简单地做: new_df['data1']['two']['a']
或new_df.loc['a', ('data1', 'two')]
请阅读官方文档了解更多详情。
这可能会帮助您了解和形象化
unstacked = multi_indexDataFrame.unstack().dropna()
unstacked.plot(kind="bar")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.