繁体   English   中英

Python Pandas多索引数据框选择

[英]python pandas multi-indexed dataframe selection

尽管我在该主题上发现了多个问题,但我尤其找不到针对该问题的解决方案。

我正在处理这个C​​SV文件,该文件包含来自WHO的TBC dat的子选项: http : //dign.eu/temp/tbc.csv

import pandas as pd
df = pd.read_csv('tbc.csv', index_col=['country', 'year'])

这给出了格式良好的DataFrame,按国家和年份排序,显示了其中一个参数。

现在,对于这种情况,我想要所有可用年份中每个国家/地区的“参数”平均值。 使用df.mean()得到一个总体值,而df.mean(axis=1)可以删除所有索引,从而使结果无用。

显然,我可以使用循环来执行此操作,但是我想有一种更聪明的方法。 但是如何?

如果我对您的理解正确,那么您希望将级别传递给mean函数:

In [182]:

df.mean(level='country')
Out[182]:
                                                             param
country                                                           
Afghanistan                                           8391.312500 
Albania                                               183.888889  
Algeria                                               8024.588235 
American Samoa                                        1.500000    
....
West Bank and Gaza Strip                              12.538462   
Yemen                                                 4029.166667 
Zambia                                                13759.266667
Zimbabwe                                              12889.666667

[219 rows x 1 columns]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM