Python Pandas多索引数据框选择

Question

尽管我在该主题上发现了多个问题，但我尤其找不到针对该问题的解决方案。

我正在处理这个CSV文件，该文件包含来自WHO的TBC dat的子选项： http : //dign.eu/temp/tbc.csv

import pandas as pd
df = pd.read_csv('tbc.csv', index_col=['country', 'year'])

这给出了格式良好的DataFrame，按国家和年份排序，显示了其中一个参数。

现在，对于这种情况，我想要所有可用年份中每个国家/地区的“参数”平均值。 使用df.mean()得到一个总体值，而df.mean(axis=1)可以删除所有索引，从而使结果无用。

显然，我可以使用循环来执行此操作，但是我想有一种更聪明的方法。 但是如何？

Answer 1

如果我对您的理解正确，那么您希望将级别传递给mean函数：

In [182]:

df.mean(level='country')
Out[182]:
                                                             param
country                                                           
Afghanistan                                           8391.312500 
Albania                                               183.888889  
Algeria                                               8024.588235 
American Samoa                                        1.500000    
....
West Bank and Gaza Strip                              12.538462   
Yemen                                                 4029.166667 
Zambia                                                13759.266667
Zimbabwe                                              12889.666667

[219 rows x 1 columns]

Python Pandas多索引数据框选择

问题描述

1 个解决方案

解决方案1
1 已采纳 2014-10-09 12:58:28

Python Pandas多索引数据框选择

问题描述

1 个解决方案

解决方案1 1 已采纳 2014-10-09 12:58:28

解决方案1
1 已采纳 2014-10-09 12:58:28