[英]python pandas multi-indexed dataframe selection
尽管我在该主题上发现了多个问题,但我尤其找不到针对该问题的解决方案。
我正在处理这个CSV文件,该文件包含来自WHO的TBC dat的子选项: http : //dign.eu/temp/tbc.csv
import pandas as pd
df = pd.read_csv('tbc.csv', index_col=['country', 'year'])
这给出了格式良好的DataFrame,按国家和年份排序,显示了其中一个参数。
现在,对于这种情况,我想要所有可用年份中每个国家/地区的“参数”平均值。 使用df.mean()
得到一个总体值,而df.mean(axis=1)
可以删除所有索引,从而使结果无用。
显然,我可以使用循环来执行此操作,但是我想有一种更聪明的方法。 但是如何?
如果我对您的理解正确,那么您希望将级别传递给mean
函数:
In [182]:
df.mean(level='country')
Out[182]:
param
country
Afghanistan 8391.312500
Albania 183.888889
Algeria 8024.588235
American Samoa 1.500000
....
West Bank and Gaza Strip 12.538462
Yemen 4029.166667
Zambia 13759.266667
Zimbabwe 12889.666667
[219 rows x 1 columns]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.