熊貓櫃台專欄

Question

我有一個看起來像這樣的熊貓數據框：

Site           City         ...       Year_Built      Heritage_Site
a              Paris        ...       1887            Yes
b              London       ...       1858            No
c              Paris        ...       1202            Yes
d              New York     ...       1930            Yes

然后，我使用以下語句來計算每個城市的某些變量的均值

df_mean = df.groupby('City').mean()

但是，我還要在第二個數據幀的末尾添加一列，該列基本上計算每個城市的“是”（在Heritage_Count列中）的出現次數。 如下所示：

City           ...          Heritage_Count
Paris          ...          4
London         ...          2
New York       ...          0

最有效的方法是什么？

Answer 1

聯合會

df.groupby('City').agg({'Year_Built':'mean','Heritage_Site':lambda x : sum(x=='Yes')})
Out[489]: 
         Year_Built  Heritage_Site
City                              
London       1858.0              0
NewYork      1930.0              1
Paris        1544.5              2

熊貓櫃台專欄

問題描述

1 個解決方案

解決方案1
2 已采納 2018-01-16 00:06:20

熊貓櫃台專欄

問題描述

1 個解決方案

解決方案1 2 已采納 2018-01-16 00:06:20

解決方案1
2 已采納 2018-01-16 00:06:20