簡體   English   中英

熊貓櫃台專欄

[英]Pandas counter column

我有一個看起來像這樣的熊貓數據框:

Site           City         ...       Year_Built      Heritage_Site
a              Paris        ...       1887            Yes
b              London       ...       1858            No
c              Paris        ...       1202            Yes
d              New York     ...       1930            Yes 

然后,我使用以下語句來計算每個城市的某些變量的均值

df_mean = df.groupby('City').mean()

但是,我還要在第二個數據幀的末尾添加一列,該列基本上計算每個城市的“是”(在Heritage_Count列中)的出現次數。 如下所示:

City           ...          Heritage_Count
Paris          ...          4
London         ...          2
New York       ...          0

最有效的方法是什么?

聯合會

df.groupby('City').agg({'Year_Built':'mean','Heritage_Site':lambda x : sum(x=='Yes')})
Out[489]: 
         Year_Built  Heritage_Site
City                              
London       1858.0              0
NewYork      1930.0              1
Paris        1544.5              2

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM