![](/img/trans.png)
[英]How do I group my pandas columns to map and create a new column based on map values
[英]How do I group by a column, and count values in separate columns (Pandas)
這是一個示例數據:
data = [['a1', 1, 'a'], ['b1', 2, 'b'], ['a1', 3, 'a'], ['c1', 4, 'c'], ['b1', 5, 'a'], ['a1', 6, 'b'], ['c1', 7, 'a'], ['a1', 8, 'a']]
df = pd.DataFrame(data, columns = ['user', 'house', 'type'])
user house type
a1 1 a
b1 2 b
a1 3 a
c1 4 c
b1 5 a
a1 6 b
c1 7 a
a1 8 a
我想要的最終 output 是這樣的(類型需要是自己的列):
user houses a b c
a1 4 3 1 0
b1 2 1 1 0
c1 2 1 0 1
目前,我可以使用以下代碼獲取它:
house = df.groupby(['user']).agg(houses=('house', 'count'))
a = df[df['type']=='a'].groupby(['user']).agg(a=('type', 'count'))
b = df[df['type']=='b'].groupby(['user']).agg(b=('type', 'count'))
c = df[df['type']=='c'].groupby(['user']).agg(c=('type', 'count'))
final = house.merge(a,on='user', how='left').merge(b,on='user', how='left').merge(c,on='user', how='left')
有沒有更簡單、更清潔的方法來做到這一點?
這是將get_dummies()
與groupby()
和sum
一起使用的一種方法。
df['house']=1
df.drop('type',axis=1).assign(**pd.get_dummies(df['type'])).groupby('user').sum()
house a b c
user
a1 4 3 1 0
b1 2 1 1 0
c1 2 1 0 1
我會用margins=True
做crosstab
pd.crosstab(df.user,df.type,margins=True,margins_name='House').drop('House')
Out[51]:
type a b c House
user
a1 3 1 0 4
b1 1 1 0 2
c1 1 0 1 2
使用GroupBy.size
和pd.crosstab
並join
:
grps = pd.crosstab(df['user'], df['type']).join(df.groupby('user')['house'].size())
a b c house
user
a1 3 1 0 4
b1 1 1 0 2
c1 1 0 1 2
如果您希望user
作為列返回,請使用reset_index
:
print(grps.reset_index())
user a b c house
0 a1 3 1 0 4
1 b1 1 1 0 2
2 c1 1 0 1 2
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.