[英]Grouping pandas dataframe into groups based on a repeating sequence of values in one column
[英]summing dataframe values based on unique grouping of column in pandas
我想按name
分組后,從此pandas表中匯總值:
name id c
john a1 10
john a1 10
bob a2 20
mary a3 30
具體來說,我想對按name
分組的c
的值求和,但僅適用於id
唯一的實例。 df.groupby(["id"]).agg({"c": np.sum})
是不正確的,因為兩個a1
條目的c
值必須相加。 我只希望id
唯一值有助於c
值的總和。 你怎么用熊貓寫這個?
這應該工作。
df.drop_duplicates(['name', 'id'], keep='first', inplace=True)
df = df.groupby('name').sum().reset_index()
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.