簡體   English   中英

獲取每組熊貓數據框的平均值

[英]Getting the Average Value for each Group of a pandas Dataframe

我成功地抓取了futbin.com,以獲取FIFA 19球員的時間序列價格數據。 我現在擁有超過200'000行的球員和價格數據。 對於每個玩家,我大約有17種不同的價格(帶有相應的時間戳) 。

我現在想制作一個新數據幀,每個玩家只有一行,價格應該是該特定玩家隨時間推移的平均價格。 每個玩家都有一個唯一的“ Futbin_ID”號碼。 直到現在我還無法弄清楚該怎么做...如果有人可以幫助我,我將不勝感激。

您可能希望按Fubin_ID對其進行分組,然后找到每個分組的平均值:

avg_price = df_ts.groupby('Futbin_ID')['price'].agg(np.mean)

如果您還希望將數據框與其他列一起使用,則可以將除第一列之外的重復項放在原始數據中,然后將價格值替換為平均值:

df_ts.drop_duplicates(subset="Futbin_ID", keep="first", inplace= True)
df_ts.join[avg_price.set_index("Fubin_ID"), on="Futbin_ID"]

您可以在此處閱讀有關groupby的更多信息: https ://www.tutorialspoint.com/python_pandas/python_pandas_groupby.htm

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM