獲取每組熊貓數據框的平均值

Question

我成功地抓取了futbin.com，以獲取FIFA 19球員的時間序列價格數據。 我現在擁有超過200'000行的球員和價格數據。 對於每個玩家，我大約有17種不同的價格（帶有相應的時間戳）

我現在想制作一個新數據幀，每個玩家只有一行，價格應該是該特定玩家隨時間推移的平均價格。 每個玩家都有一個唯一的“ Futbin_ID”號碼。 直到現在我還無法弄清楚該怎么做...如果有人可以幫助我，我將不勝感激。

Answer 1

您可能希望按Fubin_ID對其進行分組，然后找到每個分組的平均值：

avg_price = df_ts.groupby('Futbin_ID')['price'].agg(np.mean)

如果您還希望將數據框與其他列一起使用，則可以將除第一列之外的重復項放在原始數據中，然后將價格值替換為平均值：

df_ts.drop_duplicates(subset="Futbin_ID", keep="first", inplace= True)
df_ts.join[avg_price.set_index("Fubin_ID"), on="Futbin_ID"]

您可以在此處閱讀有關groupby的更多信息： https ://www.tutorialspoint.com/python_pandas/python_pandas_groupby.htm