[英]Calculate the mean value using two columns in pandas
我有一个包含三列的交易数据框,我按类型和日期排序,它看起来像:
type date price
A 2020-05-01 4
A 2020-06-04 6
A 2020-06-08 8
A 2020-07-03 5
B 2020-02-01 3
B 2020-04-02 4
有很多种(A,B,C,D,E...),我想计算同类型产品的前平均价格。 例如:第三行 A 的 pre_mean_price 值为 (4+6)/2=5。 我想得到这样的数据框:
type date price pre_mean_price
A 2020-05-01 4 .
A 2020-06-04 6 4
A 2020-06-08 8 5
A 2020-07-03 5 6
B 2020-02-01 3 .
B 2020-04-02 4 3
如何计算 pre_mean_price? 非常感谢!
您可以在 groupby 之后为每个 group 使用expanding().mean()
.mean expanding().mean()
,然后移动值。
df['pre_mean_price'] = df.groupby("type")['price'].apply(lambda x:
x.expanding().mean().shift())
print(df)
type date price pre_mean_price
0 A 2020-05-01 4 NaN
1 A 2020-06-04 6 4.0
2 A 2020-06-08 8 5.0
3 A 2020-07-03 5 6.0
4 B 2020-02-01 3 NaN
5 B 2020-04-02 4 3.0
就像是
df['pre_mean_price'] = df.groupby('type').expanding().mean().groupby('type').shift(1)['price'].values
产生
type date price pre_mean_price
0 A 2020-05-01 4 NaN
1 A 2020-06-04 6 4.0
2 A 2020-06-08 8 5.0
3 A 2020-07-03 5 6.0
4 B 2020-02-01 3 NaN
5 B 2020-04-02 4 3.0
这个想法是
.groupby()
"type"
。 这必须完成,因为我们要计算“类型”组内的(增量)均值。expanding().mean()
计算增量平均值。 这一点的输出是 price
type
A 0 4.00
1 5.00
2 6.00
3 5.75
B 4 3.00
5 3.50
"type"
分组,并使用shift(1)
将组内的元素shift(1)
一行。price
列的值(增量方式)df.sort_values('date', inplace=True)
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.