[英]Reshaping a column based on another column in a pandas dataframe
Date Sin Ret
01/01/1990 True 0.03
01/02/1990 True 0.02
01/01/1990 False 0.01
01/02/1990 False 0.05
我想要
Date Ret1 Ret2
01/01/1990 0.03 0.01
01/02/1990 0.02 0.05
这样我就可以
Date Ret1-Ret2
01/01/1990 0.02
01/02/1990 -0.03
做这个的最好方式是什么? 我当时正在考虑将日期和罪过设置为索引,然后将罪恶叠加。 有更容易的方法吗?
这是df.set_index
和df.unstack
的解决方案:
In [516]: df.set_index(['Date', 'Sin']).unstack(0).diff().iloc[-1]
Out[516]:
Date
Ret 01/01/1990 0.02
01/02/1990 -0.03
Name: True, dtype: float64
我认为设置索引和堆栈是一个好主意,但是这是使用透视的替代方法:
(df.pivot(index='Date', columns='Sin', values='Ret')
.rename(columns={True: 'Ret1', False: 'Ret2'}))
Sin Ret1 Ret2
Date
01/01/1990 0.03 0.01
01/02/1990 0.02 0.05
我的解决方案仅针对最终输出。
df.Sin=df.Sin.astype(int).replace({0:-1})
df.Ret=df.Sin.mul(df.Ret)
df.groupby('Date')['Ret'].agg({'Ret1-Ret2':'sum'})
Ret1-Ret2
Date
01/01/1990 0.02
01/02/1990 -0.03
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.