[英]Consecutive values in pandas column
我有熊貓df['realize']
time realize
2016-01-18 08:25:00 -46.369083
2016-01-19 14:30:00 -819.010738
2016-01-20 11:10:00 -424.955847
2016-01-21 07:15:00 27.523859
2016-01-21 16:10:00 898.522762
2016-01-25 00:00:00 761.063545
time
在哪里:
df.index = df['time']
df.index = pd.to_datetime(df.index)
df['realize']
在哪里:
In: type(df['realize'])
Out: pandas.core.series.Series
我想計算連續的值,規則很簡單( df['realize'] > 0, df['realize'] < 0
)
預期輸出:
time realize Consecutive
2016-01-18 08:25:00 -46.369083 1
2016-01-19 14:30:00 -819.010738 2
2016-01-20 11:10:00 -424.955847 3
2016-01-21 07:15:00 27.523859 1
2016-01-21 16:10:00 898.522762 2
2016-01-25 00:00:00 761.063545 3
我閱讀了有關循環的主題,但沒有找到我所需要的。 在此先感謝您的幫助。
您可以執行以下操作:
g = df.realize.gt(0).astype(int).diff().fillna(0).abs().cumsum()
df['Consecutive'] = df.groupby(g).realize.cumcount().add(1)
time realize Consecutive
0 2016-01-18 08:25:00 -46.369083 1
1 2016-01-19 14:30:00 -819.010738 2
2 2016-01-20 11:10:00 -424.955847 3
3 2016-01-21 07:15:00 27.523859 1
4 2016-01-21 16:10:00 898.522762 2
5 2016-01-25 00:00:00 761.063545 3
其中通過使用布爾值的第一個差( DataFrame.diff
)來表示使用的石斑魚,該差表示realize
是否大於0
:
diff = df.realize.gt(0).astype(int).diff().fillna(0).abs()
df.assign(diff = diff, grouper = g)
time realize Consecutive diff grouper
0 2016-01-18 08:25:00 -46.369083 1 0.0 0.0
1 2016-01-19 14:30:00 -819.010738 2 0.0 0.0
2 2016-01-20 11:10:00 -424.955847 3 0.0 0.0
3 2016-01-21 07:15:00 27.523859 1 1.0 1.0
4 2016-01-21 16:10:00 898.522762 2 0.0 1.0
5 2016-01-25 00:00:00 761.063545 3 0.0 1.0
我的解決方案。
i=0;j=0
def cons(x):
global i;global j
if x>0:
i += 1;j=0
return i
else:
j += 1;i=0
return j
df['consecutive'] = df['realize'].map(lambda x: cons(x))
我希望該解決方案有幫助。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.