熊貓列中的連續值

Question

我有熊貓df['realize']

time                      realize
2016-01-18 08:25:00     -46.369083
2016-01-19 14:30:00     -819.010738
2016-01-20 11:10:00    -424.955847
2016-01-21 07:15:00     27.523859
2016-01-21 16:10:00     898.522762
2016-01-25 00:00:00    761.063545

time在哪里：

df.index = df['time']
df.index = pd.to_datetime(df.index)

df['realize']在哪里：

In: type(df['realize'])
Out: pandas.core.series.Series

我想計算連續的值，規則很簡單（ df['realize'] > 0, df['realize'] < 0 ）

預期輸出：

time                      realize    Consecutive
2016-01-18 08:25:00     -46.369083    1
2016-01-19 14:30:00     -819.010738   2
2016-01-20 11:10:00    -424.955847    3
2016-01-21 07:15:00     27.523859     1
2016-01-21 16:10:00     898.522762    2
2016-01-25 00:00:00    761.063545     3

我閱讀了有關循環的主題，但沒有找到我所需要的。 在此先感謝您的幫助。

Answer 1

您可以執行以下操作：

g = df.realize.gt(0).astype(int).diff().fillna(0).abs().cumsum()
df['Consecutive'] = df.groupby(g).realize.cumcount().add(1)

               time     realize       Consecutive
0 2016-01-18 08:25:00  -46.369083            1
1 2016-01-19 14:30:00 -819.010738            2
2 2016-01-20 11:10:00 -424.955847            3
3 2016-01-21 07:15:00   27.523859            1
4 2016-01-21 16:10:00  898.522762            2
5 2016-01-25 00:00:00  761.063545            3

其中通過使用布爾值的第一個差（ DataFrame.diff ）來表示使用的石斑魚，該差表示realize是否大於0 ：

diff = df.realize.gt(0).astype(int).diff().fillna(0).abs()
df.assign(diff = diff, grouper = g)

         time            realize     Consecutive diff  grouper
0 2016-01-18 08:25:00  -46.369083            1   0.0      0.0
1 2016-01-19 14:30:00 -819.010738            2   0.0      0.0
2 2016-01-20 11:10:00 -424.955847            3   0.0      0.0
3 2016-01-21 07:15:00   27.523859            1   1.0      1.0
4 2016-01-21 16:10:00  898.522762            2   0.0      1.0
5 2016-01-25 00:00:00  761.063545            3   0.0      1.0

Answer 2

我的解決方案。

i=0;j=0
def cons(x):
    global i;global j
    if x>0:
        i += 1;j=0
        return i
    else:
        j += 1;i=0
        return j


df['consecutive'] = df['realize'].map(lambda x: cons(x))

我希望該解決方案有幫助。

熊貓列中的連續值

問題描述

2 個解決方案

解決方案1
4 已采納 2019-03-05 17:26:04

解決方案2
0 2019-03-05 18:13:54

熊貓列中的連續值

問題描述

2 個解決方案

解決方案1 4 已采納 2019-03-05 17:26:04

解決方案2 0 2019-03-05 18:13:54

解決方案1
4 已采納 2019-03-05 17:26:04

解決方案2
0 2019-03-05 18:13:54