Pandas - 如何在不循環的情況下計算自時間序列中最后一次出現 True 以來的連續 Falses？

Question

對於給定的問題，是否有使用 Pandas 的 Pythonic 解決方案？

假設我屏蔽了名為 A 的系列

[False, True, False, False, False, True, False, False]

我想得到一個自上次出現 True 以來計算 False 值的系列。 對於上面的示例，這將輸出如下內容：

[NaN, 0, 1, 2, 3, 0, 1, 2]

作為獎勵也總結為：

[NaN, 3, 2]

僅包含 True 值之后所有連續出現的 False 值的最大長度。

非常感謝

德拉吉

Answer 1

嘗試這個

out = (~A).cumsum() - (~A).cumsum().where(A).ffill()

Out[1372]:
0    NaN
1    0.0
2    1.0
3    2.0
4    3.0
5    0.0
6    1.0
7    2.0
dtype: float64

如果你想獲得總和，從這個嘗試out上述

out_sum = out[A.shift(-1, fill_value=True) & out.ne(0)]

Out[1411]:
0    NaN
4    3.0
7    2.0
dtype: float64

Answer 2

如果您只想使用系列，您可以通過這種方式調整@kiki 的答案：

s = pd.Series([False, True, False, False, False, True, False, False])
(s.groupby(s.cumsum()).count()-1).replace(0,np.nan).tolist()

無論如何，我認為如果您想了解幕后發生的事情，@kiki 的答案會更透明一些

輸出：

[nan, 3.0, 2.0]

此外，對於完整的系列，它只是：

(s.groupby(s.cumsum()).cumcount())

輸出 2：

請告訴我在第一行中是否有一個零而不是nan是一個問題。

Answer 3

我認為 cumsum 函數可以幫助您在每個 True 幻影中創建一種 id。 然后你就可以分組並做你需要的

res = pd.DataFrame([False, True, False, False, False, True, False, False],columns=['val'])
res['cumsum'] = res.val.cumsum()
res.groupby("cumsum").count() - 1

輸出：

Answer 4

改編自@Andy L 對數據框的回答：

df = pd.DataFrame({'values':[False, True, False, False, False, True, False, False]})

df['cumsum'] = (~df['values']).cumsum() - (~df['values']).cumsum().where(df['values']).ffill()
grouped = pd.concat([df.loc[df[df['values']==True].index-1,:],df.tail(1)])

輸出：

    values  cumsum
0    False     NaN
1     True     0.0
2    False     1.0
3    False     2.0
4    False     3.0
5     True     0.0
6    False     1.0
7    False     2.0

分組輸出：

    values  cumsum
0    False     NaN
4    False     3.0
7    False     2.0

Pandas - 如何在不循環的情況下計算自時間序列中最后一次出現 True 以來的連續 Falses？

問題描述

4 個解決方案

解決方案1
3 2020-03-03 17:52:40

解決方案2
3 2020-03-03 17:58:47

輸出：

輸出 2：

解決方案3
1 2020-03-03 17:54:40

解決方案4
1 2020-03-03 18:17:54

Pandas - 如何在不循環的情況下計算自時間序列中最后一次出現 True 以來的連續 Falses？

問題描述

4 個解決方案

解決方案1 3 2020-03-03 17:52:40

解決方案2 3 2020-03-03 17:58:47

輸出：

輸出 2：

解決方案3 1 2020-03-03 17:54:40

解決方案4 1 2020-03-03 18:17:54

解決方案1
3 2020-03-03 17:52:40

解決方案2
3 2020-03-03 17:58:47

解決方案3
1 2020-03-03 17:54:40

解決方案4
1 2020-03-03 18:17:54