如果相同的连续值，则 Groupby 剩余时间显示 True

Question

Given the following DataFrame.给定以下 DataFrame。 How do I add a new column showing True for the rest of the day when two consecutive "y" are seen in a single day in the val column (else False ).如何在val列中在一天内看到两个连续的"y"时为当天的 rest添加一个显示True的新列（否则为False ）。

Each day resets the logic.每天都会重置逻辑。

This is close but the True should be for each row in this day after condition is seen. 这很接近，但在看到条件后的这一天，每一行都应该是True 。

Code代码

df_so = pd.DataFrame(
    {
        "val": list("yynnnyyynn")
    },
    index=pd.date_range(start="1/1/2018", periods=10, freq="6h"),
)

                   val
2018-01-01 00:00:00 y
2018-01-01 06:00:00 y
2018-01-01 12:00:00 n
2018-01-01 18:00:00 n
2018-01-02 00:00:00 n
2018-01-02 06:00:00 y
2018-01-02 12:00:00 y
2018-01-02 18:00:00 y
2018-01-03 00:00:00 n
2018-01-03 06:00:00 n

Desired output所需 output

                    val  out
2018-01-01 00:00:00  y   False
2018-01-01 06:00:00  y   False
2018-01-01 12:00:00  n   True
2018-01-01 18:00:00  n   True
2018-01-02 00:00:00  n   False
2018-01-02 06:00:00  y   False
2018-01-02 12:00:00  y   False
2018-01-02 18:00:00  y   True
2018-01-03 00:00:00  n   False
2018-01-03 06:00:00  n   False

Answer 1

You can use cummax to check if the condition holds at some point in the past:您可以使用cummax来检查条件是否在过去的某个时间点成立：

target = 2
df_so['out'] = (df_so['val'].eq('y')
                    .groupby(df_so.index.normalize())
                    .transform(lambda x: x.rolling(target).sum().shift().eq(target).cummax())
               )

Output: Output：

                    val    out
2018-01-01 00:00:00   y  False
2018-01-01 06:00:00   y  False
2018-01-01 12:00:00   n   True
2018-01-01 18:00:00   n   True
2018-01-02 00:00:00   n  False
2018-01-02 06:00:00   y  False
2018-01-02 12:00:00   y  False
2018-01-02 18:00:00   y   True
2018-01-03 00:00:00   n  False
2018-01-03 06:00:00   n  False

如果相同的连续值，则 Groupby 剩余时间显示 True

问题描述

1 个解决方案

解决方案1
3 已采纳 2022-09-13 17:51:26

如果相同的连续值，则 Groupby 剩余时间显示 True

问题描述

1 个解决方案

解决方案1 3 已采纳 2022-09-13 17:51:26

解决方案1
3 已采纳 2022-09-13 17:51:26