如果連續值相同，則分組顯示 True

Question

給定以下 DataFrame。 當在val列中的一天內看到兩個連續的"y"時，如何在下一行添加一個顯示True的新列（否則為False ）。

每天都會重置邏輯。
本質上是在一天內尋找兩個連續的“y”，然后如果下一行是同一天，則添加一個True 。

數據

df_so = pd.DataFrame(
    {"val": ["y", "y", "y", "n", "y", "y", "y", "y", "n", "n", "y", "y", "n"]},
    index=pd.date_range(start="1/1/2018", periods=13, freq="8h"),
)

df_so

                   val
2018-01-01 00:00:00  y
2018-01-01 08:00:00  y
2018-01-01 16:00:00  y
2018-01-02 00:00:00  n
2018-01-02 08:00:00  y
2018-01-02 16:00:00  y
2018-01-03 00:00:00  y
2018-01-03 08:00:00  y
2018-01-03 16:00:00  n
2018-01-04 00:00:00  n
2018-01-04 08:00:00  y
2018-01-04 16:00:00  y
2018-01-05 00:00:00  n

所需的 output看起來像這樣：

                   val  desired_col
2018-01-01 00:00:00 y   False
2018-01-01 08:00:00 y   False
2018-01-01 16:00:00 y   True
2018-01-02 00:00:00 n   False
2018-01-02 08:00:00 y   False
2018-01-02 16:00:00 y   False
2018-01-03 00:00:00 y   False
2018-01-03 08:00:00 y   False
2018-01-03 16:00:00 n   True
2018-01-04 00:00:00 n   False
2018-01-04 08:00:00 y   False
2018-01-04 16:00:00 y   False
2018-01-05 00:00:00 n   False

Answer 1

您可以在這里使用groupby().rolling() ：

target = 2
days = df_so.index.normalize()
df_so['out'] = (df_so['val'].eq('y')
               .groupby(days)
               .rolling(target, min_periods=0).sum()
               .reset_index(level=0,drop=True)
               .groupby(days).shift().eq(target)
          )

或使用groupby().transform ：

target = 2
df_so['out'] = (df_so['val'].eq('y')
                    .groupby(df_so.index.normalize())
                    .transform(lambda x: x.rolling(target).sum().shift().eq(target))
               )

Output：

                    val    out
2018-01-01 00:00:00   y  False
2018-01-01 08:00:00   y  False
2018-01-01 16:00:00   y   True
2018-01-02 00:00:00   n  False
2018-01-02 08:00:00   y  False
2018-01-02 16:00:00   y  False
2018-01-03 00:00:00   y  False
2018-01-03 08:00:00   y  False
2018-01-03 16:00:00   n   True
2018-01-04 00:00:00   n  False
2018-01-04 08:00:00   y  False
2018-01-04 16:00:00   y  False
2018-01-05 00:00:00   n  False

如果連續值相同，則分組顯示 True

問題描述

1 個解決方案

解決方案1
3 已采納 2022-09-13 16:13:27

如果連續值相同，則分組顯示 True

問題描述

1 個解決方案

解決方案1 3 已采納 2022-09-13 16:13:27

解決方案1
3 已采納 2022-09-13 16:13:27