如何根據上面的行的值添加新列

Question

我有一個數據幀如下。 起初，他們有三列（'日期'，'時間'，'標志'）。 我想添加一個基於標志和日期的列，這意味着當我得到flag = 1時，那么當天的剩余時間目標是1，否則目標是零。

  date        time      flag  target
0 2017/4/10   10:00:00  0     0
1 2017/4/10   11:00:00  1     1
2 2017/4/10   12:00:00  0     1
3 2017/4/10   13:00:00  0     1
4 2017/4/10   14:00:00  0     1
5 2017/4/11   10:00:00  1     1
6 2017/4/11   11:00:00  0     1
7 2017/4/11   12:00:00  1     1
8 2017/4/11   13:00:00  1     1
9 2017/4/11   14:00:00  0     1
10 2017/4/12  10:00:00  0     0
11 2017/4/12  11:00:00  0     0
12 2017/4/12  12:00:00  0     0
13 2017/4/12  13:00:00  0     0
14 2017/4/12  14:00:00  0     0
15 2017/4/13  10:00:00  0     0
16 2017/4/13  11:00:00  1     1
17 2017/4/13  12:00:00  0     1
18 2017/4/13  13:00:00  1     1
19 2017/4/13  14:00:00  0     1

Answer 1

使用DataFrameGroupBy.cumsum作為累積和flag值，與0和最后一次轉換掩碼比較為integer ：

df['new'] = (df.groupby('date')['flag'].cumsum() > 0).astype(int)
print (df)
         date      time  flag  target  new
0   2017/4/10  10:00:00     0       0    0
1   2017/4/10  11:00:00     1       1    1
2   2017/4/10  12:00:00     0       1    1
3   2017/4/10  13:00:00     0       1    1
4   2017/4/10  14:00:00     0       1    1
5   2017/4/11  10:00:00     1       1    1
6   2017/4/11  11:00:00     0       1    1
7   2017/4/11  12:00:00     1       1    1
8   2017/4/11  13:00:00     1       1    1
9   2017/4/11  14:00:00     0       1    1
10  2017/4/12  10:00:00     0       0    0
11  2017/4/12  11:00:00     0       0    0
12  2017/4/12  12:00:00     0       0    0
13  2017/4/12  13:00:00     0       0    0
14  2017/4/12  14:00:00     0       0    0
15  2017/4/13  10:00:00     0       0    0
16  2017/4/13  11:00:00     1       1    1
17  2017/4/13  12:00:00     0       1    1
18  2017/4/13  13:00:00     1       1    1
19  2017/4/13  14:00:00     0       1    1

Answer 2

好吧，我知道我們已經在這里找到了一個解決方案，但只是為了滿足我的書呆子，這里是一個答案（不是優雅，因為它有多長時間）避免那個嘮叨的第一排缺陷

pd.merge(df, (df.groupby('date')['flag'].any().astype(int)).to_frame().T.transpose().reset_index(), left_on='date', right_on='date')

方法與@jezrael保持一致 - groupby函數在這里是關鍵。 而不是使用導致第一排缺陷的cumsum， any()似乎非常適合這個解決方案。 唯一的缺點是它產生了一個系列，然后我們需要強制回到數據幀並進行轉置，然后通過日期鍵將它們連接在一起。

如何根據上面的行的值添加新列

問題描述

2 個解決方案

解決方案1
3 已采納 2019-01-10 09:30:00

解決方案2
0 2019-01-11 13:37:56

如何根據上面的行的值添加新列

問題描述

2 個解決方案

解決方案1 3 已采納 2019-01-10 09:30:00

解決方案2 0 2019-01-11 13:37:56

解決方案1
3 已采納 2019-01-10 09:30:00

解決方案2
0 2019-01-11 13:37:56