根據列值重復數據框的行

Question

我有一個像這樣的數據框：

df1 = pd.DataFrame({'a': [1,2],
                    'b': [3,4],
                    'c': [6,5]})
  df1
Out[150]: 
   a  b  c
0  1  3  6
1  2  4  5

現在，我想創建一個基於col b和c加1的差重復每行的df。所以第一行的b和c之間的差是6-3 =3。我想將該行重復3 + 1 = 4次。 同樣，對於第二行，差異為5-4 = 1，因此我想將其重復1 + 1 = 2次。 將列d添加為從min（b）到b與c之間的差異（即6-3 = 3）。因此它從3-> 6變為。 所以我想得到這個df：

  a  b  c d
0 1  3  6 3
0 1  3  6 4
0 1  3  6 5
0 1  3  6 6
1 2  4  5 4
1 2  4  5 5

Answer 1

使用reindex + repeat ，然后使用groupby cumcount分配新值d

df1.reindex(df1.index.repeat(df1.eval('c-b').add(1))).\
      assign(d=lambda x : x.c-x.groupby('a').cumcount(ascending=False))
Out[572]: 
   a  b  c  d
0  1  3  6  3
0  1  3  6  4
0  1  3  6  5
0  1  3  6  6
1  2  4  5  4
1  2  4  5  5

根據列值重復數據框的行

問題描述

1 個解決方案

解決方案1
1 已采納 2018-10-17 17:57:46

根據列值重復數據框的行

問題描述

1 個解決方案

解決方案1 1 已采納 2018-10-17 17:57:46

解決方案1
1 已采納 2018-10-17 17:57:46