如何drop_duplicates

Question

我有原始數據，如下例。 在時刻t1，變量的值為x1，並且僅當其值不等於x1時，才應在時刻t2記錄該變量。 有一種方法可以將python中數據框中的值與先前的值進行比較，如果相同，則將其刪除。 我嘗試了關注功能，但不起作用。請提供幫助。

df
time                 Variable   Value
2014-07-11 19:50:20  Var1       10
2014-07-11 19:50:30  Var1       20
2014-07-11 19:50:40  Var1       20
2014-07-11 19:50:50  Var1       30
2014-07-11 19:50:60  Var1       20 
2014-07-11 19:50:70  Var2       50
2014-07-11 19:50:80  Var2       60
2014-07-11 19:50:90  Var2       70

編碼：

for y in df.time:
    for x in df.Value:
        if y == y:
            if x == x:
                df1 = df.drop_duplicates(subset = ['time', 'Variable', 'Value'], keep=False) 
            else:
                df1 = df.drop_duplicates(['time', 'Variable', 'Value'])

預期產量：

df
time                 Variable   Value
2014-07-11 19:50:20  Var1       10
2014-07-11 19:50:30  Var1       20
2014-07-11 19:50:50  Var1       30
2014-07-11 19:50:60  Var1       20 
2014-07-11 19:50:70  Var2       50
2014-07-11 19:50:80  Var2       60
2014-07-11 19:50:90  Var2       70

Answer 1

df.drop_duplicates(subset=['Variable','Value'],keep='first')
#                time Variable  Value
#2014-07-11  19:50:20     Var1     10
#2014-07-11  19:50:30     Var1     20
#2014-07-11  19:50:50     Var2     30
#2014-07-11  19:50:60     Var2     40
#2014-07-11  19:50:70     Var2     50

如何drop_duplicates

問題描述

1 個解決方案

解決方案1
1 已采納 2017-06-07 21:39:46

如何drop_duplicates

問題描述

1 個解決方案

解決方案1 1 已采納 2017-06-07 21:39:46

解決方案1
1 已采納 2017-06-07 21:39:46