從R中的data.frame中刪除每個間隔的重復行

Question

我需要幫助刪除data.frame的相同間隔值中的所有重復行。

例如，我有一個data.frame，如：

Time                X   Y   Z
01/01/2011 00:00    101 200 302
01/01/2011 00:05    101 200 302
01/01/2011 00:10    101 200 302
01/01/2011 00:20    100 200 303
01/01/2011 00:25    100 200 303
01/01/2011 00:30    100 200 303
01/01/2011 00:35    101 200 302
01/01/2011 00:40    100 200 303
01/01/2011 00:45    100 200 303

刪除重復的行值（x，y，z）后，我將得到如下結果：

Time                X   Y   Z
01/01/2011 00:00    101 200 302
01/01/2011 00:20    100 200 303
01/01/2011 00:35    101 200 302
01/01/2011 00:40    100 200 303

我嘗試過：獨特或重復的功能，但它們給出了不同的結果。

ex / eliminate <- data[!duplicated(data[,c("X","Y","Z")]),]

此代碼只刪除所有data.frame中的所有重復值。

有人可以幫我找到解決方案嗎？

先謝謝，此致，

Yougyz

Answer 1

可能不是最優雅的方式：

data  <- within(data, C <- paste(X, Y, Z, sep = ""))
rl <- rle(data$C)$lengths
data <- data[c(1, cumsum(rl)[-length(rl)] + 1), 1:(ncol(data)-1)]

Answer 2

以下代碼使您感興趣的三列成為單個向量。 然后，我只測試向量之間的相等性，它的偏移量為1.當這是假的時，你已經轉換到一個新的XYZ項目。

n <- nrow(ss)
xyz <- with(ss, paste0(X, Y, Z))
sel <- xyz[1:(n-1)] !=  xyz[2:n]
ss[c(TRUE,sel),] #the first one would always be true

這比朱利葉斯回答快約3倍。 隨着數據集的增長，優勢應該會變得更大。

從R中的data.frame中刪除每個間隔的重復行

問題描述

2 個解決方案

解決方案1
2 2012-06-20 10:10:35

解決方案2
2 已采納 2012-06-20 10:25:38

從R中的data.frame中刪除每個間隔的重復行

問題描述

2 個解決方案

解決方案1 2 2012-06-20 10:10:35

解決方案2 2 已采納 2012-06-20 10:25:38

解決方案1
2 2012-06-20 10:10:35

解決方案2
2 已采納 2012-06-20 10:25:38